基于配置文件自动生成符合概率分布的数据的方法及系统技术方案

技术编号:37524542 阅读:23 留言:0更新日期:2023-05-12 15:48
本申请提供了一种基于配置文件自动生成符合概率分布的数据的方法及系统。基于配置文件自动生成符合概率分布的数据的方法包括:步骤S1:配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;步骤S2:配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;步骤S3:解析第一配置文件和第二配置文件中的配置信息;步骤S4:按照第一配置文件和第二配置文件自动生成指定数量的有状态数据和无状态数据。本申请在大数据营销领域中首次实现通过简单配置即可实现自动生成大量符合概率要求的有状态数据和无状态数据。据和无状态数据。据和无状态数据。

【技术实现步骤摘要】
基于配置文件自动生成符合概率分布的数据的方法及系统


[0001]本专利技术涉及大数据营销
,尤其涉及需要大量符合概率分布的数据生成。

技术介绍

[0002]在大数据营销领域中,档案、用户、用户事件、业务单据等数据的存储和使用是不可缺少的基础环节,因此在开发过程中,无论是系统的演示还是进行压测,大量符合概率分布以及符合物理世界业务逻辑的数据都是必不可少的。因为无法使用真实业务产生数据,因此需要有模拟真实物理世界业务逻辑,产生符合要求的数据的方法。
[0003]在大数据营销领域中,目前生成数据的方法只能生成静态数据或者完全随机的数据。即使有些方法具备通过配置动态生成无状态数据字段,但是如何通过配置自动生成有状态数据,至今还没有简单有效的解决方案。

技术实现思路

[0004]为了克服上述技术缺陷,本专利技术的目的在于提供一种基于配置文件自动生成符合概率分布的数据的方法,其包括:
[0005]步骤S1:配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;
[0006]步骤S2:配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;
[0007]步骤S3:解析第一配置文件和第二配置文件中的配置信息;
[0008]步骤S4:按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。r/>[0009]值得注意的是,本申请中的配置、解析和生成方法采用本领域的常规技术手段即可实现,本申请不做特别限定。
[0010]进一步地,第一配置文件和第二配置文件分别由一个或多个配置表构成。
[0011]进一步地,所述方法应用于大数据营销领域。
[0012]进一步地,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
[0013]进一步地,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。
[0014]本申请的第二个方面提供一种基于配置文件自动生成符合概率分布的数据的系统,其包括:
[0015]配置模块,所述配置模块用于配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;还用于配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;
[0016]解析模块,所述解析模块用于解析第一配置文件和第二配置文件中的配置信息;
[0017]生成模块,所述生成模块用于按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。
[0018]进一步地,第一配置文件和第二配置文件分别由一个或多个配置表构成。
[0019]进一步地,所述系统应用于大数据营销领域。
[0020]进一步地,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
[0021]进一步地,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。
[0022]采用了上述技术方案后,与现有技术相比,具有以下有益效果:
[0023]本申请在大数据营销领域中首次实现通过简单配置即可实现自动生成大量符合概率要求的有状态数据和无状态数据,从而应用于大数据营销领域中的各种需要大量使用模拟数据的场景中。
附图说明
[0024]图1为基于配置文件自动生成符合概率分布的数据的系统的模块图;
[0025]图2为基于配置文件自动生成符合概率分布的数据的方法的流程图;
[0026]图3为客户小程序事件的状态机跳转图。
具体实施方式
[0027]以下结合附图与具体实施例进一步阐述本专利技术的优点。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本专利技术的保护范围。
[0028]如图1所示,本实施例提供一种应用于大数据营销领域的基于配置文件自动生成符合概率分布的数据的系统,其包括配置模块、解析模块和生成模块。
[0029]所述配置模块用于配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;还用于配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则。所述解析模块用于解析第一配置文件和第二配置文件中的配置信息。所述生成模块用于按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。
[0030]本实施例中的需要生成的无状态数据为业务场景中的业务对象,例如客户和商品;本实施例中的需要生成的有状态数据为业务场景中的业务事件,比如客户浏览小程序并下单的事件。如图2所示,采用上述系统自动生成符合概率分布的客户、商品、客户浏览小程序并下单的数据,具体包括以下步骤S1

S4。值得注意的是,步骤S1

S4中的配置方法、解析方法和生成方法的具体执行步骤采用本领域的常规技术手段即可实现,本申请不做特别限定。
[0031]步骤S1:通过配置模块配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重。
[0032]本实施例中的第一配置文件由多个配置表(表1

表4)构成。
[0033]通过采用本领域的合适的常规配置方法,可以先配置客户和商品的属性及属性生成规则,如下表1所示:
[0034]表1客户的字段及对应规则配置信息
[0035][0036][0037]配置规则集,如表2所示:
[0038]表2客户规则的配置
[0039][0040][0041][0042]如表3所示,配置商品的字段和规则信息:
[0043]表3商品的字段及对应规则配置信息
[0044]顺序节点名称规则规则顺序1yearyear02seasonseason03birthbirth04campaigncampaign05brandbrand06seriesseries07typetype08namename09priceprice0
[0045]如表4所示,配置商品规则:
[0046]表4商品规则配置
[0047][0048][0049][0050]步骤S2:通过配置模块配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则。
[0051]第二配置文件由多个配置表(表5

表7)构成。需要生成的有状态数据(例如客户小程序事件)的状态机跳转规则如图3所示。...

【技术保护点】

【技术特征摘要】
1.一种基于配置文件自动生成符合概率分布的数据的方法,其特征在于,包括:步骤S1:配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;步骤S2:配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;步骤S3:解析第一配置文件和第二配置文件中的配置信息;步骤S4:按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。2.如权利要求1所述的自动生成符合概率分布的数据的方法,其特征在于,第一配置文件和第二配置文件分别由一个或多个配置表构成。3.如权利要求1所述的自动生成符合概率分布的数据的方法,其特征在于,所述方法应用于大数据营销领域。4.如权利要求3所述的自动生成符合概率分布的数据的方法,其特征在于,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。5.如权利要求4所述的自动生成符合概率分布的数据的方法,其特征在于,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。6.一种基于配置文件自动生成符...

【专利技术属性】
技术研发人员:张晶马丹程龙胡卿陈龙
申请(专利权)人:上海欣兆阳信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1