【技术实现步骤摘要】
一种基于大数据的通用模型动态积分预警方法
[0001]本专利技术涉及大数据处理
,具体地涉及一种基于大数据的通用模型动态积分预警方法。
技术介绍
[0002]目前传统的积分引擎基于少量历史数据、静态数据,无法动态满足实时数据流分析,无法动态业务性对积分进行影响,无法进行实时流式数据计算分值,大部分的传统积分引擎是批处理的离线方式进行积分计算,无法满足实时分值计算,动态调整分值。
[0003]随着大数据技术的发展,现有的传统积分模型都面临着海量数据的分析。如果单纯的依靠关系型数据库进行离线分析,在分析的过程中往往需要耗费大量的时间,分析过程中会存在数据异常,物理中断等情况,造成传统积分模型分析过程中线程中断,可靠性不高,数据分析的准确性不高,时效性不高。传统积分模型动态的去修改积分规则和积分对应的数据源,需要进行人为的代码编写,无法实时动态拖拽配置生成积分规则引擎,需要耗费大量的人力成本进行代码编写、测试、发布,耗时较久。传统积分模型无法直观的进行规则的展示,需要人为的整理积分模型规则,可辨度不高,理解难度较大,无法直观的展示积分模型规则。
技术实现思路
[0004]本专利技术旨在提供一种基于大数据的通用模型动态积分预警方法,以解决上述问题。为此,本专利技术采用的具体技术方案如下:
[0005]一种基于大数据的通用模型动态积分预警方法,其包括以下步骤:
[0006]S1.数据抽取,将不同数据库结构的源数据库同步至目标数据库clickhouse中;
[0007]S2. ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的通用模型动态积分预警方法,其特征在于,包括以下步骤:S1.数据抽取,将不同数据库结构的源数据库同步至目标数据库clickhouse中;S2.配置动态积分模型,具体过程为:S21.配置动态积分模型的数据源对应的表名称、对应的字段类型、字段详解和字段中文名称;S22.基于画布拖拽生成动态积分配置模型:基于画布拖拽选择主数据源结点,基于主数据源连接过滤算子,基于过滤算子连接n个数据源结点,依次基于第i个数据源n
i
连接对应的过滤算子节点s
i
,基于过滤算子节点s
i
连接对应的分值算子节点f
i
,基于分值算子节点f
i
连接聚合算子节点,最终聚合算子节点连接到输出算子节点,其中,i=1,2,
…
,n;S23.保存动态积分模型:将结点及结点对应的配置参数和各连接线关系保存在MongoDB数据库中;S3.下发动态积分模型:将动态积分模型的配置参数下发到生产者kafka分区中,实现分布式负载均衡算法;S4.基于动态积分模型,计算实时动态积分。2.如权利要求1所述的方法,其特征在于,步骤S1具体为:S11.构建源数据库连接的配置文件,包含用户名、密码、端口、ip和数据库名称;S12.构建目标数据库连接的配置文件,包含用户名、密码、端口、ip和数据库名称;S13.选择源数据库对应表结构与目标数据库表结构字段映射;S14.选择源数据库增量字段;S15.生成符合DataX规定的json格式,将源数据库同步至目标数据库clickhouse中。3.如权利要求1所述的方法,其特征在于,过滤算子支持关系包括:时间过滤、条件过滤和关联字段;分值算子支持关系包括:权重0到+∞、单维度爆表、全维度爆表、最大值和压缩正态分布;聚合算子支持关系包括:是否阻塞结点、聚合组和所有前结点与本聚合算子关联的字段映射。4.如权利要求1所述的方法,其特征在于,S23中的保持连接线关系具体为:保存数据源与数据过滤结点之间的关系顺序,保存数据过滤结点与下一个数据源之间的顺序关系,保存下一个数据源结点与数据过滤结点之间的关系,保存数据源结点与分值计算结点直接的关系,保存数据源与分值计算结点之间的关系,保存分值计算结点与数据聚合结点之间的关系以及保存数据聚合结点与表输出结点之间的关系。5.如权利要求1所述的方法,其特征在于,步骤S4具体为:获取动态积分模型的开始结点,也就是主数据源结点,从左到右的顺序依次执行对应的数据过滤算子、分值算...
【专利技术属性】
技术研发人员:刘远祥,左军,王仁斌,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。