特征处理方法技术

技术编号:39721256 阅读:28 留言:0更新日期:2023-12-17 23:27
本公开提供了一种特征处理方法

【技术实现步骤摘要】
特征处理方法、装置和存储介质


[0001]本公开涉及大数据处理领域,尤其涉及一种特征处理方法

装置和存储介质


技术介绍

[0002]在社交软件中,用户平时以帖子

评论

群聊

群组等方式每日分享着自己的日常,与志同道合的人分享着快乐

随着互联网的兴起,站内也不乏有危害行为,会以语音

视频

文字

图片等多媒体类型输入对站内的用户造成打扰甚至伤害

[0003]风控团队保护站内用户权益,从用户注册

登录后在站内的活动全链路进行保护,借助于大数据技术和
AI(Artificial Intelligence
,人工智能
)
模型辅以易用性高的平台进行精准打击

[0004]在智能风控的解决方案中,策略是运营的核心解决方案,而特征又是策略的基础核心,不可或缺

相关技术中,特征提出者之间彼此不清楚有哪些特征,存量特征无查询平台,只能重新开发,由于特征不共享,造成重复成本高


技术实现思路

[0005]本公开要解决的一个技术问题是,提供一种特征处理方法

装置和存储介质,能够减少因特征不共享导致重复开发的问题

[0006]根据本公开一方面,提出一种特征处理方法,包括:按照第一预定规则对源事件流进行处理,得到风控事件流;对风控事件流进行特征计算,得到风控事件流对应的多个特征;将多个特征中的每个特征以键值对的方式进行存储;对存储的每个特征的键值进行特征配置,其中,每个特征的键按照第二预定规则设置;以及响应于查询请求,根据特征配置查询对应的特征,并将查询的特征的特征值反馈给业务模块

[0007]在一些实施例中,接收到查询请求后,根据业务需求,对查询的特征基于功能函数进行二次计算,并将二次计算后的特征值反馈给业务模块

[0008]在一些实施例中,对风控事件流进行特征计算包括:根据风控事件流中每个子事件流的大小,对每个子事件流进行分片,并设置预定数量的
CPU
和线程对每个子事件进行特征计算

[0009]在一些实施例中,对存储的每个特征的键值进行特征配置包括:对每个特征录入全局
ID、
所属特征源

特征配置信息,以及特征名称

特征维度

特征标签

值类型

存储时间

特征类型

和特征说明中的一项或多项

[0010]在一些实施例中,进行特征源配置,其中,特征源配置信息与存储地址对应,其中,响应于查询请求,根据特征配置查询对应的特征,并将查询的特征反馈给业务模块包括根据查询请求中的全局
ID
,查找对应的特征源;根据特征源确定存储地址;利用特征配置信息在存储地址查询对应的特征;以及根据特征名称

特征维度

特征标签

值类型

存储时间

特征类型

和特征说明中的一项或多项对查询的特征进行处理,并将处理后的特征值对象反馈给业务模块

[0011]在一些实施例中,对特征进行生命周期管理,其中,生命周期包括草稿状态

预上线状态

已上线状态和已下线状态

[0012]在一些实施例中,特征类型包括登录信息

用户画像

风险信息

注册数据

行为数据

处置记录

设备信息中的至少两种

[0013]根据本公开的另一方面,还提出一种特征处理装置,包括:事件流处理模块,被配置为按照第一预定规则对源事件流进行处理,得到风控事件流;特征计算模块,被配置为对风控事件流进行特征计算,得到风控事件流对应的多个特征;特征存储模块,被配置为将多个特征中的每个特征以键值对的方式进行存储;特征配置模块,被配置为对存储的每个特征的键值进行特征配置,其中,每个特征的键按照第二预定规则设置;以及查询响应模块,被配置为响应于查询请求,根据特征配置查询对应的特征,并将查询的特征的特征值反馈给业务模块

[0014]根据本公开的另一方面,还提出一种特征处理装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的特征处理方法

[0015]根据本公开的另一方面,还提出一种非瞬时性计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现如上述的特征处理方法

[0016]本公开实施例中,对源数据进行重新定义生成符合风控的事件流,将计算的特征以
key

value
的形式进行存储,并规范化特征的
key
,及进行特征配置,使得特征共享,在查询特征时,特征提出者能够清楚已存储的特征,减少重复开发的成本,提高后续特征处理效率

[0017]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚

附图说明
[0018]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理

[0019]参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0020]图1为本公开的特征处理方法的一些实施例的流程示意图;
[0021]图2为本公开的特征处理方法的另一些实施例的流程示意图;
[0022]图3为本公开的特征处理方法的另一些实施例的流程示意图;
[0023]图4为本公开的生命周期管理的一些实施例的示意图;
[0024]图5为本公开的特征处理装置的一些实施例的结构示意图;以及
[0025]图6为本公开的特征处理装置的另一些实施例的结构示意图

具体实施方式
[0026]现在将参照附图来详细描述本公开的各种示例性实施例

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置

数字表达式和数值不限制本公开的范围

[0027]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的

[0028]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制

[0029]对于相关领域普通技术人员已知的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种特征处理方法,包括:按照第一预定规则对源事件流进行处理,得到风控事件流;对所述风控事件流进行特征计算,得到所述风控事件流对应的多个特征;将所述多个特征中的每个特征以键值对的方式进行存储;对存储的所述每个特征的键值进行特征配置,其中,所述每个特征的键按照第二预定规则设置;以及响应于查询请求,根据特征配置查询对应的特征,并将所述查询的特征的特征值反馈给业务模块
。2.
根据权利要求1所述的特征处理方法,还包括:接收到所述查询请求后,根据业务需求,对所述查询的特征基于功能函数进行二次计算,并将二次计算后的特征值反馈给所述业务模块
。3.
根据权利要求1所述的特征处理方法,其中,对所述风控事件流进行特征计算包括:根据所述风控事件流中每个子事件流的大小,对所述每个子事件流进行分片,并设置预定数量的
CPU
和线程对所述每个子事件进行特征计算
。4.
根据权利要求1至3任一所述的特征处理方法,其中,对存储的所述每个特征的键值进行特征配置包括:对所述每个特征录入全局
ID、
所属特征源

特征配置信息,以及特征名称

特征维度

特征标签

值类型

存储时间

特征类型

和特征说明中的一项或多项
。5.
根据权利要求4所述的特征处理方法,还包括:进行特征源配置,其中,特征源配置信息与存储地址对应,其中,响应于查询请求,根据特征配置查询对应的特征,并将所述查询的特征反馈给所述业务模块包括:根据所述查询请求中的全局
ID
,查找对应的特征源;根据所述特征源确定存储地址;利用所述特征配置信息在所述存储地址查询对应的特征;以及根据所述特征名称

...

【专利技术属性】
技术研发人员:金鹏佳马元鹏陈彪张璐陶明
申请(专利权)人:上海任意门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1