数据识别方法、装置、设备、介质和产品制造方法及图纸

技术编号:39275551 阅读:11 留言:0更新日期:2023-11-07 10:52
本申请实施例公开了一种数据识别方法、装置、设备、介质和产品,涉及云技术,其中,方法包括:获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;将该多个第一对象针对该第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;基于每个触发时长组包含的触发时长的数量,生成评估概率分布;该评估概率分布用于对该多个第一对象对该第一数字资源触发的状态变化进行评估;获取基准概率分布,并基于该评估概率分布与该基准概率分布之间的差异,识别该多个第一对象针对该第一数字资源的触发结果。采用本申请实施例,可以提高对对象针对数字资源触发的状态变化是否异常的识别准确性。别准确性。别准确性。

【技术实现步骤摘要】
数据识别方法、装置、设备、介质和产品


[0001]本申请涉及云
,尤其涉及一种数据识别方法、装置、设备、介质和产品。

技术介绍

[0002]数字资源在被流量主推送之后,其他用户可以对数字资源进行相应的触发,例如点击并查看数字资源的触发,或者关闭用于查看数字资源的详情页的触发,等等。数字资源可以由流量主推送,例如由应用平台或者网站等进行推送,而用户对流量主推送的数字资源进行触发之后,该数字资源的热度也会相应增加,流量主可以根据推送的数字资源的热度从数字资源的提供商处获得相应的收益。
[0003]但是,在一些情况下,针对数字资源的触发可能不是由真实的用户来触发的,而是由恶意团伙通过相应的恶意脚本来批次量的触发的,这会导致数字资源的热度会异常的飙高,进而导致数字资源的提供商利益受损。
[0004]目前,一般是通过数字资源的点击量或者点击率来判断对数字资源的触发是否属于异常的触发,但是通过该种方式所获得的判断结果通常并不准确,因此,如何准确地判断对数字资源的触发是否异常成为一个亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种数据识别方法、装置、设备、介质和产品,可以提高对对象针对数字资源触发的状态变化是否异常的识别准确性。
[0006]第一方面,本申请提供一种数据识别方法,包括:
[0007]获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;
[0008]将该多个第一对象针对该第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;
[0009]基于每个触发时长组包含的触发时长的数量,生成评估概率分布;该评估概率分布用于对该多个第一对象对该第一数字资源触发的状态变化进行评估;
[0010]获取基准概率分布,并基于该评估概率分布与该基准概率分布之间的差异,识别该多个第一对象针对该第一数字资源的触发结果;
[0011]其中,该基准概率分布是基准的用于对该多个第一对象对该第一数字资源触发的状态变化进行评估的概率分布,该触发结果用于指示该多个第一对象对该第一数字资源触发的状态变化是正常的或是异常的。
[0012]第二方面,本申请提供一种数据识别装置,包括:
[0013]数据获取单元,用于获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;
[0014]数据聚类单元,用于将该多个第一对象针对该第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;
[0015]概率获取单元,用于基于每个触发时长组包含的触发时长的数量,生成评估概率分布;该评估概率分布用于对该多个第一对象对该第一数字资源触发的状态变化进行评估;
[0016]数据识别单元,用于获取基准概率分布,并基于该评估概率分布与该基准概率分布之间的差异,识别该多个第一对象针对该第一数字资源的触发结果;
[0017]其中,该基准概率分布是基准的用于对该多个第一对象对该第一数字资源触发的状态变化进行评估的概率分布,该触发结果用于指示该多个第一对象对该第一数字资源触发的状态变化是正常的或是异常的。
[0018]第三方面,本申请提供了一种计算机设备,包括处理器、存储器,其中,该存储器用于存储计算机程序,该计算机程序包括程序指令,该处理器被配置用于调用该程序指令,执行上述数据识别方法。
[0019]第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述数据识别方法。
[0020]第五方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令被处理器执行时可实现上述数据识别方法。
[0021]本申请实施例中,获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;将多个第一对象针对第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;基于每个触发时长组包含的触发时长的数量,生成评估概率分布;获取基准概率分布,并基于评估概率分布与基准概率分布之间的差异,识别多个第一对象针对第一数字资源的触发结果。由于评估概率分布可以表示多个第一对象触发第一数字资源的实际消耗的触发时长,通过将该评估概率分布与基准概率分布进行比对,可以确定出评估概率分布与基准概率分布之间的差异,从而可以确定多个第一对象对第一数字资源触发的状态变化是否异常。通过比较由两种触发时长生成的概率分布之间的差异,相较于判断数字资源的点击量和点击量而言,异常识别准确性更高,因此可以提高对对象针对数字资源触发的状态变化是否异常的识别准确性。并且,在获取到多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长时,可以自动生成对应的评估概率分布,进而自动基于评估概率分布和基准概率分布之间的差异识别针对数字资源触发的状态变化是否异常,可以节省成本,提升数据识别效率。
附图说明
[0022]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本申请实施例提供的一种数据识别系统的网络架构示意图;
[0024]图2是本申请实施例提供的一种数据识别方法的流程示意图;
[0025]图3是本申请实施例提供的一种数字资源所属的落地页从打开到关闭之间的触发时长分布的示意图;
[0026]图4是本申请实施例提供的另一种数据识别方法的流程示意图;
[0027]图5是本申请实施例提供的一种完全子图的组成结构示意图;
[0028]图6是本申请实施例提供的一种划分社区的示意图;
[0029]图7是本申请实施例提供的一种社区的组成结构示意图;
[0030]图8是本申请实施例提供的一种多个社区的组成结构的示意图;
[0031]图9是本申请实施例提供的一种数据识别装置的组成结构示意图;
[0032]图10是本申请实施例提供的一种计算机设备的组成结构示意图。
具体实施方式
[0033]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0034]云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据识别方法,其特征在于,所述方法包括:获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;将所述多个第一对象针对所述第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;基于每个触发时长组包含的触发时长的数量,生成评估概率分布;所述评估概率分布用于对所述多个第一对象对所述第一数字资源触发的状态变化进行评估;获取基准概率分布,并基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果;其中,所述基准概率分布是基准的用于对所述多个第一对象对所述第一数字资源触发的状态变化进行评估的概率分布,所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是正常的或是异常的。2.根据权利要求1所述的方法,其特征在于,所述第一数字资源是由第二对象在第一时段内推送的;所述获取基准概率分布,包括:获取多个第一对象分别将第二数字资源由所述第一状态触发且变化至所述第二状态所消耗的触发时长;所述第二数字资源是由所述第二对象在第二时段内推送的数字资源,所述第二时段是在所述第一时段之前的历史时段;将所述多个第一对象针对所述第二数字资源的触发时长中相同的触发时长进行聚类处理,得到多个基准触发时长组;基于每个基准触发时长组包含的触发时长的数量,生成所述基准概率分布。3.根据权利要求1所述的方法,其特征在于,所述第一状态和所述第二状态均有N种,N为正整数,一个第一对象将所述第一数字资源由一种第一状态触发且变化至一种第二状态后产生一个触发时长;其中,N种第一状态包括如下至少一种:所述第一数字资源处于曝光状态,所述第一数字资源处于选中状态,或者,所述第一数字资源处于所属落地页被打开的状态;N种第二状态包括如下至少一种:所述第一数字资源处于选中状态,所述第一数字资源处于所属落地页被打开的状态,或者,所述第一数字资源处于所属落地页被打开后关闭的状态;其中,若一种第一状态为所述第一数字资源处于曝光状态,则该种第一状态对应的第二状态为所述第一数字资源处于选中状态;若一种第一状态为所述第一数字资源处于选中状态,则该种第一状态对应的第二状态为所述第一数字资源处于所属落地页被打开的状态;若一种第一状态为所述第一数字资源处于所属落地页被打开的状态,则该种第一状态对应的第二状态为所述第一数字资源处于所属落地页被打开后关闭的状态。4.根据权利要求3所述的方法,其特征在于,一种第一状态和对应的一种第二状态具有一个评估概率分布及该评估概率分布对应的一个基准概率分布,N种第一状态和N种第二状态具有N个评估概率分布及所述N个评估概率分布分别对应的基准概率分布;所述基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果,包括:
获取每个评估概率分布分别与对应的基准概率分布之间的相似度;对所述N个评估概率分布与对应N个基准概率分布之间的N个相似度进行加和,得到所述N个评估概率分布与N个基准概率分布之间的综合相似度;若所述综合相似度小于或等于第一相似度阈值,则确定所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是异常的;若所述综合相似度大于或等于第二相似度阈值,则确定所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是正常的;其中,所述第一相似度阈值小于所述第二相似度阈值。5.根据权利要求4所述的方法,其特征在于,所述对所述N个评估概率分布与对应N个基准概率分布之间的N个相似度进行加和,得到所述N个评估概率分布与N个基准概率分布之间的综合相似度,包括:获取N个相似度分别对应的评估权重;所述N个相似度中的任一相似度的评估权重是指所述多个第一对象将所述第一数字资源由所述N种第一状态触发且变化至对应的N种第二状态的总次数;基于所述N个相似度的评估权重对所述N个相似度进行加权,得到N个加权后的相似度;对所述N个加权后的相似度进行加和,得到所述综合相似度。6.根据权利要求1所述的方法,其特征在于,所述第一数字资源是由第二对象推送的数字资源;所述基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果,包括:若所述评估概率分布与所述基准概率分布之...

【专利技术属性】
技术研发人员:张李均焕
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1