【技术实现步骤摘要】
数据识别方法、装置、设备、介质和产品
[0001]本申请涉及云
,尤其涉及一种数据识别方法、装置、设备、介质和产品。
技术介绍
[0002]数字资源在被流量主推送之后,其他用户可以对数字资源进行相应的触发,例如点击并查看数字资源的触发,或者关闭用于查看数字资源的详情页的触发,等等。数字资源可以由流量主推送,例如由应用平台或者网站等进行推送,而用户对流量主推送的数字资源进行触发之后,该数字资源的热度也会相应增加,流量主可以根据推送的数字资源的热度从数字资源的提供商处获得相应的收益。
[0003]但是,在一些情况下,针对数字资源的触发可能不是由真实的用户来触发的,而是由恶意团伙通过相应的恶意脚本来批次量的触发的,这会导致数字资源的热度会异常的飙高,进而导致数字资源的提供商利益受损。
[0004]目前,一般是通过数字资源的点击量或者点击率来判断对数字资源的触发是否属于异常的触发,但是通过该种方式所获得的判断结果通常并不准确,因此,如何准确地判断对数字资源的触发是否异常成为一个亟待解决的问题。
技术实现思路
[0005]本申请实施例提供一种数据识别方法、装置、设备、介质和产品,可以提高对对象针对数字资源触发的状态变化是否异常的识别准确性。
[0006]第一方面,本申请提供一种数据识别方法,包括:
[0007]获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;
[0008]将该多个第一对象针对该第一数字资源的触发时长中相同的触发时长进 ...
【技术保护点】
【技术特征摘要】
1.一种数据识别方法,其特征在于,所述方法包括:获取多个第一对象分别将第一数字资源由第一状态触发且变化至第二状态所消耗的触发时长;将所述多个第一对象针对所述第一数字资源的触发时长中相同的触发时长进行聚类处理,得到多个触发时长组;基于每个触发时长组包含的触发时长的数量,生成评估概率分布;所述评估概率分布用于对所述多个第一对象对所述第一数字资源触发的状态变化进行评估;获取基准概率分布,并基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果;其中,所述基准概率分布是基准的用于对所述多个第一对象对所述第一数字资源触发的状态变化进行评估的概率分布,所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是正常的或是异常的。2.根据权利要求1所述的方法,其特征在于,所述第一数字资源是由第二对象在第一时段内推送的;所述获取基准概率分布,包括:获取多个第一对象分别将第二数字资源由所述第一状态触发且变化至所述第二状态所消耗的触发时长;所述第二数字资源是由所述第二对象在第二时段内推送的数字资源,所述第二时段是在所述第一时段之前的历史时段;将所述多个第一对象针对所述第二数字资源的触发时长中相同的触发时长进行聚类处理,得到多个基准触发时长组;基于每个基准触发时长组包含的触发时长的数量,生成所述基准概率分布。3.根据权利要求1所述的方法,其特征在于,所述第一状态和所述第二状态均有N种,N为正整数,一个第一对象将所述第一数字资源由一种第一状态触发且变化至一种第二状态后产生一个触发时长;其中,N种第一状态包括如下至少一种:所述第一数字资源处于曝光状态,所述第一数字资源处于选中状态,或者,所述第一数字资源处于所属落地页被打开的状态;N种第二状态包括如下至少一种:所述第一数字资源处于选中状态,所述第一数字资源处于所属落地页被打开的状态,或者,所述第一数字资源处于所属落地页被打开后关闭的状态;其中,若一种第一状态为所述第一数字资源处于曝光状态,则该种第一状态对应的第二状态为所述第一数字资源处于选中状态;若一种第一状态为所述第一数字资源处于选中状态,则该种第一状态对应的第二状态为所述第一数字资源处于所属落地页被打开的状态;若一种第一状态为所述第一数字资源处于所属落地页被打开的状态,则该种第一状态对应的第二状态为所述第一数字资源处于所属落地页被打开后关闭的状态。4.根据权利要求3所述的方法,其特征在于,一种第一状态和对应的一种第二状态具有一个评估概率分布及该评估概率分布对应的一个基准概率分布,N种第一状态和N种第二状态具有N个评估概率分布及所述N个评估概率分布分别对应的基准概率分布;所述基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果,包括:
获取每个评估概率分布分别与对应的基准概率分布之间的相似度;对所述N个评估概率分布与对应N个基准概率分布之间的N个相似度进行加和,得到所述N个评估概率分布与N个基准概率分布之间的综合相似度;若所述综合相似度小于或等于第一相似度阈值,则确定所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是异常的;若所述综合相似度大于或等于第二相似度阈值,则确定所述触发结果用于指示所述多个第一对象对所述第一数字资源触发的状态变化是正常的;其中,所述第一相似度阈值小于所述第二相似度阈值。5.根据权利要求4所述的方法,其特征在于,所述对所述N个评估概率分布与对应N个基准概率分布之间的N个相似度进行加和,得到所述N个评估概率分布与N个基准概率分布之间的综合相似度,包括:获取N个相似度分别对应的评估权重;所述N个相似度中的任一相似度的评估权重是指所述多个第一对象将所述第一数字资源由所述N种第一状态触发且变化至对应的N种第二状态的总次数;基于所述N个相似度的评估权重对所述N个相似度进行加权,得到N个加权后的相似度;对所述N个加权后的相似度进行加和,得到所述综合相似度。6.根据权利要求1所述的方法,其特征在于,所述第一数字资源是由第二对象推送的数字资源;所述基于所述评估概率分布与所述基准概率分布之间的差异,识别所述多个第一对象针对所述第一数字资源的触发结果,包括:若所述评估概率分布与所述基准概率分布之...
【专利技术属性】
技术研发人员:张李均焕,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。