数据搜索方法以及数据检测方法、装置、设备制造方法及图纸

技术编号:28297240 阅读:12 留言:0更新日期:2021-04-30 16:22
本发明专利技术实施例提供一种数据搜索方法以及数据检测方法、装置、设备,该数据检测方法包括:确定虚假交易条件对应的第一数量和第二数量,虚假交易条件为存在至少第一数量的用户共同购买至少第二数量的商品;生成与待检测交易数据对应的二分图;根据虚假交易条件对二分图进行剪枝处理,以从二分图中过滤掉不满足虚假交易条件的用户节点、商品节点以及边;根据经剪枝处理后的二分图确定待检测交易数据中存在的虚假交易数据。通过设定虚假交易条件,基于虚假交易条件对交易数据对应的二分图进行剪枝处理,可以减少二分图的规模,从而提高虚假交易数据的检测效率。

【技术实现步骤摘要】
数据搜索方法以及数据检测方法、装置、设备
本专利技术涉及互联网
,尤其涉及一种数据搜索方法以及数据检测方法、装置、设备。
技术介绍
随着互联网技术的发展,人们足不出户地便可通过网络获取自己所需的各种物品和信息。比如,很多在线购物平台(俗称电商平台)的出现,使得人们通过使用相应的购物类APP或通过Web访问的方式便可以在线地实现商品购买。在实际应用中,当用户搜索某种商品时,会呈现若干商家的商品供用户选择,而在搜索过程中,一般会对不同商家的不同商品进行排序处理,以根据排序结果进行商品展示。其中,一种常见的排序依据便是根据商品的交易量的大小进行排序。从而,实际应用中,某些商家为了使得自己的商品排位靠前,可能会构造虚假的交易数据。
技术实现思路
本专利技术实施例提供一种数据搜索方法以及数据检测方法、装置、设备,用以准确地检测出异常操作数据。第一方面,本专利技术实施例提供一种数据检测方法,该方法包括:确定虚假交易条件对应的第一数量和第二数量,所述虚假交易条件为存在至少所述第一数量的用户共同购买至少所述第二数量的商品;生成与待检测交易数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测交易数据中的多个用户,所述第一二分图的商品节点集合对应于所述待检测交易数据中的多个商品,所述第一二分图的边集合对应于所述多个用户对所述多个商品的交易行为;根据所述虚假交易条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述虚假交易条件的用户节点、商品节点以及边;根据经剪枝处理后的第一二分图确定所述待检测交易数据中存在的虚假交易数据。第二方面,本专利技术实施例提供一种数据检测装置,该装置包括:条件确定模块,用于确定虚假交易条件对应的第一数量和第二数量,所述虚假交易条件为存在至少所述第一数量的用户共同购买至少所述第二数量的商品;二分图生成模块,用于生成与待检测交易数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测交易数据中的多个用户,所述第一二分图的商品节点集合对应于所述待检测交易数据中的多个商品,所述第一二分图的边集合对应于所述多个用户对所述多个商品的交易行为;二分图剪枝模块,用于根据所述虚假交易条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述虚假交易条件的用户节点、商品节点以及边;虚假确定模块,用于根据经剪枝处理后的第一二分图确定所述待检测交易数据中存在的虚假交易数据。第三方面,本专利技术实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第一方面中的数据检测方法。本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现第一方面中的数据检测方法。第四方面,本专利技术实施例提供一种数据搜索方法,该方法包括:响应于数据搜索请求,获取与所述数据搜索请求对应的多个商品;获取与所述多个商品对应的交易数据;确定虚假交易条件对应的第一数量和第二数量,所述虚假交易条件为存在至少所述第一数量的用户共同购买至少所述第二数量的商品;生成与所述交易数据对应的二分图,所述二分图的用户节点集合对应于所述交易数据中的多个用户,所述二分图的商品节点集合对应于所述多个商品,所述二分图的边集合对应于所述多个用户对所述多个商品的交易行为;根据所述虚假交易条件对所述二分图进行剪枝处理,以从所述二分图中过滤掉不满足所述虚假交易条件的用户节点、商品节点以及边;根据被过滤掉的用户节点、商品节点以及边,对所述多个商品进行排序。第五方面,本专利技术实施例提供一种数据搜索装置,该装置包括:获取模块,用于响应于数据搜索请求,获取与所述数据搜索请求对应的多个商品;获取与所述多个商品对应的交易数据;确定模块,用于确定虚假交易条件对应的第一数量和第二数量,所述虚假交易条件为存在至少所述第一数量的用户共同购买至少所述第二数量的商品;生成模块,用于生成与所述交易数据对应的二分图,所述二分图的用户节点集合对应于所述交易数据中的多个用户,所述二分图的商品节点集合对应于所述多个商品,所述二分图的边集合对应于所述多个用户对所述多个商品的交易行为;剪枝模块,用于根据所述虚假交易条件对所述二分图进行剪枝处理,以从所述二分图中过滤掉不满足所述虚假交易条件的用户节点、商品节点以及边;排序模块,用于根据被过滤掉的用户节点、商品节点以及边,对所述多个商品进行排序。第六方面,本专利技术实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第四方面中的数据搜索方法。本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现第四方面中的数据搜索方法。第七方面,本专利技术实施例提供一种数据检测方法,包括:确定异常操作条件对应的第一数量和第二数量,所述异常操作条件为存在至少所述第一数量的用户共同操作至少所述第二数量的对象;生成与待检测操作数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测操作数据中的多个用户,所述第一二分图的对象节点集合对应于所述待检测操作数据中的多个对象,所述第一二分图的边集合对应于所述多个用户对所述多个对象的操作行为;根据所述异常操作条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述异常操作条件的用户节点、对象节点以及边;根据经剪枝处理后的第一二分图确定所述待检测操作数据中存在的异常操作数据。第八方面,本专利技术实施例提供一种数据检测装置,包括:条件确定模块,用于确定异常操作条件对应的第一数量和第二数量,所述异常操作条件为存在至少所述第一数量的用户共同操作至少所述第二数量的对象;二分图生成模块,用于生成与待检测操作数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测操作数据中的多个用户,所述第一二分图的对象节点集合对应于所述待检测操作数据中的多个对象,所述第一二分图的边集合对应于所述多个用户对所述多个对象的操作行为;二分图剪枝模块,用于根据所述异常操作条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述异常操作条件的用户节点、对象节点以及边;异常确定模块,用于根据经剪枝处理后的第一二分图确定所述待检测操作数据中存在的异常操作数据。第九方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如第七方面所述的数据检测方法。在本专利技术实施例中,本文档来自技高网...

【技术保护点】
1.一种数据检测方法,其特征在于,包括:/n确定异常操作条件对应的第一数量和第二数量,所述异常操作条件为存在至少所述第一数量的用户共同操作至少所述第二数量的对象;/n生成与待检测操作数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测操作数据中的多个用户,所述第一二分图的对象节点集合对应于所述待检测操作数据中的多个对象,所述第一二分图的边集合对应于所述多个用户对所述多个对象的操作行为;/n根据所述异常操作条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述异常操作条件的用户节点、对象节点以及边;/n根据经剪枝处理后的第一二分图确定所述待检测操作数据中存在的异常操作数据。/n

【技术特征摘要】
1.一种数据检测方法,其特征在于,包括:
确定异常操作条件对应的第一数量和第二数量,所述异常操作条件为存在至少所述第一数量的用户共同操作至少所述第二数量的对象;
生成与待检测操作数据对应的第一二分图,所述第一二分图的用户节点集合对应于所述待检测操作数据中的多个用户,所述第一二分图的对象节点集合对应于所述待检测操作数据中的多个对象,所述第一二分图的边集合对应于所述多个用户对所述多个对象的操作行为;
根据所述异常操作条件对所述第一二分图进行剪枝处理,以从所述第一二分图中过滤掉不满足所述异常操作条件的用户节点、对象节点以及边;
根据经剪枝处理后的第一二分图确定所述待检测操作数据中存在的异常操作数据。


2.根据权利要求1所述的方法,其特征在于,所述确定异常操作条件对应的第一数量和第二数量,包括:
获取历史操作数据,所述历史操作数据中包括被标记为对应于异常操作数据的至少一个对象;
生成与所述历史操作数据对应的第二二分图;
依次以所述至少一个对象作为目标对象,确定所述第二二分图中与所述目标对象对应的至少一个完全二分子图,所述至少一个完全二分子图中均包括所述目标对象对应的对象节点,所述至少一个完全二分子图各自对应的对象节点个数不同;
根据所述至少一个对象各自对应的至少一个完全二分子图中分别包括的用户节点数量和对象节点数量,确定所述第一数量和所述第二数量。


3.根据权利要求2所述的方法,其特征在于,所述第一数量和所述第二数量的确定步骤,包括:
根据所述至少一个对象各自对应的至少一个完全二分子图中分别包括的用户节点数量和对象节点数量,确定每个对象节点数量分别对应的至少一个用户节点数量;
根据所述每个对象节点数量分别对应的至少一个用户节点数量,确定所述每个对象节点数量分别对应的目标用户节点数量;
确定所述每个对象节点数量及其对应的目标用户节点数量作为一组第一数量和第二数量。


4.根据权利要求3所述的方法,其特征在于,所述根据所述异常操作条件对所述第一二分图进行剪枝处理,包括:
根据至少一种异常操作条件分别对所述第一二分图进行剪枝处理,以得到至少一个第三二分图,其中,所述至少一种异常操作条件对应于至少一组第一数量和第二数量;
所述根据经剪枝处理后的第一二分图确定所述待检测操作数据中存在的异常操作数据,包括:
根据所述至少一个第三二分图确定所述待检测操作数据中存在的异常操作数据。


5.根据权利要求1所述的方法,其特征在于,所述根据所述异常操作条件对所述第一二分图进行剪枝处理,包括:
删除所述第一二分图中的第一对象节点及所述第一对象节点连接的边,所述第一对象节点是度数小于所述第一数量的对象节点;
删除所述第一二分图中的第一用户节点及所述第一用户节点连接的边,所述第一用户节点是度数小于所述第二数量的用户节点。


6.根据权利要求5所述的方法,其特征在于,所述根据所述异常操作条件对所述第一二分图进行剪枝处理,包括:
确定所述第一二分图中的第二用户节点所连接的多个对象节点;
在所述第一二分图中除所述第二用户节点外剩余的用户节点中,确定与所述多个对象节点中的至少所述第二数量的对象节点存在边的第三用户节点的总数;
若所述第三用户节点的总数小于第三数量,则删除所述第二用户节点以及所述第二用户节点连接的边,所述第三数量等于所述第一数量减一。


7.根据权利要求5所述的方法,其特征在于,所述根据所述异常操作条件对所述第一二分图进行剪枝处理,包括:
确定所述第一二分图中的第二对象节点所连接的多个用户节点;
在所述第一二分图中除所述第二对象节点外剩余的对象节点中,确定与所述多个用户节点中的...

【专利技术属性】
技术研发人员:吕冰清李霖钱正平周靖人秦璐林学民
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1