垃圾账户的检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35355553 阅读:25 留言:0更新日期:2022-10-26 12:31
本发明专利技术涉及人工智能技术,揭露了一种垃圾账户的检测方法,包括:生成目标账户中用户信息的邻接列表,利用所述邻接列表生成所述用户信息的用户矩阵;对所述用户矩阵进行聚合和更新,得到更新向量;对所述更新向量进行分类,得到所述更新向量的用户分类结果;对目标账户中文本进行向量化转换,得到文本向量;将所述文本向量进行分类,得到文本分类结果;计算分类结果的加权平均值,比较所述加权平均值和阈值的大小,确定所述目标账户为垃圾账户。此外,本发明专利技术还涉及区块链技术,数据列表可存储于区块链的节点。本发明专利技术还提出一种垃圾账户的检测装置、电子设备以及存储介质。本发明专利技术可以提高垃圾账户的检测的准确率。圾账户的检测的准确率。圾账户的检测的准确率。

【技术实现步骤摘要】
垃圾账户的检测方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种垃圾账户的检测方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着计算机和互联网技术的迅速发展,人们越来越习惯于利用网络处理各种工作和生活事项,处理这些事项一般由用户在提供相应服务的业务系统中注册账户,比如电商平台账户、第三方支付平台账户、论坛平台账户等,然后将账户作为其身份的代表,来运行相关的业务逻辑。网络具有两面性,网络在极大的方便用户的同时,也不可避免的带来一些安全隐患。一些用户或者组织出于不良目的,会注册大量账户,并利用这些账户进行一些异常操作,比如传播留言、推销虚假广告、刷单等,不仅浪费了业务系统的资源,而且对合法用户的利益造成了损害。
[0003]现如今,运用传统分类器包括Randforest,SVM,NB,KNN检测垃圾信息,由于这些传统分类器的性能缺点,同时,需要人工提炼出用户信息和垃圾信息的属性,导致检测准确率不高;运用多层反向神经网络检测垃圾信息,可能由于网络深度不够、选择的激活函数不对、参数设置等原因导致检测准确率更是低于部分传统分类器,因此如何提升垃圾账户的检测准确率,成为了亟待解决的问题。

技术实现思路

[0004]本专利技术提供一种垃圾账户的检测方法、装置及计算机可读存储介质,其主要目的在于解决垃圾账户的检测时准确率较低的问题。
[0005]为实现上述目的,本专利技术提供的一种垃圾账户的检测方法,包括:
[0006]生成目标账户中用户信息的邻接列表,利用所述邻接列表生成所述用户信息的用户矩阵;
[0007]对所述用户矩阵进行节点聚合,得到目标用户矩阵;
[0008]按照预设的更新函数对所述目标用户矩阵中的向量进行更新,得到更新向量;
[0009]利用预设的用户分类模型对所述更新向量进行分类,得到所述更新向量的用户分类结果;
[0010]对目标账户中文本进行向量化转换,得到文本向量;
[0011]将所述文本向量输入至预设的文本分类模型,得到所述文本向量的文本分类结果;
[0012]计算所述用户分类结果和所述文本分类结果的加权平均值,比较所述加权平均值和阈值的大小,当所述加权平均值大于阈值时,确定所述目标账户为垃圾账户。
[0013]可选地,所述生成目标账户中用户信息的邻接列表,包括:
[0014]对所述目标账户中用户信息按照预设的索引进行二分类,得到顶点信息和边信息;
[0015]对预设的顶点表进行初始化,将所述顶点信息写入初始化后的顶点表内,得到目标顶点表;
[0016]将所述边信息按照连接关系依次写入预设的边表中,得到目标边表;
[0017]根据所述目标顶点表和所述目标边表生成邻接列表。
[0018]可选地,所述利用所述邻接列表生成所述用户信息的用户矩阵,包括:
[0019]根据所述邻接列表中的顶点信息生成顶点数组,根据所述邻接列表中的边信息生成边数组;
[0020]根据所述顶点数组确定总顶点数,根据所述边数组确定总边数;
[0021]利用所述总顶点数和所述总边数构建邻接矩阵,对所述邻接矩阵进行初始化;
[0022]根据所述邻接列表对初始化后的邻接矩阵进行填充,得到所述用户信息的用户矩阵。
[0023]可选地,所述对所述用户矩阵进行节点聚合,得到目标用户矩阵,包括:
[0024]按照预设的节点分区方式对所述用户矩阵进行分区,得到局部矩阵;
[0025]对所有局部矩阵进行平均池化,得到所述局部矩阵的特征值;
[0026]对所述特征值进行拼接,得到目标用户矩阵。
[0027]可选地,所述按照预设的更新函数对所述目标用户矩阵中的向量进行更新,得到更新向量,包括:
[0028]利用如下所述更新函数对所述目标用户矩阵中的向量进行更新:
[0029][0030]其中,是第k+1层节点u的特征向量,表示第k层节点v的特征向量,N(u)表示节点u的邻居节点集合,UPDATE
(k)
表示在第k层节点进行更新,AGGREGATE
(k)
表示对第k层节点进行加和,表示节点v可以取到N(u)中的任意值。
[0031]可选地,所述对目标账户中文本进行向量化转换,得到文本向量,包括:
[0032]对目标账户中文本进行分词处理,得到文本分词;
[0033]获取所述文本分词的词向量,对所述词向量进行聚类处理,得到每个特征词的聚类类别;
[0034]基于权重算法计算每个特征词在所述文本中的权重;
[0035]根据所述聚类类别和所述权重生成文本向量。
[0036]可选地,所述对目标账户中文本进行向量化转换,得到文本向量,包括:
[0037]对目标账户中文本进行分词处理,得到文本分词;
[0038]对所述文本分词进行标记,得到标记分词;
[0039]按照预设的句子长度对所述标记分词进行标记填充,得到标准分词;
[0040]对所述标记分词进行注意力屏蔽,得到注意力分词;
[0041]对所述注意力分词中的元素进行映射,得到所有注意力分词的唯一ID;
[0042]将所述注意力分词和所述唯一ID输入至预训练的语言表征模型,得到每个文本分词的文本向量。
[0043]为了解决上述问题,本专利技术还提供一种垃圾账户的检测装置,所述装置包括:
[0044]用户矩阵模块,用于生成目标账户中用户信息的邻接列表,利用所述邻接列表生成所述用户信息的用户矩阵;
[0045]节点聚合模块,用于对所述用户矩阵进行节点聚合,得到目标用户矩阵;
[0046]向量更新模块,用于按照预设的更新函数对所述目标用户矩阵中的向量进行更新,得到更新向量;
[0047]用户分类模块,用于利用预设的用户分类模型对所述更新向量进行分类,得到所述更新向量的用户分类结果;
[0048]向量化模块,用于对目标账户中文本进行向量化转换,得到文本向量;
[0049]文本分类模块,用于将所述文本向量输入至预设的文本分类模型,得到所述文本向量的文本分类结果;
[0050]加权平均模块,用于计算所述用户分类结果和所述文本分类结果的加权平均值,比较所述加权平均值和阈值的大小,当所述加权平均值大于阈值时,确定所述目标账户为垃圾账户。
[0051]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0052]至少一个处理器;以及,
[0053]与所述至少一个处理器通信连接的存储器;其中,
[0054]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的垃圾账户的检测方法。
[0055]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种垃圾账户的检测方法,其特征在于,所述方法包括:生成目标账户中用户信息的邻接列表,利用所述邻接列表生成所述用户信息的用户矩阵;对所述用户矩阵进行节点聚合,得到目标用户矩阵;按照预设的更新函数对所述目标用户矩阵中的向量进行更新,得到更新向量;利用预设的用户分类模型对所述更新向量进行分类,得到所述更新向量的用户分类结果;对目标账户中文本进行向量化转换,得到文本向量;将所述文本向量输入至预设的文本分类模型,得到所述文本向量的文本分类结果;计算所述用户分类结果和所述文本分类结果的加权平均值,比较所述加权平均值和阈值的大小,当所述加权平均值大于阈值时,确定所述目标账户为垃圾账户。2.如权利要求1所述的垃圾账户的检测方法,其特征在于,所述生成目标账户中用户信息的邻接列表,包括:对所述目标账户中用户信息按照预设的索引进行二分类,得到顶点信息和边信息;对预设的顶点表进行初始化,将所述顶点信息写入初始化后的顶点表内,得到目标顶点表;将所述边信息按照连接关系依次写入预设的边表中,得到目标边表;根据所述目标顶点表和所述目标边表生成邻接列表。3.如权利要求1所述的垃圾账户的检测方法,其特征在于,所述利用所述邻接列表生成所述用户信息的用户矩阵,包括:根据所述邻接列表中的顶点信息生成顶点数组,根据所述邻接列表中的边信息生成边数组;根据所述顶点数组确定总顶点数,根据所述边数组确定总边数;利用所述总顶点数和所述总边数构建邻接矩阵,对所述邻接矩阵进行初始化;根据所述邻接列表对初始化后的邻接矩阵进行填充,得到所述用户信息的用户矩阵。4.如权利要求1所述的垃圾账户的检测方法,其特征在于,所述对所述用户矩阵进行节点聚合,得到目标用户矩阵,包括:按照预设的节点分区方式对所述用户矩阵进行分区,得到局部矩阵;对所有局部矩阵进行平均池化,得到所述局部矩阵的特征值;对所述特征值进行拼接,得到目标用户矩阵。5.如权利要求1所述的垃圾账户的检测方法,其特征在于,所述按照预设的更新函数对所述目标用户矩阵中的向量进行更新,得到更新向量,包括:利用如下所述更新函数对所述目标用户矩阵中的向量进行更新:其中,是第k+1层节点u的特征向量,表示第k层节点v的特征向量,N(u)表示节点u的邻居节点集合,UPDATE
(k)
表示在第k层节点进行更新,AGGREGATE
(k)
表示对...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1