当前位置: 首页 > 专利查询>山西大学专利>正文

一种电商网络异常产品检测方法及系统技术方案

技术编号:36212940 阅读:19 留言:0更新日期:2023-01-04 12:09
本发明专利技术涉及互联网电商领域,为了提高异常产品检测的有效性和可靠性,公开了一种电商网络异常产品检测方法及系统。所述方法包括领域知识图谱数据预处理环节、电商网络异常产品检测模型构建及优化环节和电商网络异常产品检测结果输出及处理环节。本发明专利技术结合TransR模型获得的领域知识图谱中产品的知识和电商网络拓扑构造其孪生网络,在多视图编码器分别对电商网络和孪生网络进行编码后,通过聚合器实现了对产品领域知识的有效融合,最终,依据解码的误差为每个产品计算一个异常分数来评估其异常程度,进而完成异常产品的检测和识别。本发明专利技术通过融入领域知识,能够建立对网络中异常产品的准确可靠描述,有效提升了模型的检测性能。能。能。

【技术实现步骤摘要】
一种电商网络异常产品检测方法及系统


[0001]本专利技术涉及互联网电商领域,特别涉及一种电商网络异常产品检测方法及系统。

技术介绍

[0002]近年来,电商网络因其不受时间和空间限制、商品资源丰富齐全和交易方式高效可靠等特点,逐渐成为人们生活中的重要组成部分。电商网络在给人们生活带来方便快捷的同时,也充满了各种欺诈和异常风险。许多不良商家联合大量欺诈用户通过恶意刷单等方式将劣质产品伪装成良品混入合格产品的共同购买网络中,以此来骗取消费者的信任和购买,并获取不正当的利益。这些产品的存在严重威胁着电商网络的安全健康,也严重损害了消费者的利益。
[0003]为了识别网络中的异常产品,学术界和工业界提出了大量异常检测方法,例如基于社区分析或测量自我中心网络的方法、基于特征子空间选择的方法、基于残差分析的方法和基于深度学习的方法。从表现形式上来看,异常产品具有与正常产品相近的产品属性,因此,仅仅依靠电商网络的拓扑结构和产品属性往往难以对网络中的异常产品做出准确可靠的描述,导致其对决策生成的引导和支撑不充分,一定程度上限制了模型的异常检测能力。事实上,电商网络中的产品除了具有属性信息外,还以其他形式存在着关于产品的领域知识描述。其中,知识图谱作为一种广泛且易于获取的重要知识来源,通过图的形式描述和存储现实世界中的各类知识,能够为现实中的实体提供丰富的背景领域知识。产品的知识和属性是对同一对象在不同视角下的描述和刻画,它们共同为决策生成提供了有力依据。因此,如何在检测模型中融入领域知识,进而提高异常检测的可靠性,对电商网络异常检测技术的研究和应用具有重要意义。

技术实现思路

[0004]本专利技术要解决的技术问题是:设计一种电商网络异常产品检测方法及系统,通过融入产品的领域知识,对电商平台网络中的异常产品进行有效可靠的检测。
[0005]为了达到上述目的,本专利技术采用了下列技术方案:
[0006]本专利技术提供一种电商网络异常产品检测方法,该方法包含三个主要环节,步骤S10为电商网络领域知识图谱数据预处理环节,步骤S20~S40为电商网络异常产品检测模型构建及优化环节,步骤S50为电商网络异常产品检测结果输出及处理环节。具体步骤如下:
[0007]S10、面向电商网络中的产品采集所有相关三元组,并进行数据清洗以构成领域知识图谱,降低噪声对检测结果的影响;
[0008]S20、对步骤S10获取的知识图谱应用TransR模型,获得产品领域知识的嵌入向量,并依据电商网络的拓扑结构构造其孪生网络;
[0009]S30、基于步骤S20中获得的孪生网络,利用图自编码器和图注意力网络构建电商网络异常产品检测模型;
[0010]S40、对于步骤S30构建的电商网络异常产品检测模型,通过迭代计算方式对模型
进行训练,确定模型中的待定参数;
[0011]S50、利用步骤S30构建的电商网络异常产品检测模型,以及步骤S40确定的模型参数,将异常产品检测结果进行输出,并对异常产品进行处理。
[0012]进一步,该方法所述步骤S10包含以下具体步骤:
[0013]S11、对于电商网络中的每个产品,使用SPARQL语句从DBpedia知识图谱中依据头实体或尾实体进行匹配,为该产品抽取所有相关三元组;
[0014]S12、对步骤S11获得的三元组进行清洗,剔除头实体或尾实体为图片链接、其他语种表示的同义实体或者为文本信息的三元组,降低由于三元组的冗余和噪声对检测结果可能造成的影响;
[0015]S13、使用步骤S12预处理后三元组构成领域知识图谱,记作其中,N为实体的集合,R为关系的集合,R中的关系连接两个实体构成三元组(h,r,t)∈T,h∈N为头实体,t∈N为尾实体,r为实体间关系,T表示三元组的集合,每个三元组分别描述现实世界中关于产品的一条知识。
[0016]进一步,该方法所述步骤S20包含以下具体步骤:
[0017]S21、将电商网络数据表示为属性网络电商网络中的产品表示为属性网络中产品节点,产品之间的共同购买关系表示为产品节点之间的边;其中,V={v
i
|i=1,2,...,n}表示网络中n个产品节点构成的集合,v
i
表示第i个产品对应的节点,每个产品节点具有d个属性,x
i
∈X(i=1,2,...,n)表示产品节点v
i
的属性向量;E={e(i,j)|v
i
∈V,v
j
∈V}为网络中所有边构成的集合,e(i,j)为产品节点v
i
和v
j
之间的边,表示有用户同时购买了这两个节点代表的产品,属性网络共包含|E|=m条边;为所有产品节点的属性向量组成的矩阵;此外,邻接矩阵表示属性网络的拓扑结构,若产品节点v
i
和v
j
之间存在边,则A
ij
=1,否则A
ij
=0;
[0018]S22、对于S13获得的领域知识图谱中的每个三元组(h,r,t),将其头实体与尾实体的嵌入分别记作h和t,令r表示实体间关系的嵌入,并对关系r设置一个映射矩阵M
r
将实体从实体空间投影到相应的关系空间,分别获得头实体投影向量h
r
和尾实体投影向量t
r
如式(1)和(2)所示:
[0019]h
r
=hM
r
ꢀꢀ
(1)
[0020]t
r
=tM
r
ꢀꢀ
(2)
[0021]S23、进一步地,在投影实体之间建立转换,通过式(3)的得分函数计算头、尾实体投影向量之间的距离,以此来衡量事实成立的可能性:
[0022][0023]其中,f
r
(h,t)表示头实体h和尾实体t之间的距离得分;
[0024]S24、通过迭代步骤S22和S23对三元组的嵌入不断更新,并从嵌入结果中抽取电商网络中产品对应实体的知识嵌入,构建属性网络的领域知识矩阵,记作其中k
i
∈K表示产品节点v
i
的知识特征;
[0025]S25、基于属性网络的拓扑结构A和领域知识矩阵K构造属性网络的孪生网络,记作
[0026]进一步,所述步骤S30中的电商网络异常产品检测模型包含由属性编码器和知识
编码器组成的多视图编码器、聚合器、解码器和检测器四个部分,其整体结构如附图1所示,其中:
[0027]1)属性编码器由两个注意力层堆叠而成,在属性视图下将属性网络编码为隐空间中的产品节点低维嵌入;其中,第一层使用多头注意力机制,第二层使用单头注意力机制,编码过程的形式化表示如式(4)所示:
[0028][0029]式中,为属性编码器输出的隐空间中产品节点低维嵌入,h

为产品节点嵌入的维度,函数f1(
·
,
·本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电商网络异常产品检测方法,其特征在于,包括以下步骤:S10、面向电商网络中的产品采集所有相关三元组,并进行数据清洗以构成领域知识图谱,降低噪声对检测结果的影响;S20、对步骤S10获取的知识图谱应用TransR模型,获得产品领域知识的嵌入向量,并依据电商网络的拓扑结构构造其孪生网络;S30、基于步骤S20中获得的孪生网络,利用图自编码器和图注意力网络构建电商网络异常产品检测模型;S40、对于步骤S30构建的电商网络异常产品检测模型,通过迭代计算方式对模型进行训练,确定模型中的待定参数;S50、利用步骤S30构建的电商网络异常产品检测模型,以及步骤S40确定的模型参数,将异常产品检测结果进行输出,并对异常产品进行处理。2.根据权利要求1所述的一种电商网络异常产品检测方法,其特征在于,该方法所述步骤S10包含以下具体步骤:S11、对于电商网络中的每个产品,使用SPARQL语句从DBpedia知识图谱中依据头实体或尾实体进行匹配,为该产品抽取所有相关三元组;S12、对步骤S11获得的三元组进行清洗,剔除头实体或尾实体为图片链接、其他语种表示的同义实体或者为文本信息的三元组,降低由于三元组的冗余和噪声对检测结果可能造成的影响;S13、使用步骤S12预处理后三元组构成领域知识图谱,记作T=(N,R,T),其中,N为实体的集合,R为关系的集合,R中的关系连接两个实体构成三元组(h,r,t)∈T,h∈N为头实体,t∈N为尾实体,r为实体间关系,T表示三元组的集合,每个三元组分别描述现实世界中关于产品的一条知识。3.根据权利要求2所述的一种电商网络异常产品检测方法,其特征在于,该方法所述步骤S20包括以下具体步骤:S21、将电商网络数据表示为属性网络电商网络中的产品表示为属性网络中产品节点,产品之间的共同购买关系表示为产品节点之间的边;其中,V={v
i
|i=1,2,...,n}表示网络中n个产品节点构成的集合,v
i
表示第i个产品对应的节点,每个产品节点具有d个属性,x
i
∈X(i=1,2,...,n)表示产品节点v
i
的属性向量;E={e(i,j)|v
i
∈V,v
j
∈V}为网络中所有边构成的集合,e(i,j)为产品节点v
i
和v
j
之间的边,表示有用户同时购买了这两个节点代表的产品,属性网络共包含|E|=m条边;X∈R
n
×
d
为所有产品节点的属性向量组成的矩阵;此外,邻接矩阵表示属性网络的拓扑结构,若产品节点v
i
和v
j
之间存在边,则A
ij
=1,否则A
ij
=0;S22、对于S13获得的领域知识图谱中的每个三元组(h,r,t),将其头实体与尾实体的嵌入分别记作h和t,令r表示实体间关系的嵌入,并对关系r设置一个映射矩阵M
r
将实体从实体空间投影到相应的关系空间,分别获得头实体投影向量h
r
和尾实体投影向量t
r
如式(1)和(2)所示:h
r
=hM
r
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)t
r
=tM
r
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)S23、进一步地,在投影实体之间建立转换,通过式(3)的得分函数计算头、尾实体投影
向量之间的距离,以此来衡量事实成立的可能性:其中,f
r
(h,t)表示头实体h和尾实体t之间的距离得分;S24、通过迭代步骤S22和S23对三元组的嵌入不断更新,并从嵌入结果中抽取电商网络中产品对应实体的知识嵌入,构建属性网络的领域知识矩阵,记作其中k
i
∈K表示产品节点v
i
的知识特征;S25、基于属性网络的拓扑结构A和领域知识矩阵K构造属性网络的孪生网络,记作4.根据权利要求3所述的一种电商网络异常产品检测方法,其特征在于,该方法所述步骤S30中的电商网络异常产品检测模型包含由属性编码器和知识编码器组成的多视图编码器、聚合器、解码器和检测器四个部分,其中:1)属性编码器由两个注意力层堆叠而成,在属性视图下将属性网络编码为隐空间中的产品节点低维嵌入;其中,第一层使用多头注意力机制,第二层使用单头注意力机制,编码过程的形式化表示如式(4)所示:式中,为属性编码器输出的隐空间中产品节点低维嵌入,h

为产品节点嵌入的维度,函数f1(
·
,
·
)和f2(
·
,
·
)分别表示第一个和第二个图注意力层;对于每一个图注意力层,在对属性网络中产品节点的邻域信息进行聚合的过程中,图注意力机制对邻域内各产品节点赋予了不同的注意力系数;产品节点v
i
与其邻居之间的注意力系数由式(5)计算:式中,e
ij
是产品节点v
i
和v
j
之间的注意力系数,表示v
j
对于v
i
的重要程度,的重要程度,为产品节点v
i
的一阶邻居节点集合;是作用到每个产品节点上的可学习权重矩阵,||表示拼接操作,为权重向量;LeakyReLU(
·
)函数如式(6)定义:其中,α值控制负数部分线性函数的梯度大小;为了使产品节点之间的注意力系数易于比较,接下来通过式(7)对注意力系数进行归一化:其中,α
ij
为产品节点v
i
和v
j
之间注意力系数归一化后的结果;利用归一化后的注意力系数与邻居产品节点输入特征的线性组合得到产品节点v
i
在单头注意力图注意力层的输出特征:其中,x
i

表示单头注意力下的图注意力层输出的产品节点v
i
的嵌入,σ(
·
)为激...

【专利技术属性】
技术研发人员:杜航原曹振武王文剑白亮梁吉业
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1