【技术实现步骤摘要】
一种面向电子商务的用户异常行为检测系统
[0001]本专利技术涉及大数据和电子商务领域,尤其涉及一种面向电子商务的用户异常行为检测系统。
技术介绍
[0002]在电商平台中,用户对于商品的购买决定很大程度上依赖于商品的评论信息,如果某件商品拥有大量用户好评,用户会呈现出较大的购买倾向。各个商业组织和个人利用电子商务中用户产生内容辅助其决策,实现用户相关推荐等。电子商务水军通过虚假评论来影响某件商品的评论走势,影响用户的购买决定,为其雇主或自身带来相应的商业利益。相比其他领域的网络水军行为,电子商务领域网络水军造成的影响最为严重。
[0003]传统电子商务领域的虚假评论识别主要依据评论内容相似性及其语言特征来发现虚假评论,即,通过分析评论文本的倾向性,从而发现偏离正常用户评论的虚假评论或通过虚假评论呈现出的不同于正常用户评论模式的特征,如重复使用大量无实义的形容词、语言多具有重复部分等,来识别虚假评论。然而,通过分析评论文本倾向性挖掘异常评论不仅存在效率较低的缺点,还存在准确性差的弊端。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种面向电子商务的用户异常行为检测系统其包括:用户终端和电子商务平台,电子商务平台分别与各用户终端具有通信连接;电子商务平台包括数据接收模块、异常检测模块、异常识别模块和数据库,各模块间具有通信连接;异常检测模块包括第一检测单元、第二检测单元和第三检测单元,各单元具有通信连接;
[0005]数据接收模块接收目标用户通过用户终端发布的目标产品评论; />[0006]异常检测模块的第一检测单元提取目标产品的关联轨迹数据的关联时空特征,并将关联时空特征映射到时空特征空间以得到关联时空特征矩阵,然后根据关联时空特征矩阵获取目标产品评论的第一异常判断值;
[0007]异常检测模块的第二检测单元提取目标用户的历史购买数据的历史时空特征,并将历史时空特征映射到时空特征空间得到历史时空特征矩阵,然后根据历史时空特征矩阵构建产品分布图;根据历史购买数据获取历史时序特征,并根据历史时序特征将产品分布图分解为若干个产品分布子图;
[0008]第二检测单元使用无监督学习算法将每个产品分布子图表示为一维向量以得到每个产品分布子图的图特征向量,并根据每个产品分布子图的图特征向量与标准特征向量的余弦相似度获取每个产品分布子图的异常值,然后将异常值大于异常阈值的产品分布子图作为异常产品分布子图;
[0009]第二检测单元利用图卷积网络将每个异常产品分布子图转换为对应的线图,并分别提取每个异常产品子分布图和其对应的线图的图特征以得到每个异常产品子分布图的第一图特征和第二图特征;
[0010]第二检测单元将每个异常产品分布子图的第一图特征和第二图特征进行拼接得到每个异常产品分布子图的图结构特征,并将每个异常产品分布子图的图结构特征进行线性变换以得到每个异常产品分布子图的异常子系数,然后将所有异常产品分布子图的异常子系数进行加权求和得到目标产品评论的异常系数;
[0011]异常检测模块的第三检测单元分别提取目标产品评论和历史产品评论的特征,分别将其映射到特征向量空间以得到目标评论向量和若干个历史评论向量,并根据目标评论向量和历史评论向量构建目标产品的评论结构图,然后根据评论结构图获取目标产品评论的第二异常判断值;
[0012]异常识别模块根据异常系数、第一异常判断值和第二异常判断值计算目标产品评论的可信度,并在目标产品评论的可信度小于可信度阈值时将目标产品评论标记为异常产品评论。
[0013]根据一个优选实施方式,所述用户终端为用户使用的具有通信功能和数据传输功能的设备,其包括:智能手表、智能手机、笔记本电脑、平板电脑和台式电脑。
[0014]根据一个优选实施方式,第一检测单元根据关联时空特征矩阵获取目标产品评论的第一异常判断值包括:
[0015]第一检测单元根据关联时空特征矩阵获取目标用户在关联周期内浏览过的所有产品,并将目标用户在关联周期内浏览过的作为关联产品,然后获取关联产品的地址标识符;
[0016]第一检测单元将关联时空特征矩阵分解为浏览顺序矩阵、浏览时长矩阵和产品属性矩阵,并根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成若干个三元复合坐标;
[0017]第一检测单元根据地址标识符将关联产品与三元复合坐标进行映射生成若干个二元组,并根据所有二元组获取目标产品评论的第一异常判断值。
[0018]根据一个优选实施方式,所述目标产品的关联轨迹数据为目标用户在关联周期内在电商平台的浏览轨迹数据;所述关联周期为目标用户购买目标产品前的第一预设时间段;所述目标用户的历史购买数据为目标用户在历史周期内在电商平台购买的产品的相关数据;所述历史周期为目标用户在购买目标产品前的第二预设时间段。
[0019]根据一个优选实施方式,第一检测单元根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成三元复合坐标包括:
[0020]第一检测单元根据地址标识符将浏览顺序矩阵分解为若干个浏览顺序向量,并根据地址标识符将浏览时长矩阵分解为若干个浏览时长向量,然后根据地址标识符产品属性矩阵分解为若干个产品属性向量;
[0021]第一检测单元将地址标识符相同的浏览顺序向量、浏览时长向量和产品属性向量作为一个三元向量组以得到若干个三元向量组;三元向量组包括浏览顺序向量、浏览时长向量和产品属性向量;
[0022]第一检测单元遍历所有三元向量组并将正在遍历的三元向量组作为目标三元向量组;
[0023]第一检测单元将目标三元向量组中的浏览顺序向量映射到第一维特征空间以得到目标第一坐标,并将目标三元向量组中的浏览时长向量映射到第二维特征空间以得到目标第二坐标,然后将目标三元向量组中的产品属性向量映射到第三维特征空间以得到目标
第三坐标;
[0024]第一检测单元根据目标第一坐标、目标第二坐标和目标第三坐标生成相应目标三元向量组的复合三元坐标;
[0025]第一检测单元重复以上步骤,直到遍历完所有的三元向量组以生成每个三元向量组的复合三元坐标。
[0026]根据一个优选实施方式,所述目标产品评论为目标用户在购买目标产品后对目标产品的评论;所述二元组包括地址标识符和三元复合坐标;所述三元复合坐标包括第一坐标、第二坐标和第三坐标;所述地址标识符用于对产品购买地址进行唯一标识。
[0027]根据一个优选实施方式,第一检测单元根据所有的二元组获取目标产品评论的第一异常判断值包括:
[0028]第一检测单元遍历所有的关联产品,并将正在遍历的关联产品作为目标关联产品,然后获取目标关联产品的三元复合坐标;将目标关联产品作为一个新的产品类型,并将该产品类型的属性坐标设置为目标关联产品的第三坐标,然后将该产品类型的时长坐标设置为目标关联产品的第二坐标;判断是否还存在没有遍历的关联产品;
[0029]在存在没有遍历的关联产品时,第一检测单元继续遍历关联产品,并将正在遍历的关联产品作为目标关联产品,然本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种面向电子商务的用户异常行为检测系统,其特征在于,其包括:用户终端和电子商务平台,电子商务平台分别与各用户终端具有通信连接;电子商务平台包括数据接收模块、异常检测模块、异常识别模块和数据库,各模块间具有通信连接;异常检测模块包括第一检测单元、第二检测单元和第三检测单元,各单元具有通信连接;数据接收模块接收目标用户通过用户终端发布的目标产品评论;异常检测模块的第一检测单元提取目标产品的关联轨迹数据的关联时空特征,并将关联时空特征映射到时空特征空间以得到关联时空特征矩阵,然后根据关联时空特征矩阵获取目标产品评论的第一异常判断值;异常检测模块的第二检测单元提取目标用户的历史购买数据的历史时空特征,并将历史时空特征映射到时空特征空间得到历史时空特征矩阵,然后根据历史时空特征矩阵构建产品分布图;根据历史购买数据获取历史时序特征,并根据历史时序特征将产品分布图分解为若干个产品分布子图;第二检测单元使用无监督学习算法将每个产品分布子图表示为一维向量以得到每个产品分布子图的图特征向量,并根据每个产品分布子图的图特征向量与标准特征向量的余弦相似度获取每个产品分布子图的异常值,然后将异常值大于异常阈值的产品分布子图作为异常产品分布子图;第二检测单元利用图卷积网络将每个异常产品分布子图转换为对应的线图,并分别提取每个异常产品子分布图和其对应的线图的图特征以得到每个异常产品子分布图的第一图特征和第二图特征;第二检测单元将每个异常产品分布子图的第一图特征和第二图特征进行拼接得到每个异常产品分布子图的图结构特征,并将每个异常产品分布子图的图结构特征进行线性变换以得到每个异常产品分布子图的异常子系数,然后将所有异常产品分布子图的异常子系数进行加权求和得到目标产品评论的异常系数;异常检测模块的第三检测单元分别提取目标产品评论和历史产品评论的特征,分别将其映射到特征向量空间以得到目标评论向量和若干个历史评论向量,并根据目标评论向量和历史评论向量构建目标产品的评论结构图,然后根据评论结构图获取目标产品评论的第二异常判断值;异常识别模块根据异常系数、第一异常判断值和第二异常判断值计算目标产品评论的可信度,并在目标产品评论的可信度小于可信度阈值时将目标产品评论标记为异常产品评论。2.根据权利要求1所述的系统,其特征在于,所述用户终端为用户使用的具有通信功能和数据传输功能的设备,其包括:智能手表、智能手机、笔记本电脑、平板电脑和台式电脑。3.根据权利要求1或2所述的系统,其特征在于,所述第一检测单元根据关联时空特征矩阵获取目标产品评论的第一异常判断断值包括:第一检测单元根据关联时空特征矩阵获取目标用户在关联周期内浏览过的所有产品,并将目标用户在关联周期内浏览过的作为关联产品,然后获取关联产品的地址标识符;第一检测单元将关联时空特征矩阵分解为浏览顺序矩阵、浏览时长矩阵和产品属性矩阵,并根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成若干个三元复合坐标;第一检测单元根据地址标识符将关联产品与三元复合坐标进行映射生成若干个二元
组,并根据所有二元组获取目标产品评论的第一异常判断值。4.根据权利要求3所述的系统,其特征在于,所述目标产品的关联轨迹数据为目标用户在关联周期内在电商平台的浏览轨迹数据;所述关联周期为目标用户购买目标产品前的第一预设时间段;所述目标用户的历史购买数据为目标用户在历史周期内在电商平台购买的产品的相关数据;所述历史周期为目标用户在购买目标产品前的第二预设时间段。5.根据权利要求4所述的系统,其特征在于,第一检测单元根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成三元复合坐标包括:第一检测单元根据地...
【专利技术属性】
技术研发人员:ꢀ五一IntClG零六Q三零零二,
申请(专利权)人:郑璨,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。