System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于社交网络安全,更为具体地讲,涉及一种基于用户行为知识图谱的社交网络异常行为检测方法。
技术介绍
1、社交网络基于互联网为用户提供服务,已经成为了人们日常生活的重要组成部分,为人们分享、获取和传播信息提供了一个重要平台。近年来,随着人工智能、大数据等新兴技术的高速发展,网络安全风险不断泛化,用户隐私和财产窃取、虚假信息传播等网络行为对用户人身安全、社会和谐稳定带来威胁,甚至可能威胁国家或地区安全。一方面,社交网络服务的时效性、快捷性导致在社交网络中传播的信息能够在极短的时间内引发大量网络用户的关注,在这些特性的催化下可能会出现网络热点事件和公共舆情事件而造成网络安全威胁;另一方面,异常用户在社交平台上发布垃圾、诈骗信息等侵犯公民网络权力的行为,对社交网络安全造成严重影响。因此,如何从海量的网络社交信息中准确发掘这些由用户产生的多个异常行为,如何感知其中隐含的安全威胁是亟须解决的网络空间安全问题。
2、在过去几年中,研究人员已经提出许多方法用于识别社交网络中的异常行为,这些方法包括基于规则匹配的算法、基于统计的算法以及基于机器学习的算法等。基于规则的方法主要通过分析用户的行为模式、活动内容、社交关系等信息,与预先定义的规则或者行为模式进行匹配对比,以识别可能存在的异常行为。例如,用户在短时间内进行了异常数量的登录尝试,则可能涉及到账号被盗;或者用户在短时间内发布了过多的相似内容,可能是垃圾信息或者滥用行为等。然而该方法受限于领域专家的经验知识,对于复杂或新型的异常行为模式,规则可能不够灵活,无法捕捉未知的异
3、针对社交网络异常行为的检测,上述三种方法都同样面临社交网络信息爆炸、可用知识缺乏的挑战。当前,大量社交网络用户在社交平台上产生的点赞、评论、转发和关注等网络行为,其复杂多样的数据类型及结构,对于获取其中的可用的用户行为知识造成一定的困难;并且社交网络中用户行为数据规模庞大,难以发现其中复杂多样、高度隐蔽的异常行为。总之,社交网络异常行为检测的关键在于针对网络上存在的大量非结构化数据,构建高效用户行为知识体系,从而实现从海量的社交网络信息中准确发现用户的异常行为。
技术实现思路
1、本专利技术的目的在于克服现有技术的不足,提供一种基于用户行为知识图谱的社交网络异常行为检测方法,基于社交网络用户行为数据构建基于用户行为知识图谱,将知识图谱张量化后从中提取用户行为嵌入向量进行异常行为检测,从而提高异常行为检测的准确率。
2、为了实现上述专利技术目的,本专利技术基于用户行为知识图谱的社交网络异常行为检测方法包括以下步骤:
3、s1:整合社交网络中的用户行为数据构成用户行为知识图谱,具体方法为:
4、s1.1:从社交网络中收集用户行为数据,包括用户发布的内容、互动记录、社交关系以及个人资料信息,从用户行为数据中筛选中正常用户行为并进行标注;
5、s1.2:进行用户行为知识抽取,具体方法为:
6、从步骤s1.1获取的用户行为数据中识别出实体,包括用户、地点和事件;抽取任意两个用户实体之间的社交关系;从用户行为数据中抽取事件,得到事件的结构化信息,包括参与事件的用户实体、事件实体、地点实体和行为关系;
7、s1.3:构建用户行为知识图谱,具体方法为:根据步骤s1.2中识别得到的实体对象以及实体对象间的关系,将每条用户行为知识表示为四元组形式{h,r,t,d},其中h、t分别表示头实体和尾实体,r表示两个实体之间的关系,d表示时间;将实体作为节点,用户实体间的边根据两个用户实体之间的社交关系生成,用户实体和事件实体或地点实体之间的边根据用户实体的行为生成,每条边的属性为关系形成或做出行为的时间;
8、s2:记用户行为知识图谱包含n个实体、m种关系和d个时间段,构建一个维度为n×n×m×d的四阶张量χ用于存储用户行为知识,其中第一维表示头实体,第二维表示尾实体,第三维表示实体之间关系类型,第四维表示关系发生的时间;将用户行为知识图谱中的每个四元组转换为张量中的一个元素,每个元素χi×j×m×d表示头实体i和尾实体j在时间段d内是否存在关系类型m,如果关系存在则该χi×j×m×d=1,不存在则χi×j×m×d=0,其中i,j=1,2,…,n,m=1,2,…,m,d=1,2,…,d;
9、s3:对用户行为知识图谱张量χ进行张量分解,得到头实体矩阵尾实体矩阵关系矩阵其中表示实体i在头实体因子中的嵌入向量、表示实体j在尾实体因子中的嵌入向量,表示关系m在关系因子中的嵌入向量,表示时间d在时间因子中的嵌入向量,k表示分解的秩;
10、采用如下公式根据张量分解结果计算得到行为嵌入向量xi,j,m,d:
11、
12、其中,表示向量的拼接操作;
13、s4:根据步骤s1.1中标注的正常用户行为,从所有行为嵌入向量中筛选出正常用户行为对应的行为嵌入向量构成正常行为训练样本集;
14、s5:根据实际需要构建行为重构模型,其输入为行为嵌入向量,输出为重构的行为嵌入向量,然后采用步骤s4得到的正常行为训练样本集对行为重构模型进行训练;
15、s6:将社交网络中待检测行为嵌入向量输入步骤s5训练好的行为重构模型,计算重构行为嵌入向量与待检测行为嵌入向量之间的重构误差,判断是否大于预设的阈值α,如果大于,则该待检测行为嵌入向量对应的行为是异常行为,否则该待检测行为嵌入向量对应的行为是正常行为。
16、本专利技术基于用户行为知识图谱的社交网络异常行为检测方法,整合社交网络中的用户行为数据构成用户行为知识图谱,然后根据用户行为知识图谱构建四阶张量,对用户行为知识图谱张量进行张量分解,再计算得到各个行为嵌入向量,将正常用户行为对应的行为嵌入向量构成训练样本集并对构建的行为重构模型进行训练,最后将待检测行为嵌入向量输入训练好的行为重构模型,根据重构误差与阈值的大小比较得到异常行为检测结果。
17、本专利技术具有以下有益效果:
18、1)本专利技术通过构建用户行为知识图谱,将社交网络中的用户、事件、地点本文档来自技高网...
【技术保护点】
1.一种基于用户行为知识图谱的社交网络异常行为检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤S1.1中还包括对收集的用户行为数据进行预处理,具体方法为:
3.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤S1.2中采用BERT模型进行用户行为知识抽取。
4.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤S3中张量分解采用CP分解。
5.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述行为重构模型采用变分自编码器。
6.根据权利要求5所述的社交网络异常行为检测方法,其特征在于,所述变分自编码器训练时的损失函数LVAE的计算公式如下:
7.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤S6中阈值α的确定方法为:
【技术特征摘要】
1.一种基于用户行为知识图谱的社交网络异常行为检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤s1.1中还包括对收集的用户行为数据进行预处理,具体方法为:
3.根据权利要求1所述的社交网络异常行为检测方法,其特征在于,所述步骤s1.2中采用bert模型进行用户行为知识抽取。
4.根据权利要求1所述的社交网络异常行为...
【专利技术属性】
技术研发人员:张琦,石玉莲,邢玲,韩雪梅,张建新,黄元浩,田甜,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。