【技术实现步骤摘要】
基于网络表示学习的社交网络异常账户检测方法及系统
本专利技术属于社交网络数据挖掘领域,具体涉及一种基于网络表示学习的社交网络异常账户检测方法及系统。
技术介绍
随着第三代Web技术的快速发展和广泛应用,社交网络因其高效便捷、内容丰富和实时性强等特点,逐渐成为人们网络生活中重要的组成部分。社交网络一方面是承载海量媒体资讯和社交信息的载体,另一方面本身也蕴含着大量用户的隐私信息和广阔的商业价值,容易成为不法分子攻击的目标。网络攻击者通过创建虚假账户或盗取正常账户,在社交网络中进行恶意信息发布、金融交易诈骗、发动网络攻击等各类行为,严重威胁到人们的生命财产安全和社交网络的规则体系及信任关系。社交网络中异常账户具有广泛存在性与严重危害性,为此学术界和工业界提出了大量检测方案。在线社交网络中的异常账户检测问题,对于社交网站安全、用户隐私保护等具有重要的意义和价值,另外对网络群体事件监测、网络舆论导向分析等也具有重要价值。综上所述,随着在线社交网络的快速发展,异常账户带来的各种危害和隐患严重威胁到广大用户的信息安全以及社交网站的健康发展。为此,设计和发展高效可靠的社交网络异常账户监测方法成为学术界和产业界共同关注的一个热点问题。这一工作需要分析用户行为模式以及网络结构,涉及异常检测、图论、非监督学习和半监督学习等多个领域,具有重要的理论价值和现实意义。但是网络数据由于拓扑结构中“边”的存在,导致数据的表达呈现出高维稀疏、网络账户节点高度耦合,以及账户节点相关关系重重迭代的特点,为网络数据的分析挖掘带来的巨大困难。
技术实现思路
本专利技术针对上述问题提供了一种基于网络表示 ...
【技术保护点】
1.基于网络表示学习的社交网络异常账户检测方法,其特征在于:包括以下步骤:S1、利用社交网络数据构建网络G(V,E,C);S2、构建网络G(V,E,C)的M×M维邻接矩阵;S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型;S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法;S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法;S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子;S7、初始化模型相关参数,通过迭代执行S4~S6的方法计算每个账户节点的联合异常因子;S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户。
【技术特征摘要】
1.基于网络表示学习的社交网络异常账户检测方法,其特征在于:包括以下步骤:S1、利用社交网络数据构建网络G(V,E,C);S2、构建网络G(V,E,C)的M×M维邻接矩阵;S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型;S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法;S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法;S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子;S7、初始化模型相关参数,通过迭代执行S4~S6的方法计算每个账户节点的联合异常因子;S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户。2.根据权利要求1所述基于网络表示学习的社交网络异常账户检测方法,其特征在于:所述步骤S1中构建网络G(V,E,C)的方法为:利用社交网络数据构建网络,将社交网络账户表示为网络中的账户节点,将账户之间的关联关系表示为账户节点间的边;将网络记为G(V,E,C),其中V=(v1,v2,…,vM)表示网络中M个账户构成的集合,其中第m个账户(1≤m≤M)记为账户节点vm;E=(e1,e2,…,ef)表示账户节点之间存在的F条连边,其中第f条边(1≤f≤F)记为ef;C为M×D维的账户节点属性矩阵,其第m行Cm=[Cm,1,Cm,2,…,Cm,D]表示网络中账户节点vm的D个属性,其中元素Cm,d表示账户节点vm的第d个属性(1≤d≤D);对于网络中的任一账户节点vm,记其在低维隐空间中的表征形式为K维向量xm,K满足K<min(M,D)。3.根据权利要求1所述基于网络表示学习的社交网络异常账户检测方法,其特征在于:所述步骤S2中构建网络G(V,E,C)邻接矩阵的方法为:将M×M维邻接矩阵记为A,令A中每个元素的值表示网络G(V,E,C)中两个相应账户节点间的邻接关系,即A中第m行第n列(1≤m≤M,1≤n≤M)的元素Am,n表示网络G(V,E,C)中第m个账户节点vm和第n个账户节点vn间的邻接关系,若vm和vn之间存在边,则Am,n=1,否则Am,n=0。4.根据权利要求1所述基于网络表示学习的社交网络异常账户检测方法,其特征在于:所述步骤S3的具体步骤如下:S31、构建网络拓扑结构表征学习的子优化模型:令网络G(V,E,C)的拓扑结构在低维隐空间中的表征形式记为Z,则Z是一个M×K维矩阵,其每一行表示每个账户节点拓扑结构的K维表征向量,为了使Z最大限度的保持网络拓扑中各账户节点之间的相似度关系,引入一个K×M维矩阵H构建网络拓扑的重构损失函数如式(1)所示,其中Zm·为矩阵Z的第m行,表示账户节点vm的拓扑结构在隐空间中的K维表征向量;H.n为矩阵H的第n列,表示账户节点vn在拓扑空间和隐空间之间的映射关系;O1,m为账户节点vm的拓扑结构异常因子,用于描述该账户节点在拓扑结构方面的异常程度,构建网络拓扑结构表征学习的子优化目标函数L1,即使得式(1)所示的损失函数取值最小;S32、构建账户节点属性表征学习的子优化模型:将网络G(V,E,C)的账户节点属性在低维隐空间中的表征形式记为U,则U是一个M×K维矩阵,其每一行表示每个账户节点的属性在隐空间中的K维表征向量,为了使账户节点间属性相似性关系在U中完整的保持,引入一个K×D维矩阵Q构建账户节点属性的重构损失函数如式(2)所示,其中Um.为矩阵U的第m行,表示账户节点vm的相关属性在隐空间中的K维表征向量;Q.d为矩阵Q的第d列,表示账户节点属性的第d个特征在网络空间和隐空间之间的映射关系;O2,m为账户节点vm的属性异常因子,用于描述该账户节点在属性特征方面的异常程度;构建账户节点属性表征学习的子优化目标函数L2,即令式(2)所示的损失函数取值最小;S33、构建拓扑结构和账户节点属性低维表征间的映射子优化模型:网络结构和账户节点属性是网络数据不同侧面的表现形式,二者之间存在一定映射关系,令隐空间中网络G(V,E,C)的拓扑结构和账户节点属性的低维表征之间的映射关系为K×K维的矩阵W,则网络数据在两个不同侧面数据表征的损失函数如式(3)所示,其中(WT).k表示矩阵W的转置的第k列(1<k<K),O3,m为账户节点vm的一致性异常因子,用于描述该账户节点在网络拓扑和特征属性映射间的异常程度,构建拓扑结构和账户节点属性低维表征间的映射子优化目标函数L3,即令式(3)所示的损失函数取值最小;其中Zm,k表示矩阵Z的第m行第k列的元素;S34、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型:网络在低维空间中的有效表征应同时满足S31~S33中的三个子优化目标,构建网络关于拓扑结构和账户节点属性的表征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。