【技术实现步骤摘要】
人员关系分析方法、装置及电子设备
本专利技术涉及关系分析
,尤其是涉及一种人员关系分析方法、装置及电子设备。
技术介绍
现有技术中,为了计算人员亲密度,通常采用图算法或者图挖掘技术进行计算,这些方法往往都是对人与人之间的某些行为次数进行加权求和,进而计算人员亲密度。但是,在不同的社区可能存在不同的活跃度,同样的行为和次数,在一些不活跃社区中的人与人关系应该比活跃社区中具有更高的亲密度,通过加权求和就会造成计算不准确的问题。
技术实现思路
本专利技术的目的在于提供一种人员关系分析方法、装置及电子设备,可以有效提高计算人员亲密度值的可靠性。第一方面,本专利技术提供了一种人员关系分析方法,其中,包括:获取人与人之间的行为信息,并根据所述行为信息计算得到边权重;由所述边权重决定在上一节点确定的情况下,不同路径的选择概率,随机采样得到一条节点序列,针对节点序列,使用对数似然函数,最大化节点序列出现的概率,从而获得最优的嵌入向量;基于密度聚类算法对所述向量模型进行聚类处理,得到所述向量模型中相同簇的嵌入向量;基于所述嵌入向量建立所述相同簇的包围圆,并计算所述包围圆的半径值;根据所述半径值和所述边权重计算得到人员亲密度值。进一步的,所述根据所述行为信息计算得到边权重的步骤,包括:根据以下算式计算所述边权重:其中,为两个人员之间的行为频次,kr为行为权重,r为行为种类。进一步的,所述由所述边权重决定在上一节点确定 ...
【技术保护点】
1.一种人员关系分析方法,其特征在于,包括:/n获取人与人之间的行为信息,并根据所述行为信息计算得到边权重;/n由所述边权重决定在上一节点确定的情况下,不同路径的选择概率,随机采样得到一条节点序列,针对节点序列,使用对数似然函数,最大化节点序列出现的概率,从而获得最优的嵌入向量;/n基于密度聚类算法对向量模型进行聚类处理,得到所述向量模型中相同簇的嵌入向量;/n基于所述嵌入向量建立所述相同簇的包围圆,并计算所述包围圆的半径值;/n根据所述半径值和边权重计算得到人员亲密度值。/n
【技术特征摘要】
1.一种人员关系分析方法,其特征在于,包括:
获取人与人之间的行为信息,并根据所述行为信息计算得到边权重;
由所述边权重决定在上一节点确定的情况下,不同路径的选择概率,随机采样得到一条节点序列,针对节点序列,使用对数似然函数,最大化节点序列出现的概率,从而获得最优的嵌入向量;
基于密度聚类算法对向量模型进行聚类处理,得到所述向量模型中相同簇的嵌入向量;
基于所述嵌入向量建立所述相同簇的包围圆,并计算所述包围圆的半径值;
根据所述半径值和边权重计算得到人员亲密度值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述行为信息计算得到边权重的步骤,包括:
根据以下算式计算所述边权重:
其中,为两个人员之间的行为频次,kr为行为权重,r为行为种类。
3.根据权利要求1所述的方法,其特征在于,所述由所述边权重决定在上一节点确定的情况下,不同路径的选择概率,随机采样得到一条节点序列,针对节点序列,使用对数似然函数,最大化节点序列出现的概率,从而获得最优的嵌入向量的步骤,包括:
根据所述边权重建立人员关系图,将所述人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在所述人员关系图中代表第i个人员,E为边集合,e(vi,vj)∈E在所述人员关系图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;
根据所述节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式为:
其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率;
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于所述窗口W(i)建立概率公式,其中,所述概率公式的计算算式为:
其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式为:
其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。
4.根据权利要求3所述的方法,其特征在于,所述由所述边权重决定在上一节点确定的情况下,不同路径的选择概率,随机采样得到一条节点序列,针对节点序列,使用对数似然函数,最大化节点序列出现的概率,从而获得最优的嵌入向量的步骤,还包括:
对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式为:
其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;
将所述总目标函数值的映射节点转化为映射向量;
对所述映射向量进行学习得到所述向量模型。
5.根据权利要求1所述的方法,其特征在于,所述基于所述嵌入向量建立所述相同簇的包围圆的步骤,包括:
对嵌入结果使用DBSCAN方法进行聚类,将所有节点划分出多个簇;
对每个簇随机打散簇内所有嵌入点顺序,选取前两个点,这两个点的中心为圆心,欧式距离的一半作为半径,构建最小包围圆;
对剩余点进行无放回抽样,计算抽样点距离圆心半径;<...
【专利技术属性】
技术研发人员:陆韵,李冰,沈俊青,孙云,江易,舒塘皓,郑申俊,
申请(专利权)人:杭州中奥科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。