一种关键通讯节点识别方法、装置及介质制造方法及图纸

技术编号:23986592 阅读:41 留言:0更新日期:2020-04-29 13:50
本发明专利技术提供了一种关键通讯节点识别方法、装置及存储介质,该方法包括:基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;将重点通讯节点和共同通讯节点进行合并组成核心人员集合;基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。本发明专利技术对所有通讯节点进行逐级递进式的分析,进而自动发现处于塔尖的关键通讯节点,其发现关键通讯节点的效率高。

A key communication node identification method, device and medium

【技术实现步骤摘要】
一种关键通讯节点识别方法、装置及介质
本专利技术涉及人工智能
,特别是一种关键通讯节点识别方法、装置及介质。
技术介绍
目前社交软件成为各种网络活动的重要工具和阵地,各类社交软件和即时通信工具,与移动互联网相结合,已经成为当今互联网的主旋律,其传播快、影响大、覆盖广、社会动员能力强等特点,使社交软件成为网络违法行为的常用工具,许多专业化的违法团伙利用社交软件组织和实施违法活动,而且上下线关系庞大复杂,严重影响社会的稳定,威胁着国家安全。在当前的手机取证产品中,缺乏有效的手段提取关键通讯节点等线索信息,导致在调查组织架构复杂的违法行为过程中,无法快速定位到关键线索,经常面临追踪难、调查难的困境。此外,为了提高用户体验,需要将参与同一话题的通讯人员提取出来,比如参与购买同一商品的人员,这样可以方便商家向这些用户推荐商品,并提供团购优惠等等,也可以是一起讨论某项违法活动的人员等等,方便国家机关将这些人员控制。由于社交软件覆盖着工作、生活等方方面面的应用,各种应用层出不穷,每把手机都会存储大量的社交群体信息,通过人工方式去发现和识别实施违法行为的关键通讯节点的信息,费时费力,难以满足实际需要。
技术实现思路
本专利技术针对上述现有技术中的缺陷,提出了如下技术方案。一种关键通讯节点识别方法,该方法包括:重点通讯节点确定步骤,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;共同通讯节点确定步骤,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;核心集合生成步骤,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;关键通讯节点确定步骤,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。更进一步地,所述重点通讯节点确定步骤包括:提取每个群体的群成员分布和发言内容,使用语义分析模型基于发言内容确定交流场景;对每个群体的成员的发言内容涉及的活动类型进行分析,当某一群中同一活动类型的成员≧n个时,则将该成员之间的通讯关系加到该活动类型的聚类;对活动类型的聚类中的通讯关系涉及的人员标记重点通讯节点的标签。更进一步地,所述语义分析模型的构建步骤包括:导入某一类型人员的通联内容,搭建训练语义分析模型;提取所述通联内容中各关键词出现的次数和比重,得到关键词的权重及分布概率,结合人工标注方式得到训练语义分析模型的正反样本;将新的样本再加入训练语义分析模型,调整关键词的权重和分布概率的阀值,对训练语义分析模型进行循环训练,得到训练好的训练语义分析模型。更进一步地,所述共同通讯节点确定步骤包括:统计每个群中的成员数、参与同一话题的人员数、活跃成员数、同一话题的分布地域数及最后发言时间距离系统日期的天数;利用加权计算法计算群体的重要性,如果计算群体的重要性超过第一阈值,则群中的参与同一话题的人员为共同通讯节点,其中:群体的重要性=(k1*a1+k2*a2+k3*a3+k4*a4)/(k1+k2+k3+k4),k1为参与同一话题的人员数,a1为k1的权重,k2为活跃成员数,a2为k2的权重,k3为群成员的分布地域数,a3为k3的权重,k4为最后发言时间距离系统日期的天数,a4为k4的权重。更进一步地,所述关键通讯节点确定步骤包括:计算核心人员集合中的人员重要性,如果重要性是否低于第二阈值,如果是,则该人员的通讯节点不是关键通讯节点,如过否,则该人员为核心人员;其中:X代表身份类型,Y代表活跃度,L代表发言内容次数,Z代表加入群数,i、m为为整数;利用加权计算法计算核心人员的可信度,如果可信度超过第三阈值,则将该核心人员标记关键通讯节点的标签。其中,核心人员的可信度=(X*w1+Y*w2+L*w3+Z*w4)/(X+Y+L+Z),w1、w2、w3、w4为权重。本专利技术还提出了一种关键通讯节点识别装置,该装置包括:重点通讯节点确定单元,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;共同通讯节点确定单元,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;核心集合生成单元,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;关键通讯节点确定单元,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。更进一步地,所述重点通讯节点确定单元执行的操作包括:提取每个群体的群成员分布和发言内容,使用语义分析模型基于发言内容确定交流场景;对每个群体的成员的发言内容涉及的活动类型进行分析,当某一群中同一活动类型的成员≧n个时,则将该成员之间的通讯关系加到该活动类型的聚类;对活动类型的聚类中的通讯关系涉及的人员标记重点通讯节点的标签。更进一步地,所述语义分析模型的构建单元执行的操作包括:导入某一类型人员的通联内容,搭建训练语义分析模型;提取所述通联内容中各关键词出现的次数和比重,得到关键词的权重及分布概率,结合人工标注方式得到训练语义分析模型的正反样本;将新的样本再加入训练语义分析模型,调整关键词的权重和分布概率的阀值,对训练语义分析模型进行循环训练,得到训练好的训练语义分析模型。更进一步地,所述共同通讯节点确定单元执行的操作包括:统计每个群中的成员数、参与同一话题的人员数、活跃成员数、同一话题的分布地域数及最后发言时间距离系统日期的天数;利用加权计算法计算群体的重要性,如果计算群体的重要性超过第一阈值,则群中的参与同一话题的人员为共同通讯节点,其中:群体的重要性=(k1*a1+k2*a2+k3*a3+k4*a4)/(k1+k2+k3+k4),k1为参与同一话题的人员数,a1为k1的权重,k2为活跃成员数,a2为k2的权重,k3为群成员的分布地域数,a3为k3的权重,k4为最后发言时间距离系统日期的天数,a4为k4的权重。更进一步地,所述关键通讯节点确定单元执行的操作包括:计算核心人员集合中的人员重要性,如果重要性是否低于第二阈值,如果是,则该人员的通讯节点不是关键通讯节点,如过否,则该人员为核心人员;其中:X代表身份类型,Y代表活跃度,L代表发言内容次数,Z代表加入群数,i、m为为整数;利用加权计算法计算核心人员的可信度,如果可信度超过第三阈值,则将该核心人员标记关键通讯节点的标签。其中,核心人员的可信度=(X*w1+Y*w2+L*w3+Z*w4)/(X+Y+L+Z),w1、w2、w3、w4为权重。本专利技术还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代码本文档来自技高网...

【技术保护点】
1.一种关键通讯节点识别方法,其特征在于,该方法包括:/n重点通讯节点确定步骤,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;/n共同通讯节点确定步骤,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;/n核心集合生成步骤,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;/n关键通讯节点确定步骤,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。/n

【技术特征摘要】
1.一种关键通讯节点识别方法,其特征在于,该方法包括:
重点通讯节点确定步骤,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;
共同通讯节点确定步骤,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;
核心集合生成步骤,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;
关键通讯节点确定步骤,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。


2.根据权利要求1所述的方法,其特征在于,所述重点通讯节点确定步骤包括:
提取每个群体的群成员分布和发言内容,使用语义分析模型基于发言内容确定交流场景;
对每个群体的成员的发言内容涉及的活动类型进行分析,当某一群中同一活动类型的成员≧n个时,则将该成员之间的通讯关系加到该活动类型的聚类;
对活动类型的聚类中的通讯关系涉及的人员标记重点通讯节点的标签。


3.根据权利要求2所述的方法,其特征在于,所述语义分析模型的构建步骤包括:
导入某一类型人员的通联内容,搭建训练语义分析模型;
提取所述通联内容中各关键词出现的次数和比重,得到关键词的权重及分布概率,结合人工标注方式得到训练语义分析模型的正反样本;
将新的样本再加入训练语义分析模型,调整关键词的权重和分布概率的阀值,对训练语义分析模型进行循环训练,得到训练好的训练语义分析模型。


4.根据权利要求3所述的方法,其特征在于,所述共同通讯节点确定步骤包括:
统计每个群中的成员数、参与同一话题的人员数、活跃成员数、同一话题的分布地域数及最后发言时间距离系统日期的天数;
利用加权计算法计算群体的重要性,如果计算群体的重要性超过第一阈值,则群中的参与同一话题的人员为共同通讯节点,其中:
群体的重要性=(k1*a1+k2*a2+k3*a3+k4*a4)/(k1+k2+k3+k4),k1为参与同一话题的人员数,a1为k1的权重,k2为活跃成员数,a2为k2的权重,k3为群成员的分布地域数,a3为k3的权重,k4为最后发言时间距离系统日期的天数,a4为k4的权重。


5.根据权利要求4所述的方法,其特征在于,所述关键通讯节点确定步骤包括:
计算核心人员集合中的人员重要性,如果重要性是否低于第二阈值,如果是,则该人员的通讯节点不是关键通讯节点,如过否,则该人员为核心人员;
其中:X代表身份类型,Y代表活跃度,L代表发言内容次数,Z代表加入群数,i、m为为整数;
利用加权计算法计算核心人员的可信度,如果可信度超过第三阈值,则将该核心人员标记关键通讯节点的标签。
其中,核心人员的可信度=(X*w1+Y*w2+L*w3+Z*w4)/(X+Y+L+Z),w1、w2、w3、w4为权重。


6.一种关键通讯节点识别装置,其特征在于,该装置包括:
重点通讯节点确定单元,基于通讯...

【专利技术属性】
技术研发人员:林文楷吴文王国威王海滨鄢小征王兵
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1