微博中针对大宗商品舆情信息的恶意主体识别方法技术

技术编号：34339013 阅读：17 留言：0更新日期：2022-07-31 03:32

本发明专利技术提出了一种微博平台上针对大宗商品舆情信息的基于用户行为特征的识别恶意主体的方法，首先选定源头节点搜集转发信息构建舆情传播网络，根据网络中用户的关注信息构建用户关注关系图，随后使用社区发现算法对关注关系图进行划分，选择其中密度最高的团体作为后续待检测样本，接着搜集待检测样本用户从最近日期起的N条微博，构建用户行为特征，最后使用聚类算法根据行为特征将待检测样本聚成两类，计算特征在每一类中的均值，进行标准化后相加得到综合属性值，判定属性值较大的一方为存在恶意倾向的维权用户。本发明专利技术不依赖于已标识的数据集，减少了人工因素对最终结果的影响，且识别结果取决于用户本身的行为，具有更高的适应性与灵活性。高的适应性与灵活性。高的适应性与灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
微博中针对大宗商品舆情信息的恶意主体识别方法

[0001]本专利技术涉及一种微博平台中针对大宗商品舆情信息的恶意主体识别技术，属于大宗商品电子商务监管

技术介绍

[0002]随着大宗商品交易的蓬勃发展，投资者密切关注交易所中大宗商品交易实况，互联网社交平台中相关信息日益增多，影响力也逐渐扩大。我国大宗商品市场正向专业化、规范化方向转型升级，但仍然存在一些问题，部分交易所出现非法集资、仓单造假、违规挪用保证金等乱象，致使信用危机频发。如果不能及时处理这些问题引发的负面舆情，经过传播和放大后易酿成危机事件，从而又将加重舆情的消极影响，陷入不断恶化的循环。除了由于交易所自身问题导致的负面舆情，恶意维权同样是交易所负面舆情的一大来源。这类敲诈勒索式恶意维权事件不仅引发网络暴力，更严重干扰了各交易所的正常运营，对其声誉信誉造成了极大的损害。因此，对各交易所而言，需要及时发现与己相关的舆情信息，识别事件中的恶意主体，避免或减少舆情事件对其造成的影响。
[0003]在开放性较高的社交平台中，各个大宗商品交易所的舆情信息，除少量官方发布外，普通用户的发布占比更多，而相比于开放性较低的社交平台，普通用户在高开放性的平台中发布的交易所的舆情大多关于投资亏损的发泄或维权。普通用户的个人力量大多有限，因此常倾向于选择与有相似近况的人聚集抱团维权以扩散事件的影响力，所以维权团体之间大多会互相关注以便及时联系。通常，为了达到增加热度的效果，恶意维权用户会不断地转发含交易所相关信息的微博并在微博中添加多种标签，甚至会对同一条微博...

【技术保护点】

【技术特征摘要】
1.一种微博平台中针对大宗商品舆情信息的恶意主体识别方法，其特征在于：该方法包括以下步骤：步骤(1)：舆情传播网络与用户关注关系图构建；步骤(2)：用户关注关系图中维权团体社区发现；步骤(3)：用户行为特征构建步骤(4)：聚类与恶意主体识别。2.根据权利要求1所述的一种微博平台中针对大宗商品舆情信息的恶意主体识别方法，其特征在于：步骤(1)中，首先根据交易所名称和简称搜集相关的舆情信息，选择源头节点，搜集转发数据，构建舆情传播网络：以用户为节点，若两个用户之间存在转发关系，则在两者之间形成一条边。随后针对舆情传播网络中的节点，搜集其相互之间的关注关系，构建用户关注关系图：以用户为节点，若两个用户之间存在关注关系，则在两者之间形成一条边，从关注者指向被关注者。3.根据权利要求1所述的一种微博平台中针对大宗商品舆情信息的恶意主体识别方法，其特征在于：步骤(2)中，维权团体通常互相关注以便能够及时联系，其所在社区密度高于普通用户，本文进行社区发现算法选取密度最高的团体作为后续样本；首先选取入度和出度之和最高的节点作为中心节点，若度数之和最高的节点有多个则随机选择一个；计算该中心节点的邻居节点与其的相似度，选取相似度最高的邻居节点与中心节点构成初始社区，若相似度最高的邻居节点有多个则全部选择；接着对社区的邻居节点计算其与社区内节点的平均相似度，选择值最大的节点作为候选节点，并计算若加入形成新社区的模块度增益，如果增益大于等于0则将其加入社区，若有多个平均相似度最高的节点则依次进行上述判断；重复上述过程直至每个节点都属于某个社区；划分完社区后，计算每个社区的密度，选取密度最高的社区作为后续待检测样本。4.根据权利要求3所述的一种微博平台中针对大宗商品舆情信息的恶意主体识别方法，其特征在于：所述步骤(2)中任意两个节点i和节点j的相似度计算公式如下：I(i,j)＝neighbour(i)∩neighbour(j)U(i,j)＝neighbour(i)∪neighbour(j)其中，i和j是用户关注关系图中的任意两个节点，Similarity(i,j)为节点i和j的相似度，neighbour(i)为节点i的邻居节点，I(i,j)是节点i和节点j的邻居节点的交集，U(i,j)是节点i和节点j的邻居节点的并集，ExchangeNameRate
k
为节点k在N条微博中含交易所名的微博所占比例；模块度增益的计算公式如下：
化简可得：其中，Σ
C
为社区内部的边数，为社区内部节点指向节点k的边数，为社区外部节点指向社区内部节点的边数，为社区内部节点指向社区外部节点的边数，为关系图中节点指向节点k的边数，为节点k指向关系图中节点的边数，m为关系图中所有边数；社区密度的计算公式如下：其中，N
c
为某个社区c包含的节点数，S
c
为该社区中实际存在的边数。5.根据权利要求1所述的一种微博平台中针对大宗商品舆情信息的恶意主体识别方法，其特征在于：步骤(3)中，对于识别出的维权团体，搜集团体内每个用户从最近日期开始的N条微博；结合大宗商品舆情信息对其进行如下行为特征构建：交易所名频繁度：其中，Num
en
为N条微博内含交易所名称或简称的微博数；交易所...

【专利技术属性】
技术研发人员：蒋嶷川，刘婷，狄凯，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人