一种网络个体或群体情绪认知能力预测与可视化方法技术

技术编号：11471811 阅读：129 留言：0更新日期：2015-05-20 01:32

本发明专利技术涉及一种网络个体或群体情绪认知能力预测与可视化方法，属于互联网舆情信息挖掘与分析领域。本发明专利技术对现有情感词典中收录的常用情感词做了整合，同时考虑了网络环境中具有情感倾向的网络情感新词及表情字符，最大限度地包含了社交媒体平台上的情感元素，并在此基础上构建了情感词本体库；确定网络个体情绪分叉点位置，用情绪认知能力指数描述网络个体的情绪认知能力水平，并以可视化的方式对多个网络个体之间的情绪分叉点差异进行展示。通过本发明专利技术可揭示网络个体或群体情绪认知能力水平的演化规律，尤其是对典型网络个体或群体的情绪动态变化过程及其情绪突变的临界点进行预测，帮助相关管理者对网络舆论进行合理引导，营造和谐网络环境。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络个体或群体情绪认知能力预测与可视化方法
本专利技术涉及一种网络个体或群体情绪认知能力预测与可视化方法，属于互联网舆情信息挖掘与分析领域。
技术介绍
随着社交网络技术和应用的快速发展，人们越来越习惯于通过互联网分享自己的情感、态度、意见和观点，其中情感是主导后三者的决定力量，因为情感是人们内在的心理反应及感受，例如喜、怒、哀、乐等，它会显著地影响人们的决策行为。与此同时，拥有一定意见引导能力和话题响应度的网络个体更是通过网络平台对其跟随者的观点态度造成影响。例如，在电影营销活动中，知名艺人往往通过网络平台(包括微博、博客等)对其粉丝的情感观点甚至意见表达造成很大影响。同样，微博“大V”、名人博客等作为一种典型网络个体往往拥有千万级数量的粉丝跟随者，在网络事件中拥有较高话语权且在较高程度上影响着公众情绪和决策行为的方向，扮演“意见领袖”的角色。因此，对网络个体或群体情绪动态变化过程及其情绪分叉点的预测可视化工具的研制具有十分重要的意义。从商业角度而言，可通过监测网络个体情绪动态变化过程的规律制定有效的营销推广方案，并根据产品销售后网络群体情绪动态变化的情况及时完善产品和进行口碑维护。从社会治理角度而言，可通过分析网络个体或群体、尤其是典型网络个体或群体的情绪动态变化过程及其情绪突变的分叉点预测，帮助管理者对网络用户进行有效管理，并对网络舆论进行合理引导，营造和谐网络环境。LiY等提出复杂理论与情绪结构在组织环境中的动态变化建模方法(LiY，AshkanasyNM，AhlstromD.Complexitytheoryandaffectstructure：...
一种网络个体或群体情绪认知能力预测与可视化方法

【技术保护点】
一种网络个体或群体情绪认知能力预测与可视化方法，其特征在于：包括以下步骤：步骤1)构建可整合多来源情感词的本体库；步骤2)确定网络个体情绪分叉点位置，根据按时间序列采集的网络个体发表的文本信息集计算其情绪认知能力指数序列；步骤3)对步骤2)得到的情绪认知能力指数序列进行可视化；步骤4)对多个网络个体的情绪认知能力指数水平进行对比分析。

【技术特征摘要】
1.一种网络个体或群体情绪认知能力预测与可视化方法，其特征在于：包括以下步骤：步骤1)构建可整合多来源情感词的本体库；步骤2)确定网络个体情绪分叉点位置，根据按时间序列采集的网络个体发表的文本信息集计算其情绪认知能力指数序列；步骤3)对步骤2)得到的情绪认知能力指数序列进行可视化；步骤4)对多个网络个体的情绪认知能力指数水平进行对比分析；所述步骤1)构建情感词本体库，进一步包括以下步骤：步骤1-1)将现有中文情感词典中的常用情感词以及从语料集中筛选出的网络情感新词和表情符号合并得到情感元素集；步骤1-2)对所述情感元素集中的每个词Wi确定情感强度Ii并进行情感极性标注Pi；步骤1-3)筛选出情感强度Ii超过阈值的词Wi，将词Wi与其情感极性Pi和情感强度Ii作为三元组加入情感词本体库E，得到E为：E＝＜(W1，P1，I1)，(W2，P2，I2)，...，(Wi，Pi，Ii)，...，(Wn，Pn，In)＞；所述步骤1-2)进一步包括以下步骤：步骤1-2-1)情感极性标注：常用情感词的极性Pi与情感词典中的极性一致，如发生同一情感词在不同情感词典中的标注不一致的情形，使用多人投票方式修正；网络情感新词与表情符号由于数量有限，其极性均采用多人投票方式确定；步骤1-2-2)情感强度确定：(1)常用情感词的情感强度确定：首先获取大规模社交网络文本集U，然后根据下式计算常用情感词w*的情感强度：I(w*)＝r(w*|S负)-r(w*|S正)其中S正和S负分别表示在社交网络文本集U中的正情感词和负情感词集合，r(w*|S正)表示w*的正向情感权重，r(w*|S负)表示w*的负向情感权重，情感权重通过下式计算；其中S*表示S正或者S负，α、β∈[0，1]是组合调整参数，Ci是w*的第i个字，w*中共有k个字，P(Ci|S*)及P(w*)则可通过下式计算：其中Freq(S*，Ci)表示属于S*的词的组成字Ci在U中出现的频率，Freq(S*)表示属于S*的所有组成字在U中出现的频率之和；δ为一个较小的数值；其中Freq(w*)表示w*在U中出现的频率，|U|表示U中词的个数，表示U中所有的词wi在U中出现的频率之和；(2)常用情感词的情感极性修正：当情感强度I大于0，表示正情感，情感极性P＝+1；当情感强度I小于0，表示负情感，情感极性P＝-1；(3)网络情感新词与表情符号由于数量有限，其情感强度均在参考常用情感词强度基础上采用多人投票方式确定；所述δ为S*总字数的倒数。2.根据权利要求1所述的一种网络个体或群体情绪认知能力预测与可视化方法，其特征在于：所述步骤2)进一步包括以下步骤：步骤2-1)按时间序列采集网络个体发表的文本信息集合U：其中T为时间序列，S为与T对应的文本信息向量集，t时刻发表的微博信息为St；步骤2-2)对所述文本信息集U进行分词和词性标注预处理，得到1～T时刻发表的所有微博信息S1～ST的词汇集W1～WT，其中t时刻发表的微博信息St的词汇集记为Wt；步骤2-3)通过对每一条微博信息的词汇集Wt(1≤t≤T)中的词逐一与情感词本体库E匹配，抽取其中的情感词及其情感极性和情感强度值，此时Wti表示St中包含的第i个情感词，Numt表示Wt中包含的情感词的个数；步骤2-4)构建网络个体情感分叉点位置计算模型并计算网络个体按时序变化的网络情绪认知能力指数值，具体如下：步骤2-4-1)通过下式分别计算St中包含的对应于“均衡态”，“...

【专利技术属性】
技术研发人员：周建栋，赵燕平，张华平，李想，
申请(专利权)人：北京理工大学，北京化工大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人