【技术实现步骤摘要】
一种面向视频常规评论的情感不稳定用户检测方法
本专利技术涉及评论文本分类
,特别涉及一种面向视频常规评论的情感不稳定用户检测方法。
技术介绍
网络视频是人们休闲娱乐方式之一,用户观看完视频后常常采用两种方式发表评论,(1)用户弹幕。(2)在网页的评论区发表常规评论。以此来描述自己的整体观影体验。若是用户在情感差异时间区域内受到相应的影响,基于认知失调理论,用户的情感变化在常规评论区内也会有所体现。用户在评论区内不仅可以阐述自己对视频内容的理解,而且可以与其他用户进行互动,形成用户间评论交互。随着时间的推移,评论互动次数逐渐增加,多次的用户评论互动使用户的情感变化逐渐显现,这是由于用户认知层次的改变导致的用户态度变化。在评论互动中,用户态度的变化可能有两个的原因:(1)不同的用户对视频内容的理解程度不一致,(2)用户早期观看视频时没有相应的知识基础,经过一定时间的基础知识积累,对视频的内容产生了新的认识。通过视频常规评论追踪用户的情感随时间发生的变化,判别评论交互过程中情感发生变化的用户,将其定义为情感不稳定用户。情感不稳定用户在社交网络舆情传播过程中,其对邻居用户的舆情观点有较大的影响,对舆情快速扩散起着不可推波助澜的作用。特别是在视频网站里,用户大多是青少年,其对某个舆情事件的态度最容易受到领域用户的感染。分析网站用户的行为,尤其是情感不稳定用户的行为,能够有效地保证网站拥有积极的网络氛围,有利于用户间交流和网站的发展。通过挖掘引起情感不稳定的主要诱因,可以制定更有针对性的心理疏导方案,能够更好地解决 ...
【技术保护点】
1.一种面向视频常规评论的情感不稳定用户检测方法,其特征在于,包括以下步骤:/n步骤1,从网站中收集常规评论数据,从原始数据中筛选出常规评论文本、用户信息与评论时间;/n步骤2,实现数据的格式化处理,组成常规评论集合;常规评论集合GCs(GeneralComments),GCs={GC
【技术特征摘要】
1.一种面向视频常规评论的情感不稳定用户检测方法,其特征在于,包括以下步骤:
步骤1,从网站中收集常规评论数据,从原始数据中筛选出常规评论文本、用户信息与评论时间;
步骤2,实现数据的格式化处理,组成常规评论集合;常规评论集合GCs(GeneralComments),GCs={GC1,GC2,…,GCn},其中GCi表示第i条常规评论文本,共计n条常规评论文本;每一条常规评论文本都有用户信息(Userinfo)和评论信息(Commentinfo)两个属性,其中Userinfo={Ui1,Ui2,…,Uin},Commentinfo={Ci1Ci2,…,Cin},用户信息包含用户ID等内容,评论信息包含评论时间和评论交互信息等内容,等价表示为GCi(Uii,Cii),i=1,2,...,n;
步骤3,汇总网站预置表情包并构建表情对照表,使用FastText方法结合表情对照表的方法测量常规评论的情感倾向,实现常规评论的情感分析;
步骤4,根据评论信息中的评论交互信息,分析用户评论交互中的两级评论结构,确定用户之间的关系,对应评论交互网络的节点与节点之间的边;评论的情感倾向确定评论交互中用户之间的赞成或反对,对应评论交互网络邻接矩阵的元素,有效地表示节点间的详细关系;再根据评论信息中的评论时间,分析常规评论的生成规律,划分不同的评论时间段,构建时序评论交互网络;
步骤5,通过网络表示学习分析时序评论交互网络,得到用户与用户之间的时序关系;根据时序的用户间关系,判断用户是否符合情感不稳定用户的定义,从而检测出情感不稳定的用户。
2.根据权利要求1所述的一种面向视频常规评论的情感不稳定用户检测方法,其特征在于:步骤2中数据的格式化具体如下:
统计分析常规评论数据特性,根据评论性质将常规评论分为主评论、一级评论、二级评论;
主评论对应的用户为层主节点;一级评论,是直接跟层主节点进行交互的评论;二级评论并不是直接与层主节点进行互动,且回复的评论是一级评论,
评论交互信息包含属性元组<root,parent>,该属性元组中两个字段的数值确定评论对应的级别,对应规则如公式(1);Root(根节点)和parent(父节点)都为空值,则为层主评论;root和parent都不为空值,并且root和parent数值相等,则为一级评论;root和parent都不为空值,并且root和parent数值不相等,则为二级评论;
根据一级评论和二级评论定义,进行数据格式化:设定两个集合,一个是评论用户的集合Ni,另一个是用户之间连接情况的集合Ri,GCs={GC1,GC2,…,GCn}表示n条常规评论的集合;初始化Ni和Ri,即设置两个集合为空集;遍历常规评论集合中的所有评论数据,判断评论的属性元组<root,parent>的字段是否为空值,确定层主评论并将对应的用户添加到Ni,将其相关条目从评论集合中删除;再遍历评论集合剩余的评论数据,判断评论的属性元组<root,parent>的字段数值是否一致,确定一级评论和二级评论,将对应的用户添加到Ni,同时将交互的用户添加到Ri,最终得到Ni和Ri,以此确定评论交互网络中的节点和节点间的连接关系。
3.根据权利要求1所述的一种面向视频常规评论的情感不稳定用户检测方法,其特征在于:步骤3中常规评论情感分析具体如下:
首先从视频网站收集网站预置的表情包,将表情包与对应的文字描述汇总,构建表情对照表,利用表情对照表将常规评论数据中的表情转换为文字;再根据表情对照表对标注的常规评论进行预处理,通过FastText训练情感倾向分类模型;最后根据表情对照表预处理待分析的常规评论,通过情感倾向分类模型预测待分析的常规评论情感倾向。
4.根据权...
【专利技术属性】
技术研发人员:杜亚军,李若淼,赵飞宇,
申请(专利权)人:西华大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。