当前位置: 首页 > 专利查询>西华大学专利>正文

一种面向视频常规评论的情感不稳定用户检测方法技术

技术编号:27030776 阅读:26 留言:0更新日期:2021-01-12 11:13
本发明专利技术公开了一种面向视频常规评论的情感不稳定用户检测方法,包括以下步骤:步骤1,从网站中收集原始数据,筛选出常规评论文本、用户信息与评论时间。步骤2,实现数据的格式化处理,组成常规评论集合。步骤3,汇总网站预置表情包并构建表情对照表,测量常规评论的情感倾向,实现常规评论的情感分析。步骤4,构建时序评论交互网络。步骤5,根据时序的用户间关系,判断用户是否符合情感不稳定用户的定义,从而检测出情感不稳定的用户。本发明专利技术的优点是:在舆情发展初期根据视频中常规评论内容,发现情感易变用户,会为舆情的控制和引导带来许多方便,从而产生良好的社会效益和经济价值。

【技术实现步骤摘要】
一种面向视频常规评论的情感不稳定用户检测方法
本专利技术涉及评论文本分类
,特别涉及一种面向视频常规评论的情感不稳定用户检测方法。
技术介绍
网络视频是人们休闲娱乐方式之一,用户观看完视频后常常采用两种方式发表评论,(1)用户弹幕。(2)在网页的评论区发表常规评论。以此来描述自己的整体观影体验。若是用户在情感差异时间区域内受到相应的影响,基于认知失调理论,用户的情感变化在常规评论区内也会有所体现。用户在评论区内不仅可以阐述自己对视频内容的理解,而且可以与其他用户进行互动,形成用户间评论交互。随着时间的推移,评论互动次数逐渐增加,多次的用户评论互动使用户的情感变化逐渐显现,这是由于用户认知层次的改变导致的用户态度变化。在评论互动中,用户态度的变化可能有两个的原因:(1)不同的用户对视频内容的理解程度不一致,(2)用户早期观看视频时没有相应的知识基础,经过一定时间的基础知识积累,对视频的内容产生了新的认识。通过视频常规评论追踪用户的情感随时间发生的变化,判别评论交互过程中情感发生变化的用户,将其定义为情感不稳定用户。情感不稳定用户在社交网络舆情传播过程中,其对邻居用户的舆情观点有较大的影响,对舆情快速扩散起着不可推波助澜的作用。特别是在视频网站里,用户大多是青少年,其对某个舆情事件的态度最容易受到领域用户的感染。分析网站用户的行为,尤其是情感不稳定用户的行为,能够有效地保证网站拥有积极的网络氛围,有利于用户间交流和网站的发展。通过挖掘引起情感不稳定的主要诱因,可以制定更有针对性的心理疏导方案,能够更好地解决青少年心理问题。根据主要诱因可以有针对性地制定官方宣传文案,消除用户自身的困惑之处,使用户产生正确的认识,保证网络舆论正向积极的发展态势。根据视频网站评论检测存在情感不稳定用户,产生更好的引导策略,目前成为急需解决的问题。现有技术一中国专利技术专利“电影评论观点情感倾向性分析方法”(专利申请号:CN201911082409.1)中提出:处理的数据对象是影评描述信息和评论信息;建立评论观点提取规则,利用提取规则从数据对象中获得观点词与情感词,然后建立评论标签词库与观点情感词库;然后采用人工打标签方法,对各个评论语句进行评论标签类别标记和情感倾向性标记;生成情感分类模型。针对目标影评,利用情感分类自动生成评论标签类别标记和情感倾向性标记。现有技术一的缺点句子级别的情感分析,在视频评论中,一般是短文本评论,一个完整的句子评论是比较少的,常常是一些表情符号,关键词评论短语,所以该专利处理方法未兼顾该类数据对象的处理。评论人的情感往往是随时间的变化而发生改变的,该专利未涉及情感倾向可变化的处理。现有技术二中国专利技术专利“一种基于文档向量的电影评论情感分析方法”(专利申请号:CN201911334017.X)中提出了电影的评论和评论对应的评分训练改进的文档向量模型。将电影的评论输入到该模型得到电影评论的词向量和文档向量,使用基于电影评论生成的特征向量和电影评论对应的评分训练分类模型,对电影评论进行情感分类。现有技术二的缺点处理数据对象必须是文档级,即评论必须是大段文本。未涉及在视频评论中,短文本评论,表情符号,关键词评论短语。也未解决评论人的情感往往是随时间的变化而发生改变的这类问题。
技术实现思路
本专利技术针对现有技术的缺陷,提供了一种面向视频常规评论的情感不稳定用户检测方法,解决了现有技术中存在的缺陷。为了实现以上专利技术目的,本专利技术采取的技术方案如下:一种面向视频常规评论的情感不稳定用户检测方法,包括以下步骤:步骤1,从网站中收集常规评论数据,从原始数据中筛选出常规评论文本、用户信息与评论时间。步骤2,实现数据的格式化处理,组成常规评论集合。常规评论集合GCs(GeneralComments),GCs={GC1,GC2,…,GCn},其中GCi表示第i条常规评论文本,共计n条常规评论文本。每一条常规评论文本都有用户信息(Userinfo)和评论信息(Commentinfo)两个属性,其中Userinfo={Ui1,Ui2,…,Uin},Commentinfo={Ci1Ci2,…,Cin},用户信息包含用户ID等内容,评论信息包含评论时间和评论交互信息等内容,等价表示为GCi(Uii,Cii),i=1,2,...,n。步骤3,汇总网站预置表情包并构建表情对照表,使用FastText方法(JoulinA,GraveE,BojanowskiP,etal.FastText.zip:Compressingtextclassificationmodels[J].arXiv:ComputationandLanguage.2016,1612(3):651-664.)结合表情对照表的方法测量常规评论的情感倾向,实现常规评论的情感分析。步骤4,根据评论信息中的评论交互信息,分析用户评论交互中的两级评论结构,确定用户之间的关系,对应评论交互网络的节点与节点之间的边。评论的情感倾向确定评论交互中用户之间的赞成或反对,对应评论交互网络邻接矩阵的元素,有效地表示节点间的详细关系。再根据评论信息中的评论时间,分析常规评论的生成规律,划分不同的评论时间段,构建时序评论交互网络。步骤5,通过网络表示学习分析时序评论交互网络,得到用户与用户之间的时序关系。根据时序的用户间关系,判断用户是否符合情感不稳定用户的定义,从而检测出情感不稳定的用户。进一步地,步骤2中数据的格式化具体如下:统计分析常规评论数据特性,根据评论性质将常规评论分为主评论、一级评论、二级评论。主评论对应的用户为层主节点。一级评论,是直接跟层主节点进行交互的评论。二级评论并不是直接与层主节点进行互动,且回复的评论是一级评论,评论交互信息包含属性元组<root,parent>,该属性元组中两个字段的数值确定评论对应的级别,对应规则如公式(1)。Root(根节点)和parent(父节点)都为空值,则为层主评论;root和parent都不为空值,并且root和parent数值相等,则为一级评论;root和parent都不为空值,并且root和parent数值不相等,则为二级评论。根据一级评论和二级评论定义,进行数据格式化:设定两个集合,一个是评论用户的集合Ni,另一个是用户之间连接情况的集合Ri,GCs={GC1,GC2,…,GCn}表示n条常规评论的集合。初始化Ni和Ri,即设置两个集合为空集。遍历常规评论集合中的所有评论数据,判断评论的属性元组<root,parent>的字段是否为空值,确定层主评论并将对应的用户添加到Ni,将其相关条目从评论集合中删除。再遍历评论集合剩余的评论数据,判断评论的属性元组<root,parent>的字段数值是否一致,确定一级评论和二级评论,将对应的用户添加到Ni,同时将交互的用户添加到Ri,最终得到Ni和Ri,以此确定评论交互网络中的节点和节点间的连接关系。进一步地,步骤3中常规评本文档来自技高网
...

【技术保护点】
1.一种面向视频常规评论的情感不稳定用户检测方法,其特征在于,包括以下步骤:/n步骤1,从网站中收集常规评论数据,从原始数据中筛选出常规评论文本、用户信息与评论时间;/n步骤2,实现数据的格式化处理,组成常规评论集合;常规评论集合GCs(GeneralComments),GCs={GC

【技术特征摘要】
1.一种面向视频常规评论的情感不稳定用户检测方法,其特征在于,包括以下步骤:
步骤1,从网站中收集常规评论数据,从原始数据中筛选出常规评论文本、用户信息与评论时间;
步骤2,实现数据的格式化处理,组成常规评论集合;常规评论集合GCs(GeneralComments),GCs={GC1,GC2,…,GCn},其中GCi表示第i条常规评论文本,共计n条常规评论文本;每一条常规评论文本都有用户信息(Userinfo)和评论信息(Commentinfo)两个属性,其中Userinfo={Ui1,Ui2,…,Uin},Commentinfo={Ci1Ci2,…,Cin},用户信息包含用户ID等内容,评论信息包含评论时间和评论交互信息等内容,等价表示为GCi(Uii,Cii),i=1,2,...,n;
步骤3,汇总网站预置表情包并构建表情对照表,使用FastText方法结合表情对照表的方法测量常规评论的情感倾向,实现常规评论的情感分析;
步骤4,根据评论信息中的评论交互信息,分析用户评论交互中的两级评论结构,确定用户之间的关系,对应评论交互网络的节点与节点之间的边;评论的情感倾向确定评论交互中用户之间的赞成或反对,对应评论交互网络邻接矩阵的元素,有效地表示节点间的详细关系;再根据评论信息中的评论时间,分析常规评论的生成规律,划分不同的评论时间段,构建时序评论交互网络;
步骤5,通过网络表示学习分析时序评论交互网络,得到用户与用户之间的时序关系;根据时序的用户间关系,判断用户是否符合情感不稳定用户的定义,从而检测出情感不稳定的用户。


2.根据权利要求1所述的一种面向视频常规评论的情感不稳定用户检测方法,其特征在于:步骤2中数据的格式化具体如下:
统计分析常规评论数据特性,根据评论性质将常规评论分为主评论、一级评论、二级评论;
主评论对应的用户为层主节点;一级评论,是直接跟层主节点进行交互的评论;二级评论并不是直接与层主节点进行互动,且回复的评论是一级评论,
评论交互信息包含属性元组<root,parent>,该属性元组中两个字段的数值确定评论对应的级别,对应规则如公式(1);Root(根节点)和parent(父节点)都为空值,则为层主评论;root和parent都不为空值,并且root和parent数值相等,则为一级评论;root和parent都不为空值,并且root和parent数值不相等,则为二级评论;



根据一级评论和二级评论定义,进行数据格式化:设定两个集合,一个是评论用户的集合Ni,另一个是用户之间连接情况的集合Ri,GCs={GC1,GC2,…,GCn}表示n条常规评论的集合;初始化Ni和Ri,即设置两个集合为空集;遍历常规评论集合中的所有评论数据,判断评论的属性元组<root,parent>的字段是否为空值,确定层主评论并将对应的用户添加到Ni,将其相关条目从评论集合中删除;再遍历评论集合剩余的评论数据,判断评论的属性元组<root,parent>的字段数值是否一致,确定一级评论和二级评论,将对应的用户添加到Ni,同时将交互的用户添加到Ri,最终得到Ni和Ri,以此确定评论交互网络中的节点和节点间的连接关系。


3.根据权利要求1所述的一种面向视频常规评论的情感不稳定用户检测方法,其特征在于:步骤3中常规评论情感分析具体如下:
首先从视频网站收集网站预置的表情包,将表情包与对应的文字描述汇总,构建表情对照表,利用表情对照表将常规评论数据中的表情转换为文字;再根据表情对照表对标注的常规评论进行预处理,通过FastText训练情感倾向分类模型;最后根据表情对照表预处理待分析的常规评论,通过情感倾向分类模型预测待分析的常规评论情感倾向。


4.根据权...

【专利技术属性】
技术研发人员:杜亚军李若淼赵飞宇
申请(专利权)人:西华大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1