基于眼动仪的高质量用户生成内容的识别方法和系统技术方案

技术编号：28980045 阅读：22 留言：0更新日期：2021-06-23 09:26

本发明专利技术提供了一种基于眼动仪的高质量用户生成内容的识别方法和系统，涉及用户生成内容分类技术领域。本发明专利技术利用眼动仪获取注视区域，并根据注视区域对文章进行重排版，重排版后的字符更加适配使用场景，能够使后续阅读时长的计时更加准确。用户打开文章浏览页面后，通过眼动仪实时获取用户的注视区域，并计算注视区域在各个段落显示区域的停留时长作为段落的阅读时长，再基于所述停留时长，计算文章的评论的可信值B，基于可信值筛选高质量评论；同时基于所述高质量评论，计算文章的质量值Q，基于质量值筛选高质量文章，使机器人和水军的评论不会被收入评判数据，最终实现高准确度的高质量用户生成内容的识别。

全部详细技术资料下载

【技术实现步骤摘要】
基于眼动仪的高质量用户生成内容的识别方法和系统
本专利技术涉及用户生成内容分类
，具体涉及一种基于眼动仪的高质量用户生成内容的识别方法和系统。
技术介绍
随着互联网技术的高速发展和社交媒体的广泛应用，越来越多的虚拟社区建立起来，由用户创造传播的信息在网络社会中发挥着越来越重要的作用，用户生成内容(UGC，User-GeneratedContent)成为了Web2.0环境下众多学者的研究热点。但UGC信息质量良莠不齐，需要投入大量的时间和精力才能从中寻找出高质量的UGC信息。现有的UGC质量研究通常仅基于信息质量和用户属性进行识别。但上述方法无法很好应对水军、机器人等问题，导致高质量用户生成内容的识别准确度不高。
技术实现思路
(一)解决的技术问题针对现有技术的不足，本专利技术提供了一种基于眼动仪的高质量用户生成内容的识别方法和系统，解决了现有高质量用户生成内容识别方法无法很好应对水军、机器人的问题。(二)技术方案为实现以上目的，本专利技术通过以下技术方案予以实现：第一方面，提供了一种基于眼动仪的高质量用户生成内容的识别方法，该方法包括：基于上传的文章，获取所述文章的段落信息其中，表示第n个段落的字符信息，N表示文章的总段落数量；基于眼动仪获取的注视区域，计算各个段落的重排版信息Set＝{s1,s2,…,sn,…,sN}；其中，表示第n个段落的重排版信息，dp表示段落间距，sizeword表示字符尺寸，numcpl表示每行...

【技术保护点】
1.一种基于眼动仪的高质量用户生成内容的识别方法，其特征在于，该方法包括：/n基于上传的文章，获取所述文章的段落信息

【技术特征摘要】
1.一种基于眼动仪的高质量用户生成内容的识别方法，其特征在于，该方法包括：
基于上传的文章，获取所述文章的段落信息其中，表示第n个段落的字符信息，N表示文章的总段落数量；
基于眼动仪获取的注视区域，计算各个段落的重排版信息Set＝{s1,s2,…,sn,…,sN}；
其中，表示第n个段落的重排版信息，dp表示段落间距，sizeword表示字符尺寸，numcpl表示每行预设字符数，表示第n个段落的行数，表示第n个段落的显示尺寸；
基于各个段落的重排版信息，对所述文章进行重排版；
基于重排版后的文章，生成包含多个段落的段落显示区域的文章浏览页面；所述段落显示区域包括第n个段落在显示设备上的位置及尺寸信息；
用户打开文章浏览页面后，眼动仪实时获取用户的注视区域，并计算注视区域在各个段落显示区域的停留时长其中，表示注视区域在第n个段落的段落显示区域的停留时长；
基于所述停留时长，计算文章的评论的可信值B，将所述可信值高于第一预设阈值的评论标记为高质量评论；
基于所述高质量评论，计算文章的质量值Q，并将所述质量值大于第二预设阈值的文章标记为高质量文章。

2.如权利要求1所述的一种基于眼动仪的高质量用户生成内容的识别方法，其特征在于，基于眼动仪获取的注视区域，计算第n个段落的重排版信息包括：
对注视区域进行圆拟合，获取注视区域的中心和直径R；设置字符尺寸sizeword中的字符高度pixelh≥R；段落间距dp≥R；
对于任意段落，基于字符尺寸sizeword，计算每行预设字符数numcpl；
基于每行预设字符数numcpl和段落字符数计算段落的行数
基于行间距dline、字符尺寸sizeword、每行预设字符数numcpl和段落的行数计算段落的显示尺寸

3.如权利要求2所述的一种基于眼动仪的高质量用户生成内容的识别方法，其特征在于，所述每行预设字符数numcpl的计算方法为：

所述段落的行数的计算方法为：

所述计算段落的显示尺寸的计算方法为：

其中，pixelline表示每行像素数，pixelh和pixelw分别表示字符尺寸sizeword中的字符高度和宽度，和分别表示段落的显示尺寸中的宽度和高度，dline表示行间距。

4.如权利要求1所述的一种基于眼动仪的高质量用户生成内容...

【专利技术属性】
技术研发人员：谷炜，张婷婷，金家华，石美珠，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人