System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多模态内容的多样性信息推荐方法技术_技高网
当前位置: 首页 > 专利查询>贵州大学专利>正文

基于多模态内容的多样性信息推荐方法技术

技术编号:43123717 阅读:10 留言:0更新日期:2024-10-26 10:02
本发明专利技术公开了一种基于多模态内容的多样性信息推荐方法,包含:获取用户对多样性信息推荐的意愿强度;获取用户历史浏览数据,提取历史浏览数据中的文本、图片和视频内容;对提取出的文本、图片和视频内容进行数据加工,并与数据库里的对应内容进行分析对比,获得数据库内容与用户历史浏览数据的多样性和相似性指标;根据用户对多样性信息推荐的意愿强度和得到的数据库内容与用户历史浏览数据内容的多样性和相似性指标,匹配相应的数据库内容以备用户选择;基于匹配出的备选内容,以随机推荐的方式呈现多模态内容给用户。本发明专利技术提供的基于多模态内容的多样性信息推荐方法,为用户提供与其历史浏览内容差异较大的推荐,能够帮助用户破除信息茧房。

【技术实现步骤摘要】

本专利技术属于信息推荐,具体涉及一种基于多模态内容的多样性信息推荐方法


技术介绍

1、在传统媒体时代,人们获取外部信息的渠道除基于现实关系的人际传播外,大多来自丰富的传统媒体传播渠道,如广播、电视、报纸、杂志等。随着网络时代的到来,人们信息获取渠道多元,除传统信息获取渠道之外,打破时空局限性的网络,在更大程度上承担起为人们提供信息的重任,而人们对于网络的依赖程度也日渐加深。随着大数据的崛起和算法应用,人们在信息内容的获取方式上,也有别于早期网络时代以人为主体、主动进行信息搜索的方式,转而由基于大数据的算法主动研判互联网用户兴趣偏好,并据此进行个性化信息内容分发人们在不知不觉中被“个人习惯”“浏览记录”引导前行,智化能推荐技术打造出类似于“信息茧房”的“个人日报”。面对海量信息,人们也更乐意在智能推荐技术的导航下实现对信息的选择性阅读,以减少信息获取的成本。

2、然而现有的信息推荐机制会造成回声室效应,形成“信息茧房””。回声室效应指的是在某一个网络空间里,相对封闭的环境中,一些意见相近的声音不断重复,并以夸张或其他扭曲形式重复,以至于无论该信息的真伪,处于相对封闭环境中的大多数人认为这些扭曲的故事就是事实的全部,而该网络外部的任何信息,都很难在这个网络中传播或者不会达到这个网络中。我们可以将其简单的理解为“信息或想法在一个封闭的小圈子里得到加强。”研究认为,网络强化了这一效应。


技术实现思路

1、本专利技术提供了一种基于多模态内容的多样性信息推荐方法解决上述提到的技术问题,具体采用如下的技术方案:

2、一种基于多模态内容的多样性信息推荐方法,包含:

3、向用户发放调查问卷,获取用户对多样性信息推荐的意愿强度;

4、获取用户历史浏览数据,提取历史浏览数据中的文本、图片和视频内容;

5、对提取出的文本、图片和视频内容进行数据加工,并与数据库里的对应内容进行分析对比,获得数据库内容与用户历史浏览数据的多样性和相似性指标;

6、根据用户对多样性信息推荐的意愿强度和得到的数据库内容与用户历史浏览数据内容的多样性和相似性指标,匹配相应的数据库内容以备用户选择;

7、基于匹配出的备选内容,以随机推荐的方式呈现多模态内容给用户。

8、进一步地,所述对提取出的文本、图片和视频内容进行数据加工的具体方法为:

9、通过使用自然语言处理工具对文本进行分词、去除停用词、去除语气词和词干提取,得到文本的各个词的频率、文本长度和所有文档平均长度;

10、对图片和视频进行分块处理,将图像和视频分成小块,以便在局部区域内计算结构相似性,并且得到每个图块的亮度、对比度和结构三个方面的数据。

11、进一步地,所述获得数据库内容与用户历史浏览数据的多样性和相似性指标的具体方法为:

12、对预处理后得到的数据与数据库内的内容进行文本与文本、图片与图片和视频与视频的匹配计算各种模态下的内容相似性;

13、对于文本,根据下述公式计算文本多样性指标:

14、

15、其中,p是文本p,q是文本q,i是查询中文本中的词语i,t是查询中的词语出现的次数,timeipt是词语i在文本中出p现的频次,对于文本p和文本q,计算vpq,即在两个文本共同出现的词语的数量,定义了这些文本的词语重叠的中间度量,

16、对于图片和视频,计算图片和视频的结构相似性指数;

17、

18、其中,μx和μy分别为图像x和y的亮度均值,和分别为图像x和y的亮度方差,σxy为图像x和y之间的亮度协方差,c1和c2是常数,用于防止分母中的除零错误,c1和c2分别被设置为(k1·l)2和(k2·l)2,其中k1和k2是常数,l是像素值的动态范围。

19、进一步地,所述根据用户对多样性信息推荐的意愿强度和得到的数据库内容与用户历史浏览数据内容的多样性和相似性指标,匹配相应的数据库内容以备用户选择的具体方法为:

20、根据计算出的文本多样性指标和结构相似性指数将数据库中的所有数据划分为5个等级标记为最不相似、不相似、一般、相似、非常相似,用户对多样性信息推荐意愿强度分为5个等级,分别为非常愿意、愿意、不确定、不愿意、非常不愿意,如果用户所选择的意愿强度为非常愿意,则与之匹配的推荐内容为最不相似的内容,以此类推。

21、进一步地,当用户选择了随机推荐的多模态内容后,在之后的预定时间内,切换为基于相似度的推荐模式。

22、进一步地,所述基于多模态内容的多样性信息推荐方法还包含:

23、统计用户对随机推荐的多模态内容的选择情况;

24、根据用户对多模态内容的选择情况确定用户对多样性信息推荐的真实意愿强度;

25、根据真实意愿强度对通过调查问卷确定的用户对多样性信息推荐的意愿强度进行校正得到最新的意愿强度;

26、后续根据最新的意愿强度和数据库内容与用户历史浏览数据内容的多样性和相似性指标匹配相应的数据库内容。

27、进一步地,当随机推荐的次数超过预设值后,统计用户对随机推荐的多模态内容的选择的次数,计算用户的选择率,当选择率超过预设值后上调用户的意愿强度,当选择率低于设值后下调用户的意愿强度。

28、进一步地,当选择率在连续5次均超过预设值后上调用户的意愿强度,当选择率在连续5次低于设值后下调用户的意愿强度。

29、进一步地,所述获取用户历史浏览数据的具体方法为:

30、获取最近的预定数量的数据。

31、进一步地,所述获取用户历史浏览数据的具体方法为:

32、以当前时间为基准,获取预定时间内的用户的历史浏览数据。

33、本专利技术的有益之处在于所提供的基于多模态内容的多样性信息推荐方法,为用户提供与其历史浏览内容差异较大的推荐,能够帮助用户破除信息茧房。

本文档来自技高网...

【技术保护点】

1.一种基于多模态内容的多样性信息推荐方法,其特征在于,包含:

2.根据权利要求1所述的基于多模态内容的多样性信息推荐方法,其特征在于,

3.根据权利要求2所述的基于多模态内容的多样性信息推荐方法,其特征在于,

4.根据权利要求3所述的基于多模态内容的多样性信息推荐方法,其特征在于,

5.根据权利要求4所述的基于多模态内容的多样性信息推荐方法,其特征在于,

6.根据权利要求1所述的基于多模态内容的多样性信息推荐方法,其特征在于,

7.根据权利要求6所述的基于多模态内容的多样性信息推荐方法,其特征在于,

8.根据权利要求7所述的基于多模态内容的多样性信息推荐方法,其特征在于,

9.根据权利要求1所述的基于多模态内容的多样性信息推荐方法,其特征在于,

10.根据权利要求1所述的基于多模态内容的多样性信息推荐方法,其特征在于,

【技术特征摘要】

1.一种基于多模态内容的多样性信息推荐方法,其特征在于,包含:

2.根据权利要求1所述的基于多模态内容的多样性信息推荐方法,其特征在于,

3.根据权利要求2所述的基于多模态内容的多样性信息推荐方法,其特征在于,

4.根据权利要求3所述的基于多模态内容的多样性信息推荐方法,其特征在于,

5.根据权利要求4所述的基于多模态内容的多样性信息推荐方法,其特征在于,

...

【专利技术属性】
技术研发人员:韦维潘煜张效初李太豪金佳杨风帆
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1