一种信息处理方法及装置制造方法及图纸

技术编号:18763840 阅读:35 留言:0更新日期:2018-08-25 10:30
本发明专利技术实施例提供了一种信息处理方法及装置,所述方法包括:获取热点事件标签和多个事件报道;计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。根据本发明专利技术实施例,节省了用户获取具有多样性、时效性的事件报道的时间和精力。

【技术实现步骤摘要】
一种信息处理方法及装置
本专利技术涉及信息处理领域,特别是涉及一种信息处理方法,以及,一种信息处理装置,以及,一种移动终端,以及,一种计算机可读存储介质。
技术介绍
目前,越来越多的用户通过互联网关注资讯,尤其是对当前热点事件的关注。通常,用户可以针对热点事件的事件报道进行搜索得到相关的事件报道,或者,由网站运营商将热点事件的事件报道推荐给用户。在搜索事件报道或推荐事件报道时,需要将大量的事件报道进行聚合,将聚合结果作为搜索结果或者推荐结果发送给用户。然而,目前的事件报道聚合方式中,仅考虑了事件报道与热点事件的关联性,导致所聚合的多个事件报道中重复内容过多,而且,所聚合的事件报道可能已经过期。而通过上述的事件报道聚合方式,可能将大量重复、过期的事件报道提供给用户,用户还需要花费时间和精力从中筛选,以满足其对事件报道的多样性、时效性等方面的需求。因此,现有技术的事件报道聚合方式存在着耗费用户时间和精力的问题。
技术实现思路
本专利技术实施例针对所要解决的技术问题提供了一种信息处理方法,以及,一种信息处理装置。为了解决上述问题,本专利技术提供了一种信息处理方法,所述方法包括:获取热点事件标签和多个事件报道;计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。可选地,所述热点事件标签具有对应的第一文本向量,所述计算所述热点事件标签与所述多个事件报道的第一文本相似度的步骤,包括:从所述多个事件报道中选取待评价事件报道;对所述待评价事件报道进行分词处理,得到多个报道分词文本;计算所述多个报道分词文本的第二文本向量;计算所述第一文本向量和所述第二文本向量的余弦值,作为所述第一文本相似度。可选地,所述事件报道具有N个,N个事件报道中包括M个已评价事件报道,0<M<N,所述已评价事件报道具有对应的第三文本向量,所述计算所述多个事件报道之间的第二文本相似度的步骤,包括:计算所述待评价事件报道的第二文本向量与所述M个已评价事件报道的第三文本向量的M个余弦值;在所述M个余弦值中提取最大余弦值,作为所述第二文本相似度。可选地,所述热点事件标签具有事件时间,所述事件报道具有报道时间,所述获取所述多个事件报道的时效特征值的步骤,包括:计算所述待评价事件报道的报道时间与所述热点事件标签的事件时间的时间间隔值;采用所述时间间隔值和预设的时效衰减值,计算所述待评价事件报道的时效特征值。可选地,所述时效特征值包括第一时效特征值和第二时效特征值,所述根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值的步骤,包括:计算所述第一文本相似度与所述第一时效特征值的第一乘积;计算所述第二文本相似度与所述第二时效特征值的第二乘积;计算所述第一乘积与所述第二乘积的差值,作为所述最大边缘相关值。可选地,所述按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果的步骤,包括:按照所述最大边缘相关值的大小,对所述多个事件报道进行排序;将排序后的多个事件报道作为所述报道聚合结果。可选地,所述按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果的步骤,包括:在所述多个事件报道中,提取出所述最大边缘相关值大于预设阈值的事件报道;将提取出的事件报道作为所述报道聚合结果。可选地,所述方法还包括:当接收到用户针对所述热点事件标签的报道搜索请求,发送所述报道聚合结果至所述用户;或者向用户推荐所述报道聚合结果。为了解决上述问题,本专利技术还提供了一种信息处理装置,所述装置包括:标签、报道获取模块,用于获取热点事件标签和多个事件报道;文本相似度、时效特征值计算模块,用于计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;最大边缘相关值计算模块,用于根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;报道聚合模块,用于按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。可选地,所述热点事件标签具有对应的第一文本向量,所述文本相似度、时效特征值计算模块,包括:待评价事件报道选取子模块,用于从所述多个事件报道中选取待评价事件报道;分词处理子模块,用于对所述待评价事件报道进行分词处理,得到多个报道分词文本;第二文本向量计算子模块,用于计算所述多个报道分词文本的第二文本向量;第一文本相似度计算子模块,用于计算所述第一文本向量和所述第二文本向量的余弦值,作为所述第一文本相似度。可选地,所述事件报道具有N个,N个事件报道中包括M个已评价事件报道,0<M<N,所述已评价事件报道具有对应的第三文本向量,所述文本相似度、时效特征值计算模块,包括:M个余弦值计算子模块,用于计算所述待评价事件报道的第二文本向量与所述M个已评价事件报道的第三文本向量的M个余弦值;第二文本相似度提取子模块,用于在所述M个余弦值中提取最大余弦值,作为所述第二文本相似度。可选地,所述热点事件标签具有事件时间,所述事件报道具有报道时间,所述文本相似度、时效特征值计算模块,包括:时间间隔值计算子模块,用于计算所述待评价事件报道的报道时间与所述热点事件标签的事件时间的时间间隔值;时效特征值计算子模块,用于采用所述时间间隔值和预设的时效衰减值,计算所述待评价事件报道的时效特征值。可选地,所述时效特征值包括第一时效特征值和第二时效特征值,所述最大边缘相关值计算模块,包括:第一乘积计算子模块,用于计算所述第一文本相似度与所述第一时效特征值的第一乘积;第二乘积计算子模块,用于计算所述第二文本相似度与所述第二时效特征值的第二乘积;乘积差值计算子模块,用于计算所述第一乘积与所述第二乘积的差值,作为所述最大边缘相关值。可选地,所述报道聚合模块,包括:报道排序子模块,用于按照所述最大边缘相关值的大小,对所述多个事件报道进行排序;第一报道聚合结果生成子模块,用于将排序后的多个事件报道作为所述报道聚合结果。可选地,所述报道聚合模块,包括:事件报道提取子模块,用于在所述多个事件报道中,提取出所述最大边缘相关值大于预设阈值的事件报道;第二报道聚合结果生成子模块,用于将提取出的事件报道作为所述报道聚合结果。可选地,所述装置还包括:报道聚合结果发送模块,用于当接收到用户针对所述热点事件标签的报道搜索请求,发送所述报道聚合结果至所述用户;或者向用户推荐所述报道聚合结果。为了解决上述问题,本专利技术还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,实现上述任一所述的信息处理方法。为了解决上述问题,本专利技术还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时,实现上述任一所述的信息处理方法。本专利技术实施例可以达到以下的有益效果:根据本文档来自技高网...

【技术保护点】
1.一种信息处理方法,其特征在于,所述方法包括:获取热点事件标签和多个事件报道;计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取热点事件标签和多个事件报道;计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值;按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果。2.根据权利要求1所述的方法,其特征在于,所述热点事件标签具有对应的第一文本向量,所述计算所述热点事件标签与所述多个事件报道的第一文本相似度的步骤,包括:从所述多个事件报道中选取待评价事件报道;对所述待评价事件报道进行分词处理,得到多个报道分词文本;计算所述多个报道分词文本的第二文本向量;计算所述第一文本向量和所述第二文本向量的余弦值,作为所述第一文本相似度。3.根据权利要求2所述的方法,其特征在于,所述事件报道具有N个,N个事件报道中包括M个已评价事件报道,0<M<N,所述已评价事件报道具有对应的第三文本向量,所述计算所述多个事件报道之间的第二文本相似度的步骤,包括:计算所述待评价事件报道的第二文本向量与所述M个已评价事件报道的第三文本向量的M个余弦值;在所述M个余弦值中提取最大余弦值,作为所述第二文本相似度。4.根据权利要求2所述的方法,其特征在于,所述热点事件标签具有事件时间,所述事件报道具有报道时间,所述获取所述多个事件报道的时效特征值的步骤,包括:计算所述待评价事件报道的报道时间与所述热点事件标签的事件时间的时间间隔值;采用所述时间间隔值和预设的时效衰减值,计算所述待评价事件报道的时效特征值。5.根据权利要求1所述的方法,其特征在于,所述时效特征值包括第一时效特征值和第二时效特征值,所述根据所述第一文本相似度、所述第二文本相似度和所述时效特征值,计算所述多个事件报道的最大边缘相关值的步骤,包括:计算所述第一文本相似度与所述第一时效特征值的第一乘积;计算所述第二文本相似度与所述第二时效特征值的第二乘积;计算所述第一乘积与所述第二乘积的差值,作为所述最大边缘相关值。6.根据权利要求1所述的方法,其特征在于,所述按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果的步骤,包括:按照所述最大边缘相关值的大小,对所述多个事件报道进行排序;将排序后的多个事件报道作为所述报道聚合结果。7.根据权利要求1所述的方法,其特征在于,所述按照所述多个事件报道的最大边缘相关值聚合所述多个事件报道,得到报道聚合结果的步骤,包括:在所述多个事件报道中,提取出所述最大边缘相关值大于预设阈值的事件报道;将提取出的事件报道作为所述报道聚合结果。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:当接收到用户针对所述热点事件标签的报道搜索请求,发送所述报道聚合结果至所述用户;或者向用户推荐所述报道聚合结果。9.一种信息处理装置,其特征在于,所述装置包括:标签、报道获取模块,用于获取热点事件标签和多个事件报道;文本相似度、时效特征值计算模块,用于计算所述热点事件标签与所述多个事件报道的第一文本相似度,以及,计算所述多个事件报道之间的第二文本相似度,以及,获取所述多个事件报道的时效特征值;最大边缘相关值计算模块,用...

【专利技术属性】
技术研发人员:张轩玮
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1