当前位置: 首页 > 专利查询>科技日报社专利>正文

一种基于质量评价的新闻专题生成方法及装置制造方法及图纸

技术编号:34260745 阅读:50 留言:0更新日期:2022-07-24 13:46
本公开涉及媒体数据处理技术领域,提供了一种基于质量评价的新闻专题生成方法及装置。该方法包括:获取第一新闻集合,第一新闻集合包括基于用户输入条件检索到的多条新闻;计算第一新闻集合中每条新闻的质量分;基于质量分对第一新闻集合中的新闻进行去重处理,得到第二新闻集合;按质量分由高到低的顺序输出第二新闻集合中的新闻至用户,作为输入条件的新闻专题检索结果。本公开能够自动对检索直接获得的第一新闻集合中相似新闻的去重,以及新闻质量筛选,省去了人工检索用时,提升了新闻检索结果的质量。结果的质量。结果的质量。

A method and device of news topic generation based on quality evaluation

【技术实现步骤摘要】
一种基于质量评价的新闻专题生成方法及装置


[0001]本公开涉及媒体数据处理
,尤其涉及一种基于质量评价的新闻专题生成方法及装置。

技术介绍

[0002]现有媒体工作者在通过内容、事件来生成新闻专题时,又有每个媒体平台有多个渠道发布的新闻数据,以此同一个事件会被各种媒体分别报道,虽然内容是同一个事件,但新闻报道的质量参差不齐。因此,往往根据条件来检索生成相应新闻专题时,会得到大量内容重复和质量较低的新闻,导致用户需要花费大量时间对检索到的新闻专题结果进行去重和排除质量较低的新闻处理,使得工作效率非常低。

技术实现思路

[0003]有鉴于此,本公开实施例提供了一种基于质量评价的新闻专题生成方法及装置,以解决现有技术中用户需要花费大量时间对检索到的新闻专题结果进行去重和排除质量较低的新闻处理,使得工作效率非常低的问题。
[0004]本公开实施例的第一方面,提供了一种基于质量评价的新闻专题生成方法,包括:获取第一新闻集合,第一新闻集合包括基于用户输入条件检索到的多条新闻;计算第一新闻集合中每条新闻的质量分;基于质量分对第一新闻集合中的新闻进行去重处理,得到第二新闻集合;按质量分由高到低的顺序输出第二新闻集合中的新闻至用户,作为输入条件的新闻专题检索结果。
[0005]本公开实施例的第二方面,提供了一种基于质量评价的新闻专题生成装置,包括:检索模块,被配置为获取第一新闻集合,第一新闻集合包括基于用户输入条件检索到的多条新闻;评分模块,被配置为计算第一新闻集合中每条新闻的质量分;去重模块,被配置为基于质量分对第一新闻集合中的新闻进行去重处理,得到第二新闻集合;输出模块,被配置为按质量分由高到低的顺序输出第二新闻集合中的新闻至用户,作为输入条件的新闻专题检索结果。
[0006]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0007]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0008]本公开实施例与现有技术相比存在的有益效果是:通过获取第一新闻集合,第一新闻集合包括基于用户输入条件检索到的多条新闻;计算第一新闻集合中每条新闻的质量分,基于质量分对第一新闻集合中的新闻进行去重处理,得到第二新闻集合;按质量分由高到低的顺序输出第二新闻集合中的新闻至用户,作为输入条件的新闻专题检索结果,由此实现了自动对检索直接获得的第一新闻集合中相似新闻的去重,以及新闻质量筛选,避免
了新闻专题检索结果中出现大量相似的新闻和低质量新闻的情形,省去了人工检索用时,提升了新闻检索结果的质量。
附图说明
[0009]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0010]图1是本公开实施例的应用场景的场景示意图;图2是本公开实施例提供的一种基于质量评价的新闻专题生成方法的流程示意图;图3是本公开实施例提供的一种基于质量评价的新闻专题生成装置的结构示意图;图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0011]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0012]下面将结合附图详细说明根据本公开实施例的一种基于质量评价的新闻专题生成方法和装置。
[0013]图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备1、服务器2以及网络3。
[0014]终端设备1可以是硬件,也可以是软件。当终端设备1为硬件时,其可以是具有显示屏且支持与服务器2通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备1为软件时,其可以安装在如上的电子设备中。终端设备1可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备1上可以安装有各种应用,例如数据处理应用、文本识别应用、搜索引擎应用等。
[0015]服务器2可以是提供各种新闻服务的数据库服务器。服务器2可以是一台服务器,也可以是由若干台服务器组成的服务器集群,本公开实施例对此不作限制。
[0016]需要说明的是,服务器2可以是硬件,也可以是软件。当服务器2为硬件时,其可以是为终端设备1提供各种服务的各种电子设备。当服务器2为软件时,其可以是为终端设备1提供各种服务的多个软件或软件模块,也可以是为终端设备1提供各种服务的单个软件或软件模块,本公开实施例对此不作限制。
[0017]网络3可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,WIFI、移动通信网络等,本公开实施例对此不作限制。
[0018]用户可以通过终端设备1经由网络3与服务器2建立通信连接,以接收或发送信息等。具体地,用户在终端设备上输入检索条件,然后从服务器中检索出与该检索条件匹配的多条新闻,并对该多条新闻进行去重后生成该检索条件的检索结果返回给终端设备。
[0019]需要说明的是,终端设备1、服务器2以及网络3的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本公开实施例对此不作限制。
[0020]图2是本公开实施例提供的一种基于质量评价的新闻专题生成方法的流程示意图。图2的基于质量评价的新闻专题生成方法可以由图1的终端设备或服务器执行。如图2所示,该基于质量评价的新闻专题生成方法包括:S201,获取第一新闻集合,第一新闻集合包括基于用户输入条件检索到的多条新闻;S202,计算第一新闻集合中每条新闻的质量分;S203,基于质量分对第一新闻集合中的新闻进行去重处理,得到第二新闻集合;S204,按质量分由高到低的顺序输出第二新闻集合中的新闻至用户,作为输入条件的新闻专题检索结果。
[0021]这里,新闻主要是媒体发布的以文字为内容的报道,媒体一般会以数字化的方式将这些新闻保存在数据库中,并允许外部对这些新闻进行访问或读取等。
[0022]具体地,该输入条件为用户想要生成新闻专题的检索条件,该检索条件包括但不限于检索关键词、类别标签、来源和日期。用户可以输入一个或多个检索关键词,或者输入类别标签、来源或日期中的任一个,也可以是输入检索关键词、类别标签、来源和日期中的多个,进行组合检索,本公开实施例对此不作限制。
[0023]具体地,该检索可以是基于输入条件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于质量评价的新闻专题生成方法,其特征在于,包括:获取第一新闻集合,所述第一新闻集合包括基于用户输入条件检索到的多条新闻;计算所述第一新闻集合中每条新闻的质量分;基于所述质量分对所述第一新闻集合中的新闻进行去重处理,得到第二新闻集合;按质量分由高到低的顺序输出所述第二新闻集合中的新闻至所述用户,作为所述输入条件的新闻专题检索结果。2.根据权利要求1所述的方法,其特征在于,所述计算所述第一新闻集合中每条新闻的质量分,包括:利用预先基于回归算法建立的质量评价模型对所述第一新闻集合中的每条新闻进行识别,得到所述每条新闻的质量分。3.根据权利要求2所述的方法,其特征在于,所述利用预先基于回归算法建立的质量评价模型对所述第一新闻集合中的每条新闻进行识别,得到所述每条新闻的质量分,包括:获取所述第一新闻集合中每条新闻的质量特征信息;根据所述质量特征信息,构建所述第一新闻集合的特征向量集合;将所述特征向量集合输入预先基于回归算法建立的质量评价模型中,得到所述第一新闻集合中每条新闻的质量分。4.根据权利要求3所述的方法,其特征在于,所述质量特征信息包括新闻的以下至少一个特征:新闻的摘要embedding向量、关键词embeding向量、新闻文章摘要,以及专题关键词相似度、文章来源、稿件长度、作者水平分、文本长度、分类标签。5.根据权利要求1

4任一所述的方法,其特征在于,所述基于所述质量分对所述第一新闻集合中的新闻进行去重处理,得到第二新闻集合,包括:计算所述第一新闻集合中多条新闻两两之间的相似度;在两条新闻的所述相似度高于预设的阈值的情况下,删除所述两条新闻中质量分较低的一条新闻,得到第二新闻集...

【专利技术属性】
技术研发人员:石聪邵德奇关培培冯超段治平李腾飞
申请(专利权)人:科技日报社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1