本发明专利技术公开了一种视频专辑生成方法及装置,该方法包括:分别从多种不同媒介获取特定主题的资讯文本;确定各资讯文本中与所述主题相关的命名实体;根据所述命名实体确定每个资讯文本的主题标签;将包含相同主题标签的资讯文本放入对应该主题标签的集合中;根据所述集合中的资讯文本,生成视频专辑。利用本发明专利技术,可以提高资讯内容的价值度和传播效率。以提高资讯内容的价值度和传播效率。以提高资讯内容的价值度和传播效率。
【技术实现步骤摘要】
视频专辑生成方法及装置
[0001]本专利技术涉及信息处理
,具体涉及一种视频专辑生成方法及装置。
技术介绍
[0002]目前,随着媒介的多样化发展,针对同一事件的新闻资讯发布渠道及方式越来越多元化,不同发布人对同一事件的解读角度也会有所不同,甚至可能是完全相反的观点。但由于不同用户通常所关注的媒介或者自己的喜好不同,使得大多数用户都只能看到其中的部分资讯,这无疑会对用户对该事件的认知及理解产生片面的引导,影响用户对事件的准确判断。因此,如何更方便地使用户获得对同一事件多角度的综合资讯信息是业界急需解决的一个重要问题。
技术实现思路
[0003]本专利技术提供一种视频专辑生成方法及装置,以提高资讯内容的价值度和传播效率。
[0004]为此,本专利技术提供如下技术方案:
[0005]一种视频专辑生成方法,所述方法包括:
[0006]分别从多种不同媒介获取特定主题的资讯文本;
[0007]确定各资讯文本中与所述主题相关的命名实体;
[0008]根据所述命名实体确定每个资讯文本的主题标签;
[0009]将包含相同主题标签的资讯文本放入对应该主题标签的集合中;
[0010]根据所述集合中的资讯文本,生成视频专辑。
[0011]可选地,所述方法还包括:根据网络热词或设定关键词确定所述主题;
[0012]所述分别从多种不同媒介获取特定主题的资讯文本包括:
[0013]分别从以下任意两种或多种媒介获取特定主题的资讯文本:新闻媒体、期刊文献、网页、监管机构公布的信息、微信公众号文章。
[0014]可选地,所述确定各资讯文本中与所述主题相关的命名实体包括:
[0015]基于预先建立的领域知识库确定各资讯文本中与所述主题相关的命名实体;和/或
[0016]基于预先训练的模型确定各资讯文本中与所述主题相关的命名实体。
[0017]可选地,所述根据所述命名实体及其关联关系确定所述资讯文本的标签包括:
[0018]对所述命名实体及其关联关系进行聚类,并根据聚类结果确定所述资讯文本的标签。
[0019]可选地,所述根据所述集合中的资讯文本,生成视频专辑包括:
[0020]对所述集合中的每个资讯文本,生成对应所述资讯文本的视频单元;
[0021]对所述视频单元进行拼接处理,得到视频专辑。
[0022]可选地,所述生成对应所述资讯文本的视频单元包括:
[0023]获取与所述资讯文本相适配的图片并生成包含所述图片的基础视频文件;所述图片包括以下任意一种或多种:背景图片、实体词图片;
[0024]生成对应所述资讯文本的音频文件;
[0025]对所述基础视频文件和所述音频文件进行合成处理,得到对应所述资讯文本的视频单元。
[0026]一种视频专辑生成装置,所述装置包括:
[0027]信息采集模块,用于分别从多种不同媒介获取特定主题的资讯文本;
[0028]命名实体确定模块,用于确定各资讯文本中与所述主题相关的命名实体;
[0029]标记模块,用于根据所述命名实体确定每个资讯文本的主题标签;
[0030]分组模块,用于将包含相同主题标签的资讯文本放入对应该主题标签的集合中;
[0031]视频专辑生成模块,用于根据所述集合中的资讯文本,生成视频专辑。
[0032]可选地,所述装置还包括:
[0033]主题确定模块,用于根据网络热词或设定关键词确定所述主题;
[0034]所述信息采集模块分别从以下任意两种或多种媒介获取特定主题的资讯文本:新闻媒体、期刊文献、网页、监管机构公布的信息、微信公众号文章。
[0035]可选地,所述命名实体确定模块包括:
[0036]第一确定模块,用于基于预先建立的领域知识库确定各资讯文本中与所述主题相关的命名实体;和/或
[0037]第二确定模块,用于基于预先训练的模型确定各资讯文本中与所述主题相关的命名实体。
[0038]可选地,所述标记模块,具体用于对所述命名实体及其关联关系进行聚类,并根据聚类结果确定所述资讯文本的标签。
[0039]可选地,所述视频专辑生成模块包括:
[0040]视频制作单元,用于对所述集合中的每个资讯文本,生成对应所述资讯文本的视频单元;
[0041]拼接单元,用于对所述视频单元进行拼接处理,得到视频专辑。
[0042]可选地,所述视频制作单元包括:
[0043]基础视频生成单元,用于获取与所述资讯文本相适配的图片并生成包含所述图片的基础视频文件;所述图片包括以下任意一种或多种:背景图片、实体词图片;
[0044]音频生成单元,用于生成对应所述资讯文本的音频文件;
[0045]合成单元,用于对所述基础视频文件和所述音频文件进行合成处理,得到对应所述资讯文本的视频单元。
[0046]本专利技术实施例提供的视频专辑生成方法及装置,通过从多种不同媒介获取特定主题的资讯文本,对其标签化,将标签相同的资讯文本放入对应该标签的集合中,利用集合中的资讯文本生成相应的视频专辑,大大提高资讯内容的价值度和传播效率。
附图说明
[0047]图1是本专利技术实施例视频专辑生成方法的一种流程图;
[0048]图2是本专利技术实施例视频专辑生成装置的一种结构框图。
具体实施方式
[0049]对于一个事件,来源于单一数据源的文本形式的传播方式,无论是从其内容还是视觉效果上,都存在一定的局限性。而用户大都不会花太多时间和精力去涉猎各种不同媒体,这样难免由于信息媒介的局限性导致用户认知的偏颇。为此,本专利技术实施例提供一种视频专辑生成方法及系统,通过从多种不同媒介获取特定主题的资讯文本,对其标签化,将标签相同的资讯文本放入对应该标签的集合中,利用集合中的资讯文本生成相应的视频专辑,大大提高资讯内容的价值度和传播效率。
[0050]如图1所示,是本专利技术实施例视频专辑生成方法的一种流程图,包括以下步骤:
[0051]步骤101,分别从多种不同媒介获取特定主题的资讯文本。
[0052]比如,可以从以下任意两种或多种媒介获取资讯文本:新闻媒体、期刊文献、网页、监管机构公布的信息、微信公众号文章。当然,并不仅限于这些媒介,根据实际应用需要,还可以有其他媒介,对此本专利技术实施例不做限定。
[0053]需要说明的是,对于不同媒介的资讯数据,可以通过相应的数据接口来获取,比如,对于生物医学方面的论文,可以通过免费的搜寻引擎PubMed来获取;对于网页上公开的资讯信息,可以通过爬虫工具来得到相应的数据等。
[0054]所述主题可以根据网络热词或设定关键词确定,当然也可以根据应用需要人工设定相应主题,特定主题的资讯文本可以通过主题中的关键词进行匹配得到。一个主题中的关键词可以有一个或多个,对此本专利技术不做限定。
[0055]另外,考虑到有时不同媒介对同一事件的报导有时会采用转本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种视频专辑生成方法,其特征在于,所述方法包括:分别从多种不同媒介获取特定主题的资讯文本;确定各资讯文本中与所述主题相关的命名实体;根据所述命名实体确定每个资讯文本的主题标签;将包含相同主题标签的资讯文本放入对应该主题标签的集合中;根据所述集合中的资讯文本,生成视频专辑。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据网络热词或设定关键词确定所述主题;所述分别从多种不同媒介获取特定主题的资讯文本包括:分别从以下任意两种或多种媒介获取特定主题的资讯文本:新闻媒体、期刊文献、网页、监管机构公布的信息、微信公众号文章。3.根据权利要求1所述的方法,其特征在于,所述确定各资讯文本中与所述主题相关的命名实体包括:基于预先建立的领域知识库确定各资讯文本中与所述主题相关的命名实体;和/或基于预先训练的模型确定各资讯文本中与所述主题相关的命名实体。4.根据权利要求1所述的方法,其特征在于,所述根据所述命名实体及其关联关系确定所述资讯文本的标签包括:对所述命名实体及其关联关系进行聚类,并根据聚类结果确定所述资讯文本的标签。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述集合中的资讯文本,生成视频专辑包括:对所述集合中的每个资讯文本,生成对应所述资讯文本的视频单元;对所述视频单元进行拼接处理,得到视频专辑。6.根据权利要求5所述的方法,其特征在于,所述生成对应所述资讯文本的视频单元包括:获取与所述资讯文本相适配的图片并生成包含所述图片的基础视频文件;所述图片包括以下任意一种或多种:背景图片、实体词图片;生成对应所述资讯文本的音频文件;对所述基础视频文件和所述音频文件进行合成处理,得到对应所述资讯文本的视频单元。7.一种视频专辑生成装置,其特征在于,所述装置包括:信息采集模块,...
【专利技术属性】
技术研发人员:伍星,吴忠毅,李靖,丁红霞,李琪,廖宛玲,
申请(专利权)人:药渡经纬信息科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。