一种文本纪要生成方法、装置、设备及存储介质制造方法及图纸

技术编号:33039807 阅读:12 留言:0更新日期:2022-04-15 09:19
本申请提出一种文本纪要生成方法、装置、设备及存储介质,该方法包括:获取目标文本以及参考文本,其中,所述参考文本基于用户所关注的目标文本内容而确定;基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。采用该文本纪要生成方法,即便是针对相同的目标文本,当参考文本不同时,能够通过从目标文本中定位与参考文本相关的文本内容,对目标文本进行不同侧重点的文本纪要生成处理,从而得到与参考文本对应的目标文本纪要。因此,该方法能够针对同一目标文本,生成满足不同用户需求的文本纪要。成满足不同用户需求的文本纪要。成满足不同用户需求的文本纪要。

【技术实现步骤摘要】
一种文本纪要生成方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种文本纪要生成方法、装置、设备及存储介质。

技术介绍

[0002]文本纪要生成,是指对长篇文本进行内容提取,从而提炼出能够表征文本核心内容的信息,文本纪要可以帮助人们更加直接、有效地把握文本内容。
[0003]常规的文本纪要生成方案通常是基于文本自动摘要技术,从文本中提取要点并形成概括性的文本。文本自动摘要技术按照产生摘要的方式可以划分为抽取式摘要和生成式摘要。抽取式摘要是从原始文本中原封不动地抽取单词或句子来形成一个摘要,摘要内容全部来源于原文;而生成式摘要允许生成新的词语以及原文本中没有的短语来组成摘要,生成摘要时首先对文本内容进行语义理解,基于语义生成一段话来对给定的文本进行概括。
[0004]通常,需要生成文本纪要的目标文本的内容是多方面的,而不同的人员可能对不同方面的内容感兴趣,因此,不同人员对相同目标文本的文本纪要需求是不一样的。
[0005]但是,目前的文本纪要生成方案,无论是抽取式摘要还是生成式摘要,均不能针对不同的人员需求生成不同内容的文本纪要,无法满足不同人员对相同目标文本的文本纪要生成需求。

技术实现思路

[0006]基于上述技术现状,本申请提出一种文本纪要生成方法、装置、设备及存储介质,通过实施本申请技术方案,能够针对同一目标文本,生成满足不同用户需求的文本纪要。
[0007]为了实现上述目的,本申请提出如下技术方案:
[0008]一种文本纪要生成方法,包括:
[0009]获取目标文本以及参考文本,其中,所述参考文本基于用户所关注的目标文本内容而确定;
[0010]基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。
[0011]一种文本纪要生成装置,包括:
[0012]数据获取单元,用于获取目标文本以及参考文本,其中,所述参考文本基于用户所关注的目标文本内容而确定;
[0013]纪要生成单元,用于基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。
[0014]一种文本纪要生成设备,包括:
[0015]存储器和处理器;
[0016]所述存储器与所述处理器连接,用于存储程序;
[0017]所述处理器,用于通过运行所述存储器中的程序,实现上述的文本纪要生成方法。
[0018]一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现上述的文本纪要生成方法。
[0019]本申请提出的文本纪要生成方法,在对目标文本生成文本纪要时,以参考文本作为生成文本纪要的参考,通过从目标文本中定位参考文本的关联内容,对该目标文本进行纪要生成处理,得到与参考文本相对应的目标文本纪要。该方法在对目标文本生成文本纪要时,将目标文本内容,以及目标文本中的参考文本关联内容联合应用,共同用于确定目标文本的文本纪要。采用该文本纪要生成方法,即便是针对相同的目标文本,当参考文本不同时,能够通过从目标文本中定位与参考文本相关的文本内容,对目标文本进行不同侧重点的文本纪要生成处理,从而得到与参考文本对应的目标文本纪要。因此,该方法能够针对同一目标文本,生成满足不同用户需求的文本纪要。
附图说明
[0020]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0021]图1是本申请实施例提供的一种文本纪要生成方法的流程示意图;
[0022]图2是本申请实施例提供的篇章交互语义检索模型的结构示意图;
[0023]图3是本申请实施例提供的基于检索候选信息增强的语义检索模型的结构示意图;
[0024]图4是本申请实施例提供的一种基于注意力机制的文本纪要生成模型的结构示意图;
[0025]图5是本申请实施例提供的另一种基于注意力机制的文本纪要生成模型的结构示意图;
[0026]图6是本申请实施例提供的词



篇章层级信息编码模型的结构示意图;
[0027]图7是本申请实施例提供的分词特征提取示意图;
[0028]图8是本申请实施例提供的信息融合模型的结构示意图;
[0029]图9是本申请实施例提供的一种文本纪要生成装置的结构示意图;
[0030]图10是本申请实施例提供的一种文本纪要生成设备的结构示意图。
具体实施方式
[0031]本申请实施例技术方案适用于生成文本纪要的应用场景,采用本申请实施例技术方案,能够生成与用户关注点相符的文本纪要,从而能够满足不同用户的文本纪要需求。
[0032]上述的生成文本纪要的应用场景,具体是指需要生成纪要内容的场景,包括但不限于会议纪要生成、文献摘要生成、新闻要点提炼等具体的应用场景。
[0033]文本纪要生成,是指对长篇文本进行内容提取,从而提炼出能够表征文本核心内容的信息,文本纪要可以帮助人们更加直接、有效地把握文本内容。
[0034]常规的文本纪要生成方案通常是基于文本自动摘要技术,从文本中提取要点并形
成概括性的文本。文本自动摘要技术按照产生摘要的方式可以划分为抽取式摘要和生成式摘要。抽取式摘要是从原始文本中原封不动地抽取单词或句子来形成一个摘要,摘要内容全部来源于原文;而生成式摘要允许生成新的词语以及原文本中没有的短语来组成摘要,生成摘要时首先对文本内容进行语义理解,基于语义生成一段话来对给定的文本进行概括。
[0035]通常,需要生成文本纪要的目标文本的内容是多方面的,而不同的人员可能对不同方面的内容感兴趣,因此,不同人员对相同目标文本的文本纪要需求是不一样的。
[0036]例如,在会议场景中,会议内容通常是多方面的,而不同的参会人员所关心的内容通常是不一样的。比如,一场关于新产品策划的研讨会,同时参会的公司设计部、产品部以及市场部等负责人各自关心不同方面的内容。如设计部,更多关注的是产品设计方案的完善,产品部更多关注的是产品定义及研发规划,市场部更多关注的是新产品的市场定位。因此,不同部门所需的会议纪要的内容不同。
[0037]但是,常规的文本纪要生成方案,无论是抽取式摘要还是生成式摘要,由于其只能是对待生成摘要的文本进行技术处理,从而确定文本的主要内容,均不能针对不同的关注点生成侧重点不同的文本纪要。
[0038]基于上述技术现状,本申请实施例提出一种文本纪要生成方案,该方案能够参考用户所关注的目标文本内容,对目标文本生成文本纪要,从而可以针对不同的关注点生成不同的文本纪要,满足不同用户对于文本纪要内容的个性化需求。
...

【技术保护点】

【技术特征摘要】
1.一种文本纪要生成方法,其特征在于,包括:获取目标文本以及参考文本,其中,所述参考文本基于用户所关注的目标文本内容而确定;基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。2.根据权利要求1所述的方法,其特征在于,基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:基于从所述目标文本中定位与所述参考文本相关的文本片段,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。3.根据权利要求2所述的方法,其特征在于,基于从所述目标文本中定位与所述参考文本相关的文本片段,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:通过确定目标文本中的各个文本片段与参考文本的相关度,从所述目标文本中定位出与所述参考文本相关的文本片段;至少基于所述目标文本中的与所述参考文本相关的各个文本片段与所述参考文本的相关度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。4.根据权利要求3所述的方法,其特征在于,至少基于所述目标文本中的与所述参考文本相关的各个文本片段与所述参考文本的相关度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:根据目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度;至少根据所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。5.根据权利要求3所述的方法,其特征在于,确定目标文本中的各个文本片段与参考文本的相关度,包括:分别获取目标文本的特征以及参考文本的特征;根据目标文本中的各个文本片段的特征,以及参考文本的特征,分别确定目标文本中的各个文本片段与参考文本的相关度。6.根据权利要求5所述的方法,其特征在于,在分别获取目标文本的特征以及参考文本的特征后,所述方法还包括:对目标文本中的各个文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征。7.根据权利要求6所述的方法,其特征在于,对目标文本中的各个文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征,包括:根据目标文本中的各个文本片段的特征,以及参考文本的特征,计算确定目标文本中
的各个文本片段与参考文本的相似度;根据目标文本中的各个文本片段与参考文本的相似度,从目标文本中选出与参考文本的相似度最高的第一数量的文本片段;对从目标文本中选出的第一数量的文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征。8.根据权利要求5所述的方法,其特征在于,当参考文本的文本数量大于1时,根据目标文本中的各个文本片段的特征,以及参考文本的特征,分别确定目标文本中的各个文本片段与参考文本的相关度,包括:对于目标文本中的各个文本片段,分别通过如下处理确定其与参考文本的相关度:根据该文本片段的特征,以及各条参考文本的特征,确定该文本片段与各条参考文本的相关度;根据各条参考文本之间的关系,对该文本片段与各条参考文本的相关度进行融合处理,确定该文本片段与参考文本的相关度。9.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段的特征以及参考文本的特征,通过BM25算法计算确定目标文本中的各个文本片段与参考文本的语义相似度;对目标文本中的各个文本片段与参考文本的相关度,以及目标文本中的各个文本片段与参考文本的语义相似度进行融合处理,得到融合后的目标文本中的各个文本片段与参考文本的相关度。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段在目标文本中的位置分布,对目标文本中的各个文本片段与参考文本的相关度进行修正。11.根据权利要求10所述的方法,其特征在于,根据目标文本中的各个文本片段在目标文本中的位置分布,对目标文本中的各个文本片段与参考文本的相关度进行修正,包括:从目标文本中的各个文本片段中,选出与参考文本的相关度最高的第二数量的文本片段;按照目标文本中的其它文本片段与选出的第二数量的文本片段的距离越大,则对其它文本片段与参考文本的相关度的惩罚度越高的规则,确定对目标文本中的其它文本片段与参考文本的相关度的惩罚度;根据对目标文本中的其它文本片段与参考文本的相关度的惩罚度,对目标文本中的其它文本片段与参考文本的相关度进行惩罚。12.根据权利要求11所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段与参考文本的相关度,从目标文本中选出与参考文本的相关度最高的第三数量的文本片段;根据选出的第三数量的文本片段中的各个文本片段与参考文本的相关度,从所述第三数量的文本片段中,选出与参考文本的相关度大于第一相关度阈值,或者与参考文本的相关度大于第二相关度阈值并且与参考文本的标准化相关度大于第三相关度阈值的文本片段,作为与参考文本相关的文本片段;其中,所述第一相关度阈值大于所述第二相关度阈值,所述第二相关度阈值大于所述
第三相关度阈值。13.根据权利要求4所述的方法,其特征在于,根据目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,包括:确定生成所述目标文本的文本纪要对于所述目标文本中的各个文本片段的注意力系数;根据生成所述目标文本的文本纪要对于所述目标文本中的各个文本片段的注意力系数,以及所述目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度。14.根据权利要求4所述的方法,其特征在于,至少根据所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:至少根据所述目标文本的特征,以及所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,生成文本纪要解码特征;根据所述文本纪要解码特征,生成所述目标文本的文本纪要。15....

【专利技术属性】
技术研发人员:高建清戚婷闫莉孙境廷
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1