【技术实现步骤摘要】
一种文本纪要生成方法、装置、设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种文本纪要生成方法、装置、设备及存储介质。
技术介绍
[0002]文本纪要生成,是指对长篇文本进行内容提取,从而提炼出能够表征文本核心内容的信息,文本纪要可以帮助人们更加直接、有效地把握文本内容。
[0003]常规的文本纪要生成方案通常是基于文本自动摘要技术,从文本中提取要点并形成概括性的文本。文本自动摘要技术按照产生摘要的方式可以划分为抽取式摘要和生成式摘要。抽取式摘要是从原始文本中原封不动地抽取单词或句子来形成一个摘要,摘要内容全部来源于原文;而生成式摘要允许生成新的词语以及原文本中没有的短语来组成摘要,生成摘要时首先对文本内容进行语义理解,基于语义生成一段话来对给定的文本进行概括。
[0004]通常,需要生成文本纪要的目标文本的内容是多方面的,而不同的人员可能对不同方面的内容感兴趣,因此,不同人员对相同目标文本的文本纪要需求是不一样的。
[0005]但是,目前的文本纪要生成方案,无论是抽取式摘要还是生成式摘要,均不能针对不同的人员需求生成不同内容的文本纪要,无法满足不同人员对相同目标文本的文本纪要生成需求。
技术实现思路
[0006]基于上述技术现状,本申请提出一种文本纪要生成方法、装置、设备及存储介质,通过实施本申请技术方案,能够针对同一目标文本,生成满足不同用户需求的文本纪要。
[0007]为了实现上述目的,本申请提出如下技术方案:
[0008]一种文本纪要生
【技术保护点】
【技术特征摘要】
1.一种文本纪要生成方法,其特征在于,包括:获取目标文本以及参考文本,其中,所述参考文本基于用户所关注的目标文本内容而确定;基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。2.根据权利要求1所述的方法,其特征在于,基于从所述目标文本中定位所述参考文本的关联内容,对所述目标文本进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:基于从所述目标文本中定位与所述参考文本相关的文本片段,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。3.根据权利要求2所述的方法,其特征在于,基于从所述目标文本中定位与所述参考文本相关的文本片段,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:通过确定目标文本中的各个文本片段与参考文本的相关度,从所述目标文本中定位出与所述参考文本相关的文本片段;至少基于所述目标文本中的与所述参考文本相关的各个文本片段与所述参考文本的相关度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。4.根据权利要求3所述的方法,其特征在于,至少基于所述目标文本中的与所述参考文本相关的各个文本片段与所述参考文本的相关度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:根据目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度;至少根据所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要。5.根据权利要求3所述的方法,其特征在于,确定目标文本中的各个文本片段与参考文本的相关度,包括:分别获取目标文本的特征以及参考文本的特征;根据目标文本中的各个文本片段的特征,以及参考文本的特征,分别确定目标文本中的各个文本片段与参考文本的相关度。6.根据权利要求5所述的方法,其特征在于,在分别获取目标文本的特征以及参考文本的特征后,所述方法还包括:对目标文本中的各个文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征。7.根据权利要求6所述的方法,其特征在于,对目标文本中的各个文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征,包括:根据目标文本中的各个文本片段的特征,以及参考文本的特征,计算确定目标文本中
的各个文本片段与参考文本的相似度;根据目标文本中的各个文本片段与参考文本的相似度,从目标文本中选出与参考文本的相似度最高的第一数量的文本片段;对从目标文本中选出的第一数量的文本片段的特征,以及参考文本的特征,进行基于注意力机制的交互运算,得到信息完善后的参考文本特征。8.根据权利要求5所述的方法,其特征在于,当参考文本的文本数量大于1时,根据目标文本中的各个文本片段的特征,以及参考文本的特征,分别确定目标文本中的各个文本片段与参考文本的相关度,包括:对于目标文本中的各个文本片段,分别通过如下处理确定其与参考文本的相关度:根据该文本片段的特征,以及各条参考文本的特征,确定该文本片段与各条参考文本的相关度;根据各条参考文本之间的关系,对该文本片段与各条参考文本的相关度进行融合处理,确定该文本片段与参考文本的相关度。9.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段的特征以及参考文本的特征,通过BM25算法计算确定目标文本中的各个文本片段与参考文本的语义相似度;对目标文本中的各个文本片段与参考文本的相关度,以及目标文本中的各个文本片段与参考文本的语义相似度进行融合处理,得到融合后的目标文本中的各个文本片段与参考文本的相关度。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段在目标文本中的位置分布,对目标文本中的各个文本片段与参考文本的相关度进行修正。11.根据权利要求10所述的方法,其特征在于,根据目标文本中的各个文本片段在目标文本中的位置分布,对目标文本中的各个文本片段与参考文本的相关度进行修正,包括:从目标文本中的各个文本片段中,选出与参考文本的相关度最高的第二数量的文本片段;按照目标文本中的其它文本片段与选出的第二数量的文本片段的距离越大,则对其它文本片段与参考文本的相关度的惩罚度越高的规则,确定对目标文本中的其它文本片段与参考文本的相关度的惩罚度;根据对目标文本中的其它文本片段与参考文本的相关度的惩罚度,对目标文本中的其它文本片段与参考文本的相关度进行惩罚。12.根据权利要求11所述的方法,其特征在于,所述方法还包括:根据目标文本中的各个文本片段与参考文本的相关度,从目标文本中选出与参考文本的相关度最高的第三数量的文本片段;根据选出的第三数量的文本片段中的各个文本片段与参考文本的相关度,从所述第三数量的文本片段中,选出与参考文本的相关度大于第一相关度阈值,或者与参考文本的相关度大于第二相关度阈值并且与参考文本的标准化相关度大于第三相关度阈值的文本片段,作为与参考文本相关的文本片段;其中,所述第一相关度阈值大于所述第二相关度阈值,所述第二相关度阈值大于所述
第三相关度阈值。13.根据权利要求4所述的方法,其特征在于,根据目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,包括:确定生成所述目标文本的文本纪要对于所述目标文本中的各个文本片段的注意力系数;根据生成所述目标文本的文本纪要对于所述目标文本中的各个文本片段的注意力系数,以及所述目标文本中的各个文本片段与参考文本的相关度,确定所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度。14.根据权利要求4所述的方法,其特征在于,至少根据所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,对所述目标文本的全文内容进行纪要生成处理,得到与所述参考文本对应的目标文本纪要,包括:至少根据所述目标文本的特征,以及所述目标文本中的各个文本片段对于生成与所述参考文本对应的文本纪要的贡献度,生成文本纪要解码特征;根据所述文本纪要解码特征,生成所述目标文本的文本纪要。15....
【专利技术属性】
技术研发人员:高建清,戚婷,闫莉,孙境廷,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。