System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种摘要生成方法及装置、存储介质制造方法及图纸_技高网

一种摘要生成方法及装置、存储介质制造方法及图纸

技术编号:40774625 阅读:6 留言:0更新日期:2024-03-25 20:21
本申请实施例提供了一种摘要生成方法及装置、存储介质,该方法包括:获取目标文档;并提取目标文档中的语句对应的句向量和位置向量,以及目标文档中的字符对应的字符向量;按照预设滑动窗口规则遍历句向量、位置向量和字符向量,从句向量、位置向量和字符向量中依次选取部分句向量、部分位置向量和部分字符向量,并将选取出的多个部分句向量、多个部分位置向量和多个部分字符向量生成多个片段向量;对多个片段向量进行融合,得到目标文档中多条语句对应的多个语句向量;基于多个语句向量,从多条语句选取至少一条语句生成目标文档对应的摘要。

【技术实现步骤摘要】

本申请涉及深度学习领域,尤其涉及一种摘要生成方法及装置、存储介质


技术介绍

1、随着电子文本数量的剧增,快速获取文本信息的需求越来越强烈。作为浓缩文本信息的技术,摘要可以扮演重要的角色。摘要的宗旨是为用户提供简短的文本表示。在保留尽可能多的原文信息的同时,形成尽可能短的摘要。对于一个理想的抽取式摘要而言,具有三个基本特征:源自文本、保留重要信息、长度短。

2、现有的抽取式摘要是从原文中获取多个关键词组成摘要,虽然在语法、句法上有一定的保证,但是也面临着内容选择错误和连贯性差等问题,导致生成的摘要不能清楚的表达原文的含义。


技术实现思路

1、本申请实施例提供一种摘要生成方法及装置、存储介质,能够使得生成的摘要清楚的表达原文的含义。

2、本申请的技术方案是这样实现的:

3、第一方面,本申请实施例提供一种摘要生成方法,所述方法包括:

4、获取目标文档;并提取所述目标文档中的语句对应的句向量和位置向量,以及所述目标文档中的字符对应的字符向量;

5、按照预设滑动窗口规则遍历所述句向量、所述位置向量和所述字符向量,从所述句向量、所述位置向量和所述字符向量中依次选取部分句向量、部分位置向量和部分字符向量,并将选取出的多个部分句向量、多个部分位置向量和多个部分字符向量生成多个片段向量;

6、对所述多个片段向量进行融合,得到所述目标文档中多条语句对应的多个语句向量;

7、基于所述多个语句向量,从所述多条语句选取至少一条语句生成所述目标文档对应的摘要。

8、在上述摘要生成方法中,所述方法还包括:

9、利用预设摘要生成模型中的向量生成网络,提取所述句向量、所述位置向量和所述字符向量;

10、利用所述向量生成网络中的预设滑动窗口规则依次选取所述部分句向量、所述部分位置向量和所述部分字符向量,并将所述多个部分句向量、所述多个部分位置向量和所述多个部分字符向量生成多个片段向量;

11、利用所述向量生成网络,对所述多个片段向量进行融合,得到所述目标文档中多条语句对应的多个语句向量。

12、在上述摘要生成方法中,所述方法还包括:

13、利用预设摘要生成模型中的特征提取网络对多个语句向量进行特征提取,得到所述多个语句向量对应的多个语句特征值;

14、利用预设摘要生成模型中的预设激活函数,将所述多个语句特征值转换为多个权重值,并将所述多个权重值按照从大到小的顺序进行排序,得到多个排序后的权重值;

15、从所述多个排序后的权重值中选取前预设个数的权重值,并从所述目标文档中的语句确定出所述前预设个数的权重值对应的至少一条语句,将所述至少一条语句组成所述目标文档对应的摘要。

16、在上述摘要生成方法中,所述方法还包括:

17、获取初始样本文档和所述初始样本文档对应的样本摘要,并基于所述样本摘要为所述初始样本文档中的每条语句添加对应的语句标签,得到目标样本文档;所述语句标签包括表征该语句属于所述初始样本文档中摘要的第一语句标签和表征该语句不属于所述初始样本文档中摘要的第二语句标签;

18、将所述目标样本文档输入初始摘要生成模型中,得到属于所述目标样本文档中摘要的第一语句集合和不属于所述目标样本文档中摘要的第二语句集合;所述初始摘要生成模型中包括向量生成网络、特征提取网络和预设激活函数;

19、基于所述第一语句集合、所述第二语句集合、所述第一语句标签和所述第二语句标签对所述初始摘要生成模型进行训练,得到预设摘要生成模型。

20、在上述摘要生成方法中,所述预设激活函数为sigmoid函数。

21、第二方面,本申请实施例提供一种摘要生成装置,所述装置包括:

22、获取单元,用于获取目标文档;并提取所述目标文档中的语句对应的句向量和位置向量,以及所述目标文档中的字符对应的字符向量;

23、选取单元,用于按照预设滑动窗口规则遍历所述句向量、所述位置向量和所述字符向量,从所述句向量、所述位置向量和所述字符向量中依次选取部分句向量、部分位置向量和部分字符向量,并将选取出的多个部分句向量、多个部分位置向量和多个部分字符向量生成多个片段向量;

24、融合单元,用于对所述多个片段向量进行融合,得到所述目标文档中多条语句对应的多个语句向量;

25、所述选取单元,还用于基于所述多个语句向量,从所述多条语句选取至少一条语句生成所述目标文档对应的摘要。

26、在上述摘要生成装置中,所述装置还包括:提取单元;

27、所述提取单元,用于利用预设摘要生成模型中的向量生成网络,提取所述句向量、所述位置向量和所述字符向量;

28、所述选取单元,还用于利用所述向量生成网络中的预设滑动窗口规则依次选取所述部分句向量、所述部分位置向量和所述部分字符向量,并将所述多个部分句向量、所述多个部分位置向量和所述多个部分字符向量生成多个片段向量;

29、所述融合单元,还用于利用所述向量生成网络,对所述多个片段向量进行融合,得到所述目标文档中多条语句对应的多个语句向量。

30、在上述摘要生成装置中,所述装置还包括:数据处理单元;

31、所述提取单元,还用于利用预设摘要生成模型中的特征提取网络对多个语句向量进行特征提取,得到所述多个语句向量对应的多个语句特征值;

32、所述数据处理单元,用于利用预设摘要生成模型中的预设激活函数,将所述多个语句特征值转换为多个权重值,并将所述多个权重值按照从大到小的顺序进行排序,得到多个排序后的权重值;

33、所述选取单元,还用于从所述多个排序后的权重值中选取前预设个数的权重值,并从所述目标文档中的语句确定出所述前预设个数的权重值对应的至少一条语句,将所述至少一条语句组成所述目标文档对应的摘要。

34、第三方面,本申请实施例提供一种摘要生成设备,其特征在于,所述设备包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如上述任一项所述的摘要生成方法。

35、第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上述任一项所述的摘要生成方法。

36、本申请实施例提供了一种摘要生成方法及装置、存储介质,该方法包括:获取目标文档;并提取目标文档中的语句对应的句向量和位置向量,以及目标文档中的字符对应的字符向量;按照预设滑动窗口规则遍历句向量、位置向量和字符向量,从句向量、位置向量和字符向量中依次选取部分句向量、部分位置向量和部分字符向量,并将选取出的多个部分句向量、多个部分位置向量和多个部分字符向量生成多个片段向量;对多个片段向量进行融合,得到目标文档中多条语句对应的多个语句向量;基于多个语句向量,从多条语句选取至少一条语句生成目标文档对应的摘要;采用上述实现方案,本申请在生成摘要时是从文本文档来自技高网...

【技术保护点】

1.一种摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述预设激活函数为Sigmoid函数。

6.一种摘要生成装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:提取单元;

8.根据权利要求6所述的装置,其特征在于,所述装置还包括:数据处理单元;

9.一种摘要生成设备,其特征在于,所述设备包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如权利要求1-5中任一项所述的方法。

10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。

【技术特征摘要】

1.一种摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述预设激活函数为sigmoid函数。

6.一种摘要生成装置,其特征在于,所述装置包括:

7.根据...

【专利技术属性】
技术研发人员:张勇雷萌涂浩
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1