System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 来函信息提取方法、装置、电子设备和存储介质制造方法及图纸_技高网

来函信息提取方法、装置、电子设备和存储介质制造方法及图纸

技术编号:43854775 阅读:11 留言:0更新日期:2024-12-31 18:45
本公开关于一种来函信息提取方法、装置、电子设备和存储介质,属于金融科技、信息技术产业、自然语言处理技术领域。方法包括:对目标来函携带的目标文本进行命名实体识别,得到目标命名实体;对多个目标命名实体进行关系抽取,得到多个目标命名实体之间的关系;对目标文本片段和目标文本片段对应的目标命名实体进行拼接,得到拼接文本片段;对信息提取需求和拼接文本片段进行相关性分析,得到相关性参数,并基于相关性参数,从多个拼接文本片段中确定关键文本片段;基于多个目标命名实体之间的关系,确定拼接顺序,并按照拼接顺序对多个关键文本片段进行拼接,得到目标提取文本,提高了来函信息提取的准确性,可满足目标来函的信息提取需求。

【技术实现步骤摘要】

本公开涉及金融科技、信息技术产业、自然语言处理,尤其涉及一种来函信息提取方法、装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、目前,在收到来函之后,往往需要对来函进行信息提取,以了解来函内容,并将提取出的来函信息录入系统。然而,相关技术中,大多依赖人工对来函进行信息提取,导致来函信息提取效率低,而且无法满足来函的信息提取需求,提取出的来函信息的可读性差。


技术实现思路

1、本公开提供一种来函信息提取方法、装置、电子设备、计算机可读存储介质和计算机程序产品,以至少解决相关技术中无法满足来函的信息提取需求、提取出的来函信息的可读性差、来函信息提取效率低的问题。本公开的技术方案如下:

2、根据本公开实施例的第一方面,提供一种来函信息提取方法,包括:对目标来函携带的目标文本进行命名实体识别,得到所述目标文本的多个目标文本片段各自对应的目标命名实体;对多个所述目标命名实体进行关系抽取,得到多个所述目标命名实体之间的关系;对所述目标文本片段和所述目标文本片段对应的目标命名实体进行拼接,得到拼接文本片段;对所述目标来函的信息提取需求和所述拼接文本片段进行相关性分析,得到相关性参数,并基于所述相关性参数,从多个所述拼接文本片段中确定关键文本片段;基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,并按照所述拼接顺序对多个所述关键文本片段进行拼接,得到所述目标来函的目标提取文本。

3、根据本公开实施例的第二方面,提供一种来函信息提取装置,包括:识别模块,被配置为对目标来函携带的目标文本进行命名实体识别,得到所述目标文本的多个目标文本片段各自对应的目标命名实体;抽取模块,被配置为对多个所述目标命名实体进行关系抽取,得到多个所述目标命名实体之间的关系;第一拼接模块,被配置为对所述目标文本片段和所述目标文本片段对应的目标命名实体进行拼接,得到拼接文本片段;确定模块,被配置为对所述目标来函的信息提取需求和所述拼接文本片段进行相关性分析,得到相关性参数,并基于所述相关性参数,从多个所述拼接文本片段中确定关键文本片段;第二拼接模块,被配置为基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,并按照所述拼接顺序对多个所述关键文本片段进行拼接,得到所述目标来函的目标提取文本。

4、根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如前第一方面所述的来函信息提取方法。

5、根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如前第一方面所述的来函信息提取方法。

6、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如前第一方面所述的来函信息提取方法。

7、本公开的实施例提供的技术方案至少带来以下有益效果:可对目标文本片段和目标文本片段对应的目标命名实体进行拼接,得到拼接文本片段,并考虑到相关性参数从多个拼接文本片段中自动确定关键文本片段,关键文本片段与目标来函的信息提取需求相匹配,提高了来函信息提取的准确性,可满足目标来函的信息提取需求,并且仅需按照拼接顺序对多个关键文本片段进行拼接,得到目标提取文本,无需对所有的拼接文本片段进行拼接,提高了来函信息提取效率,另外,还可考虑到多个目标命名实体之间的关系,确定多个关键文本片段的拼接顺序,可实现拼接顺序的灵活确定,相较于相关技术中对提取出的来函信息随意排列,本方案中可按照拼接顺序对提取出的多个关键文本片段进行有序排列,以得到目标提取文本,提高了目标提取文本的可读性和规范性,并可实现来函信息的自动提取。

8、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种来函信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述相关性参数,从多个所述拼接文本片段中确定关键文本片段,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述关系图中节点的层级,确定所述拼接顺序,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,包括:

7.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,包括:

8.根据权利要求1所述的方法,其特征在于,所述对目标来函携带的目标文本进行命名实体识别,得到所述目标文本的多个目标文本片段各自对应的目标命名实体,包括:

9.根据权利要求1-8中任一项所述的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的方法,其特征在于,所述方法还包括:

11.一种来函信息提取装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-10中任一项所述的来函信息提取方法。

14.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-10中任一项所述的来函信息提取方法。

...

【技术特征摘要】

1.一种来函信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述相关性参数,从多个所述拼接文本片段中确定关键文本片段,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述关系图中节点的层级,确定所述拼接顺序,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,包括:

7.根据权利要求1所述的方法,其特征在于,所述基于多个所述目标命名实体之间的关系,确定多个所述关键文本片段的拼接顺序,...

【专利技术属性】
技术研发人员:张永星
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1