System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息抽取方法、服务器、存储介质及程序产品技术_技高网

信息抽取方法、服务器、存储介质及程序产品技术

技术编号:44888029 阅读:9 留言:0更新日期:2025-04-08 00:24
本申请提供一种信息抽取方法、服务器、存储介质及程序产品。该方法将信息抽取问题转换为链接关系分类问题,对于包含给定实体类别和文档文字信息的输入文本序列,通过多模态模型结合文档图像和文字信息中文本标记的位置坐标,预测任意两个文本标记间的链接关系,充分利用实体和实体类别间的隐含关系,可更好地理解复杂文档结构,精准预测文本标记间的链接关系;根据任意两个文本标记间的链接关系,解析得到文档包含的实体信息,可提升信息抽取的精准度;且经一次推理即可获得各类型链接关系的预测结果,提升了信息抽取的效率;另外,可以根据实际应用场景灵活地给定待抽取的实体类别集合,可以适应新兴实体类别和多变的文档布局。

【技术实现步骤摘要】

本申请涉及计算机技术,尤其涉及一种信息抽取方法、服务器、存储介质及程序产品


技术介绍

1、在当今信息化时代,企业与组织经常面临从大量非结构化文档中提取有价值数据的需求。这些文档可能包含了关键的数据信息,如合同细节、财务报表或客户数据。

2、传统的信息抽取方法,如基于规则或基于序列标注的信息抽取方法,受限于特定领域的预定义模式,使用的关键信息抽取数据集通常具有相对固定的布局和格式、且实体类别的多样性不足,难以适应多变的文档布局和新兴实体类别。另一种方法是依赖机器学习模型来实现信息抽取功能,但现有的信息抽取模型在学习过程中的对原始文档的信息利用率较低、推理速度较慢,导致信息抽取的准确性和效率较低。


技术实现思路

1、本申请提供一种信息抽取方法、服务器、存储介质及程序产品,用以解决信息抽取的准确性和效率较低、且难以适应多变的文档布局和新兴实体类别的问题。

2、第一方面,本申请提供一种信息抽取方法,包括:获取待处理文档的文档图像、文字信息和文字坐标,以及给定的至少一个实体类别;生成包含所述至少一个实体类别和所述文字信息的输入文本序列,并根据所述文字坐标确定所述文字信息中各文本标记的位置坐标;通过多模态模型,根据所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系;根据所述输入文本序列中任意两个文本标记间的链接关系,解析得到所述文档包含的实体信息。

3、第二方面,本申请提供一种信息抽取方法,包括:响应于信息抽取请求,获取待处理文档的文档图像、文字信息和文字坐标,以及给定的至少一个实体类别;生成包含所述至少一个实体类别和所述文字信息的输入文本序列,并根据所述文字坐标确定所述文字信息中各文本标记的位置坐标;通过多模态模型,根据所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系;根据所述输入文本序列中任意两个文本标记间的链接关系,解析得到所述文档包含的实体信息;输出所述文档包含的实体信息。

4、第三方面,本申请提供一种信息抽取方法,包括:响应于信息抽取请求,获取给的法律文档的文档图像、文字信息和文字坐标,以及给定的至少一个实体类别;生成包含所述至少一个实体类别和所述文字信息的输入文本序列,并根据所述文字坐标确定所述文字信息中各文本标记的位置坐标;通过多模态模型,根据所述法律文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系;根据所述输入文本序列中任意两个文本标记间的链接关系,解析得到所述法律文档包含的实体信息;输出所述法律文档包含的实体信息。

5、第四方面,本申请提供一种服务器,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述服务器执行如前述任一方面所提供的方法。

6、第五方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如前述任一方面所提供的方法。

7、第六方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如前述任一方面所提供的方法。

8、本申请提供的信息抽取方法、服务器、存储介质及程序产品,将信息抽取问题转换为链接关系分类问题(也即指针分类问题),对于包含给定至少一个实体类别和文档文字信息的输入文本序列,通过多模态模型结合文档图像和文档文字信息中各文本标记的位置坐标,来预测包含输入文本序列中任意两个文本标记间是否具有预设各类型的链接关系,也即对任意两个文本标记间的链接关系进行分类预测,得到输入文本序列中任意两个文本标记间的链接关系。多模态模型充分利用了实体和实体类别间的隐含关系,可以更好地理解复杂文档结构,精准地预测输入文本序列中任意两个文本标记间的链接关系。进一步地,根据输入文本序列中任意两个文本标记间的链接关系,按照规则进行解析,即可得到文档包含的实体信息,可以提升信息抽取的精准度。并且,多模态模型经过一次推理即可获得多种不同类型的链接关系的预测结果,实现多类型链接关系的并行预测,提升了信息抽取的效率。另外,本方案可以根据实际应用场景的需要,灵活地给定待抽取的实体类别集合,并且对文档的布局没有要求,可以很好地可以很好地适应新兴的实体类别和多变的文档布局。

本文档来自技高网...

【技术保护点】

1.一种信息抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成包含所述至少一个实体类别和文字信息的输入文本序列,包括:

3.根据权利要求1所述的方法,其特征在于,通过多模态模型,根据所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标输入多模态模型进行编码,得到所述文档的特征表示,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系之前,还包括:

7.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系之前,还包括:

8.根据权利要求1所述的方法,其特征在于,所述链接关系,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述输入文本序列中任意两个文本标记间的链接关系,解析得到所述文档包含的实体信息,包括:

10.根据权利要求1所述的方法,其特征在于,应用于键-值对信息抽取的场景时,所述链接关系,包括:

11.根据权利要求10所述的方法,其特征在于,所述根据所述输入文本序列中任意两个文本标记间的链接关系,解析得到所述文档包含的目标实体,及所述目标实体的实体类别,包括:

12.根据权利要求1-11中任一项所述的方法,其特征在于,所述获取待处理文档的文档图像、文字信息和文字坐标,以及给定的至少一个实体类别,包括:

13.根据权利要求1-11中任一项所述的方法,其特征在于,所述多模态模型的训练过程,包括:

14.一种信息抽取方法,其特征在于,包括:

15.一种信息抽取方法,其特征在于,包括:

16.根据权利要求15所述的方法,其特征在于,通过多模态模型,根据所述法律文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系,包括:

17.一种服务器,其特征在于,包括:

18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-16任一项所述的方法。

19.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-16任一项所述的方法。

...

【技术特征摘要】

1.一种信息抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成包含所述至少一个实体类别和文字信息的输入文本序列,包括:

3.根据权利要求1所述的方法,其特征在于,通过多模态模型,根据所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标,预测所述输入文本序列中任意两个文本标记间的链接关系,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述文档的文档图像、所述输入文本序列和所述文字信息中各文本标记的位置坐标输入多模态模型进行编码,得到所述文档的特征表示,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系之前,还包括:

7.根据权利要求3所述的方法,其特征在于,所述根据所述输入文本序列对应于各类链接关系的预测分数矩阵,确定所述输入文本序列中任意两个文本标记间的链接关系之前,还包括:

8.根据权利要求1所述的方法,其特征在于,所述链接关系,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述输入文本序列中任意两个文本标记间的链接关系,解...

【专利技术属性】
技术研发人员:魏楷文肖谦林君孙常龙
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1