System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能和金融科技领域,尤其涉及一种文本摘要生成方法、装置、设备及存储介质。
技术介绍
1、随着金融行业的快速发展,特别是在保险领域中,各类业务文档的数量和复杂度逐渐增加。保险公司需要处理海量的文本数据,如保险合同、理赔条款、客户反馈等。如何从这些庞大的数据中快速、准确地提取关键信息,为客户提供简明、易懂的内容,成为了行业中的一大难题。目前,文本摘要生成技术主要分为两类:抽取式摘要和生成式摘要。
2、抽取式摘要技术通过从原文中挑选出一些重要的句子或段落,直接拼接生成摘要。这种方法的优点在于摘要内容与原文一致,确保了信息的准确性。然而,由于抽取式摘要缺乏对整体语义结构的深层理解,无法灵活生成满足特定需求的个性化摘要。因此,摘要质量容易受到原文结构和句子质量的限制,生成的内容可能冗长、缺乏连贯性,无法准确抓住文本的核心要点。
3、生成式摘要利用自然语言生成技术,通过重新组织和表达文档中的主要内容生成摘要。这类方法能够根据不同的场景和需求灵活生成个性化的摘要。然而,现有生成式摘要方法主要依赖于序列网络,如长短期记忆网络(lstm)和门控循环单元(gru)。这些模型在处理短文本时效果较好,但由于其局限性,难以捕捉长程依赖的语义信息。因此,在处理长文本或复杂文档时,生成的摘要质量较差,往往无法精准地传达文本中的重要信息。
4、此外,现有的生成式摘要模型在处理不同领域的专业文本时也存在不足。特别是对于金融和保险行业中的专业术语和领域特定的表达,模型无法有效区分通用语义与领域特定语义。这导致了
技术实现思路
1、本专利技术的主要目的在于提供一种文本摘要生成方法、装置、设备及存储介质,旨在解决现有技术难以有效捕捉长文本中的复杂语义关系,且在生成个性化摘要时缺乏对领域特定信息的处理能力的技术问题。
2、为实现上述目的,本专利技术提供一种文本摘要生成方法,包括:
3、获取目标领域的业务文本,根据所述业务文本分别生成通用词汇嵌入矩阵和目标领域特定词汇嵌入矩阵;
4、将所述通用词汇嵌入矩阵和所述目标领域特定词汇嵌入矩阵根据权重参数进行加权融合,生成融合词嵌入矩阵;
5、基于所述融合词嵌入矩阵,对所述业务文本中句子的每个词嵌入向量进行相加并取平均值,生成句子嵌入矩阵;
6、定义与目标领域相关的多个主题,并基于多个主题生成对应的主题嵌入矩阵;
7、利用所述融合词嵌入矩阵、句子嵌入矩阵和主题嵌入矩阵,构建包含单词节点、句子节点和主题节点的多粒度异构图,并确定单词节点、句子节点和主题节点之间的连接关系;
8、基于所述单词节点、句子节点和主题节点之间的连接关系,利用图神经网络对多粒度异构图中的节点进行特征更新,生成更新后的节点特征表示;
9、基于所述更新后的节点特征表示,通过解码器生成所述业务文本的文本摘要。
10、进一步地,为实现上述目的,本专利技术提供一种文本摘要生成装置,包括:
11、词汇嵌入生成模块,用于获取目标领域的业务文本,根据所述业务文本分别生成通用词汇嵌入矩阵和目标领域特定词汇嵌入矩阵;
12、词汇嵌入融合模块,用于将所述通用词汇嵌入矩阵和所述目标领域特定词汇嵌入矩阵根据权重参数进行加权融合,生成融合词嵌入矩阵;
13、句子嵌入生成模块,用于基于所述融合词嵌入矩阵,对所述业务文本中句子的每个词嵌入向量进行相加并取平均值,生成句子嵌入矩阵;
14、主题嵌入生成模块,用于定义与目标领域相关的多个主题,并基于多个主题生成对应的主题嵌入矩阵;
15、多粒度异构图构建模块,用于利用所述融合词嵌入矩阵、句子嵌入矩阵和主题嵌入矩阵,构建包含单词节点、句子节点和主题节点的多粒度异构图,并确定单词节点、句子节点和主题节点之间的连接关系;
16、特征更新模块,用于基于所述单词节点、句子节点和主题节点之间的连接关系,利用图神经网络对多粒度异构图中的节点进行特征更新,生成更新后的节点特征表示;
17、文本摘要生成模块,用于基于所述更新后的节点特征表示,通过解码器生成所述业务文本的文本摘要。
18、进一步地,为实现上述目的,本专利技术还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的文本摘要生成程序,所述文本摘要生成程序被所述处理器执行时实现如上述所述的文本摘要生成方法的步骤。
19、进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述存储介质上存储有文本摘要生成程序,所述文本摘要生成程序被处理器执行时实现如上所述的文本摘要生成方法的步骤。
20、有益效果:本专利技术涉及人工智能
和金融科技领域,公开了一种文本摘要生成方法,通过获取目标领域的业务文本,生成通用词汇嵌入矩阵和目标领域特定词汇嵌入矩阵,基于权重参数对两者进行加权融合,形成融合词嵌入矩阵。业务文本中的每个词汇嵌入向量相加并取平均值,生成句子嵌入矩阵。通过定义多个主题,生成相应的主题嵌入矩阵。结合上述矩阵,构建包含单词、句子、主题节点的多粒度异构图,确定节点之间的连接关系。利用图神经网络对节点进行特征更新,并通过解码器生成文本摘要。本专利技术通过结合通用词汇与领域特定词汇的语义信息,并利用多模态语义相似性捕捉文本中的复杂关系,增强了文本中的关键信息提取能力,实现了生成个性化文本摘要的效果,提升了文本摘要的质量,改善了客户的阅读体验和满意度。
【技术保护点】
1.一种文本摘要生成方法,其特征在于,包括以下步骤:
2.如权利要求1所述的文本摘要生成方法,其特征在于,利用所述融合词嵌入矩阵、句子嵌入矩阵和主题嵌入矩阵,构建包含单词节点、句子节点和主题节点的多粒度异构图,并确定单词节点、句子节点和主题节点之间的连接关系,包括:
3.如权利要求2所述的文本摘要生成方法,其特征在于,基于多模态相似性,在单词节点之间建立连接,包括:
4.如权利要求1中所述的文本摘要生成方法,其特征在于,基于节点之间的连接关系,利用图神经网络对多粒度异构图中的节点进行特征更新,生成更新后的节点特征表示,包括:
5.如权利要求1所述的文本摘要生成方法,其特征在于,获取目标领域的业务文本,根据所述业务文本分别生成通用词汇嵌入矩阵和目标领域特定词汇嵌入矩阵,包括:
6.如权利要求1所述的文本摘要生成方法,其特征在于,将所述通用词汇嵌入矩阵与所述目标领域特定词汇嵌入矩阵根据权重参数进行加权融合,生成融合词嵌入矩阵,包括:
7.如权利要求1所述的文本摘要生成方法,其特征在于,基于所述更新后的节点特征表示
8.一种文本摘要生成装置,其特征在于,所述文本摘要生成装置包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可以在所述处理器上运行的文本摘要生成程序,所述文本摘要生成程序被所述处理器执行时实现如权利要求1-7中任一项所述的文本摘要生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有文本摘要生成程序,所述文本摘要生成程序被处理器执行时实现如权利要求1-7中任一项所述的文本摘要生成方法的步骤。
...【技术特征摘要】
1.一种文本摘要生成方法,其特征在于,包括以下步骤:
2.如权利要求1所述的文本摘要生成方法,其特征在于,利用所述融合词嵌入矩阵、句子嵌入矩阵和主题嵌入矩阵,构建包含单词节点、句子节点和主题节点的多粒度异构图,并确定单词节点、句子节点和主题节点之间的连接关系,包括:
3.如权利要求2所述的文本摘要生成方法,其特征在于,基于多模态相似性,在单词节点之间建立连接,包括:
4.如权利要求1中所述的文本摘要生成方法,其特征在于,基于节点之间的连接关系,利用图神经网络对多粒度异构图中的节点进行特征更新,生成更新后的节点特征表示,包括:
5.如权利要求1所述的文本摘要生成方法,其特征在于,获取目标领域的业务文本,根据所述业务文本分别生成通用词汇嵌入矩阵和目标领域特定词汇嵌入矩阵,包括:
6.如权利要求1所述的文本摘...
【专利技术属性】
技术研发人员:刘羲,蒋世佳,舒畅,陈远旭,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。