System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书实施例涉及人工智能,尤其涉及一种公告文书生成方法、装置及设备。
技术介绍
1、随着机器人流程自动化技术的发展,目前大多利用自动化的方式生成公告文书,例如基于机器人流程自动化rpa和公告模板的方法、生成式模型的方法、单一向量库类案检索的大模型方法等生成公告文书。
2、但基于机器人流程自动化rpa和公告模板的方法虽然简单快捷,但该方法中所使用的模板需要固定大量文本片段,使得生成的文书往往千篇一律,缺乏必要的创造性和个性化表达,且对预设模板的依赖性极大,对于模板中未涵盖的要素类型或特殊情况,难以灵活应,导致生成的文书无法满足实际需求,当涉及的模板或模板要素发生变化时,还需要手动更新规则,维护工作量大。
3、而传统生成式模型的方法在通用语料数据上进行预训练,再在特定的文本生成任务上进行微调,在微调阶段,需要人工标注原始材料到最终公告内容的训练集,模型会使用该训练集来进一步训练,通过大量的示例文书来捕捉文本的复杂性和特定格式,以便模型更好地理解材料和生成报告。该方法虽然提高了灵活性,但在多样性方面存在不足,生成的文本可能会显得过于标准化,缺乏个性化表达,且输入信息的可接受长度,与输出文本的最大长度都偏小,难以满足复杂多样的文书场景,对于模型未见过的新类型模板或模板要素,需要重新收集大量数据并标注,造成工作量较大。
4、单一向量库类案检索的大模型方法通常采用文本嵌入模型将历史案例文本或文本块进行向量化存入向量数据库。在使用中,通过向量匹配文本相似度获取关联的类案作为rag上下文提示。然后拼接rag
5、如何生成高专业性、高准确性的公告文书并能够提高自动化水平且在一定程度上减轻工作量是目前亟待解决的问题。
技术实现思路
1、本说明书实施例提供了一种公告文书生成方法、装置及设备,利用大规模语言模型的强大文本生成能力以及检索增强生成技术的信息丰富性生成公告文书,提高了公告文书生成的自动化水平、专业性和准确性,大幅降低工作量。
2、本说明书实施例的具体技术方案如下:
3、一方面,本说明书实施例提供了一种公告文书生成方法,包括,
4、获取待生成的公告文书对应的公告基本信息和上游文书,所述上游文书表示待生成的公告文书对应的主题信息;
5、从历史案例库中获取与所述上游文书对应的历史案例,作为参考案例;
6、从大纲模板库中获取与所述公告基本信息对应的大纲模板;
7、根据所述上游文书、大纲模板和参考案例生成公告文书生成指令;
8、将所述公告文书生成指令输入到预先训练好的大规模语言模型中进行计算,得到所述公告文书。
9、进一步地,所述公告基本信息包括公告类型;
10、从大纲模板库中获取与所述公告基本信息对应的大纲模板进一步包括:
11、从所述大纲模板库中获取与所述公告类型对应的大纲模板,所述大纲模板库中包括多种公告类型以及各公告类型对应的预先建立好的大纲模板。
12、进一步地,所述历史案例库包括案例文本库、案例向量库和要素知识库。
13、进一步地,构建所述案例文本库的步骤包括:
14、利用历史案例对应的大纲模板对所述历史案例进行半结构化拆解,得到所述历史案例的文本段落结构和多个文本段落对应的文本段落内容,将所述文本段落结构、文本段落内容、文本段落以及所述历史案例四者的对应关系存储在所述案例文本库中;
15、构建所述案例向量库的步骤包括:
16、将所述案例文本库中历史案例的文本段落内容通过文本嵌入模型转化为历史案例向量,将所述历史案例向量、文本段落以及历史案例三者之间的对应关系存储在所述案例向量库中;
17、构建所述要素知识库的步骤包括:
18、将所述案例文本库中历史案例的文本段落内容通过知识抽取模型转化为历史案例要素,将所述历史案例要素、文本段落以及历史案例三者之间的对应关系存储在所述案例向量库中。
19、进一步地,从历史案例库中获取与所述上游文书对应的历史案例,作为参考案例进一步包括:
20、根据所述上游文书在所述案例文本库中通过条件筛选和全文检索的方式匹配所述文本段落内容,并得到匹配到的属于同一历史案例的文本段落内容共同对应文本段落结构,将匹配到的文本段落内容、相应的文本段落、相应的文本段落结构以及所属的历史案例作为参考案例文本;
21、将所述上游文书通过文本嵌入模型转化为语义向量,并根据所述上游文书的语义向量在所述案例向量库中通过条件筛选和全文检索的方式匹配历史案例向量,并得到匹配到的历史案例向量对应的文本段落,将所述历史案例向量相应的文本段落以及所述的历史案例作为参考案例向量;
22、将所述上游文书通过知识抽取模型提取案例要素,并根据所述上游文书的案例要素在所述要素知识库中通过条件筛选和全文检索的方式匹配历史案例要素,并得到匹配到的历史案例要素对应的文本段落,将所述历史案例要素、相应的文本段落以及所述的历史案例作为参考案例要素;
23、对所述参考案例文本、参考案例向量和参考案例要素按照相应的文本段落和所述文本段落结构进行聚合,得到所述参考案例。
24、进一步地,对所述参考案例文本、参考案例向量和参考案例要素按照相应的文本段落和所述文本段落结构进行聚合,得到所述参考案例进一步包括:
25、将同一历史案例下的同一文本段落对应的文本段落内容、历史案例向量、历史案例要素进行聚合,得到该文本段落对应的文本段落案例;
26、将同一历史案例下的多个文本段落案例按照该历史案例对应的文本段落结构进行聚合,得到所述参考案例。
27、进一步地,所述方法还包括:
28、计算各参考案例文本与所述上游文书之间的第一匹配评分;
29、计算各参考案例向量与所述上游文书的语义向量之间的第二匹配评分;
30、计算各参考案例要素与所述上游文书的案例要素之间的第三匹配评分;
31、在得到多个参考案例时,针对每个参考案例,根据该参考案例中每个文本段落案例对应的所述参考案例文本的第一匹配评分、参考案例向量的第二匹配评分和所述参考案例要素的第三匹配评分进行加权求和,得到该文本段落案例的段落聚合评分,并对根据该参考案例下多个文本段落案例的段落聚合评分计算该参考案例的最终评分;
32、从多个参考案例中选择所述最终评分满足预定评分要求的至少一个参考案例,作为最终的参考案例。
33、进一步地,根据所述上游文书、大纲模板和参考案例生成公告文书生成指令进一步包括:
34、提取所述参考案例中所述大纲模板的多个板块对应的内容;
35、根据上游文书、大纲模板的多个板块对应的内容生成所述本文档来自技高网...
【技术保护点】
1.一种公告文书生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述公告基本信息包括公告类型;
3.根据权利要求1所述的方法,其特征在于,所述历史案例库包括案例文本库、案例向量库和要素知识库。
4.根据权利要求3所述的方法,其特征在于,构建所述案例文本库的步骤包括:
5.根据权利要求4所述的方法,其特征在于,从历史案例库中获取与所述上游文书对应的历史案例,作为参考案例进一步包括:
6.根据权利要求5所述的方法,其特征在于,对所述参考案例文本、参考案例向量和参考案例要素按照相应的文本段落和所述文本段落结构进行聚合,得到所述参考案例进一步包括:
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
8.根据权利要求1所述的方法,其特征在于,根据所述上游文书、大纲模板和参考案例生成公告文书生成指令进一步包括:
9.一种公告文书生成装置,其特征在于,所述装置包括:
10.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其
...【技术特征摘要】
1.一种公告文书生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述公告基本信息包括公告类型;
3.根据权利要求1所述的方法,其特征在于,所述历史案例库包括案例文本库、案例向量库和要素知识库。
4.根据权利要求3所述的方法,其特征在于,构建所述案例文本库的步骤包括:
5.根据权利要求4所述的方法,其特征在于,从历史案例库中获取与所述上游文书对应的历史案例,作为参考案例进一步包括:
6.根据权利要求5所述的方法,其特征在于,对所述参考案例文本...
【专利技术属性】
技术研发人员:孙福辉,陈宝贵,黄国栋,李晓慧,张雅雯,
申请(专利权)人:人民法院信息技术服务中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。