System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本生成方法、装置及计算机设备制造方法及图纸_技高网

一种文本生成方法、装置及计算机设备制造方法及图纸

技术编号:43865474 阅读:19 留言:0更新日期:2024-12-31 18:52
本说明书提出了一种文本生成方法。获取待处理文本后,将待处理文本拆分为多个文本块。对多个文本块进行聚类,得到至少两个聚类簇,并针对每个聚类簇生成该聚类簇的摘要。在获取待处理查询后,检索与待处理查询相关的摘要,并利用检索到的摘要,生成针对待处理查询的输出文本。上述方法对RAG进行了改进。对文本块进行聚类,减少了检索时的检索范围,在一次可以检索到的文本数量有限的情况下,返回的信息可以更加全面,减少上下文信息的缺失。进而,使得通过RAG算法生成的输出文本更加全面准确。

【技术实现步骤摘要】

本说明书涉及文本生成,尤其涉及一种文本生成方法、装置及计算机设备


技术介绍

1、检索增强生成(retrieval-augmented generation,rag)算法是一种结合了检索和生成技术的人工智能模型。rag的执行过程主要包括:在文本库中检索和用户输入的查询(query)相关的文本。再根据检索到的文本以及用户输入的query,生成针对用户输入的query的输出文本。

2、现有技术中在利用rag算法的过程中,在文本库中的文本较多的情况下,由于一次性检索到的文本数量的限制,将无法检索到所有的与query相关的文本,使得最终生成的输出文本不够完整准确。


技术实现思路

1、为克服相关技术中存在的rag输出文本不够完整准确问题,本说明书提供了一种文本生成方法、装置及计算机设备。

2、根据本说明书实施例的第一方面,提供一种文本生成方法,所述方法包括:

3、获取多个文本块,并对所述多个文本块进行聚类,得到至少两个聚类簇;

4、针对每个聚类簇,根据该聚类簇对应的文本块生成该聚类簇的摘要;

5、获取待处理查询,在至少两个聚类簇分别对应的摘要中,检索与所述待处理查询相关的目标摘要;

6、根据所述待处理查询以及所述目标摘要,生成针对所述待处理查询的输出文本。

7、根据本说明书实施例的第二方面,提供一种文本生成装置,所述装置包括:

8、聚类模块,用于获取多个文本块,并对所述多个文本块进行聚类,得到至少两个聚类簇;

9、摘要生成模块,用于针对每个聚类簇,根据该聚类簇对应的文本块生成该聚类簇的摘要;

10、检索模块,用于获取待处理查询,在至少两个聚类簇分别对应的摘要中,检索与所述待处理查询相关的目标摘要;

11、文本生成模块,用于根据所述待处理查询以及所述目标摘要,生成针对所述待处理查询的输出文本。

12、根据本说明书实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本说明书实施例第一面所述的文本生成方法。

13、根据本说明书实施例的第四方面,提供一种计算机设备,所述计算机设备包括:

14、处理器;

15、存储器,用于存储计算机程序;

16、当所述计算机程序被所述处理器执行,使得所述处理器实现如本说明书实施例第一面所述的文本生成方法。

17、本说明书提出了一种文本生成方法。获取待处理文本后,将待处理文本拆分为多个文本块。对多个文本块进行聚类,得到至少两个聚类簇,并针对每个聚类簇生成该聚类簇的摘要。在获取待处理查询后,检索与待处理查询相关的摘要,并利用检索到的摘要,生成针对待处理查询的输出文本。

18、上述方法对rag进行了改进。对文本块进行聚类,减少了检索时的检索范围,在一次可以检索到的文本数量有限的情况下,返回的信息可以更加全面,减少上下文信息的缺失。进而,使得通过rag算法生成的输出文本更加全面准确。

19、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。

本文档来自技高网...

【技术保护点】

1.一种文本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述针对每个聚类簇,根据该聚类簇对应的文本块生成该聚类簇的摘要,包括:

3.根据权利要求1所述的方法,其特征在于,在所述对多个文本块进行聚类之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述对多个文本块进行聚类,得到至少两个聚类簇,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取待处理查询,包括:

6.根据权利要求1所述的方法,其特征在于,所述在至少两个聚类簇分别对应的摘要中,检索与所述待处理查询相关的目标摘要,包括:

7.根据权利要求1所述的方法,其特征在于,所述获取多个文本块,包括:

8.根据权利要求1所述的方法,其特征在于,生成针对所述待处理查询的输出文本,包括:

9.一种文本生成装置,其特征在于,所述装置包括:

10.一种计算机设备,其特征在于,所述计算机设备包括:

【技术特征摘要】

1.一种文本生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述针对每个聚类簇,根据该聚类簇对应的文本块生成该聚类簇的摘要,包括:

3.根据权利要求1所述的方法,其特征在于,在所述对多个文本块进行聚类之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述对多个文本块进行聚类,得到至少两个聚类簇,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取待处理...

【专利技术属性】
技术研发人员:白肖艳蔡雨桐夏敏易丛文管健
申请(专利权)人:深圳智现未来工业软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1