System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于减少忠实性幻觉问题的生成模型架构系统及其构建方法技术方案_技高网

用于减少忠实性幻觉问题的生成模型架构系统及其构建方法技术方案

技术编号:44069067 阅读:17 留言:0更新日期:2025-01-17 16:06
本发明专利技术公开了用于减少忠实性幻觉问题的生成模型架构系统,包括数据信息输入单元,将模态数据信息输入;信息预处理单元,将输入的模态数据信息按照目标信息进行预处理,获得数据特征信息;模型构建单元,依据预处理后的数据特征信息构建初始模型;模型训练单元,对构建的初始模型进行训练;信息处理单元,利用训练模型将数据特征信息再次进行处理,获得最终的数据特征进行输出;输出单元,将获得的数据特征信息读出;评价单元,根据输出的数据信息,判断训练模型所生成的数据信息与目标信息特征的差异;通过改进的自注意力机制、上下文感知机制和源上下文强化技术,能够有效解决大模型在生成内容时的忠实性幻觉问题,提高生成内容的质量和可靠性。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及用于减少忠实性幻觉问题的生成模型架构系统及其构建方法


技术介绍

1、在编程语言中,token通常指的是源代码中的一个单独的、有意义的单元。它可以是关键字、标识符、运算符、分隔符、字符串字面量等等。在编译器和解释器中,token常常用于词法分析、语法分析和程序解析等方面。在身份认证中,token通常是指服务器端生成的一串字符串,用作客户端进行请求的一个令牌。当用户第一次登录后,服务器生成一个token并将其返回给客户端,以后客户端只需带上这个token前来请求数据即可,无需再次带上用户名和密码。这样做的目的是为了减轻服务器的压力,减少频繁的查询数据库,使服务器更加健壮。

2、现有模型构建中,忠实性幻觉是一个常见问题,模型生成的内容可能与用户的指令或上下文不一致。这通常是由于模型在处理长序列时,对不同位置的token注意力不足,导致对上下文的理解不准确。为此本申请通过改进的自注意力机制、上下文感知机制和源上下文强化技术,能够有效解决大模型在生成内容时的忠实性幻觉问题,提高生成内容的质量和可靠性。


技术实现思路

1、本申请实施例通过提供用于减少忠实性幻觉问题的生成模型架构系统及其构建方法,通过改进的自注意力机制、上下文感知机制和源上下文强化技术,能够有效解决大模型在生成内容时的忠实性幻觉问题,提高生成内容的质量和可靠性。

2、本申请实施例提供了用于减少忠实性幻觉问题的生成模型架构系统,包括数据信息输入单元,将模态数据信息输入,所输入的模态数据信息包括文本、图像、音频等;

3、信息预处理单元,将输入的模态数据信息按照目标信息进行清洗和标准化处理,之后将信息特征进行量化、排序编码后,获得预处理后的数据特征信息;

4、模型构建单元,依据预处理后的数据特征信息构建初始模型;

5、模型训练单元,对构建的初始模型进行训练,使其按照目标信息多次进行模型训练;

6、信息处理单元,利用训练模型将数据特征信息再次进行解码排序、数值量化,获得与目标信息相似或相近的数据特征进行输出;

7、输出单元,利用语音合成技术将获得的数据特征信息读出;

8、评价单元,根据输出的数据信息,判断训练模型所生成的数据信息与目标信息特征的差异。

9、进一步的还包括信息调控分配单元,将模态数据信息的上下文数据序列进行区分,对数据特征信息着重进行分析调控,以保证初始模型构建的准确性;

10、信息监测单元,对模型训练过程中的数据信息特征实时进行监测,与目标信息进行多次比较,以便及时对数据信息特征的错误就是进行修正;

11、信息调整单元,依据监测到的数据信息特征的错误结合上下文数据序列,对构建模型进行修改。

12、进一步的信息预处理单元包括文本信息处理、语言信息处理;

13、文本信息处理将模态数据信息中的文本信息进行分析提取,生成文字记录,提取文字特征并转成数据序列;

14、语言信息处理将模态数据信息中的语音信息进行分析提取,利用语音识别技术获得语音信息中的文字信息,提取语音特征并转成数据序列。

15、进一步的信息调控分配单元包括信息对比、信息调控;

16、信息对比将模态数据信息与目标信息进行对比,同时将上下数据序列全面进行分析;

17、信息调控依据对上下数据序列全面的分析,能够识别用户输入指令的细微差别,并据此调整模型的生成行为,以生成与用户指令和上下文更加一致的内容。

18、用于减少忠实性幻觉问题的生成模型架构的构建方法,具体包括以下过程:

19、(1)将模态数据信息,例如文本、语言、图像等数据信息输入架构系统;

20、(2)对输入的数据信息进行清洗和标准化处理,将上下文的数据区分后进行调整,之后每个特征进行数值量化、排序编码后,获得预处理后的信息;

21、(3)将预处理后的信息构建初始模型;

22、(4)对构建的初始模型进行训练,模型训练过程中对数据信息特征实时进行监测,以便及时对数据信息特征的错误进行修正;

23、(5)利用训练模型生成将每个特征进行解码排序、数值量化,获得新的信息特征进行输出;

24、(6)根据输出的数据信息,判断训练模型所生成的数据信息与目标信息特征的差异。

25、本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:通过改进的自注意力机制、上下文感知机制和源上下文强化技术,能够有效解决大模型在生成内容时的忠实性幻觉问题,提高生成内容的质量和可靠性。

本文档来自技高网...

【技术保护点】

1.用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:包括数据信息输入单元,将模态数据信息输入,所输入的模态数据信息包括文本、图像、音频等;

2.如权利要求1所述的用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:还包括信息调控分配单元,将模态数据信息的上下文数据序列进行区分,对数据特征信息着重进行分析调控,以保证初始模型构建的准确性;

3.如权利要求1所述的用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:信息预处理单元包括文本信息处理、语言信息处理;

4.如权利要求1所述的用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:信息调控分配单元包括信息对比、信息调控;

5.用于减少忠实性幻觉问题的生成模型架构的构建方法,其特征在于:具体包括以下过程:

【技术特征摘要】

1.用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:包括数据信息输入单元,将模态数据信息输入,所输入的模态数据信息包括文本、图像、音频等;

2.如权利要求1所述的用于减少忠实性幻觉问题的生成模型架构系统,其特征在于:还包括信息调控分配单元,将模态数据信息的上下文数据序列进行区分,对数据特征信息着重进行分析调控,以保证初始模型构建的准确性;<...

【专利技术属性】
技术研发人员:陈科儒
申请(专利权)人:中健华夏中医药产业发展广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1