System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、电子设备和计算机程序产品技术_技高网

数据处理方法、电子设备和计算机程序产品技术

技术编号:43727972 阅读:4 留言:0更新日期:2024-12-20 12:54
本申请公开了一种数据处理方法、电子设备和计算机程序产品,涉及大模型技术和数据查询技术领域。其中,该方法包括:获取待处理的查询数据,其中,查询数据用于提供待解答的提问内容;将查询数据与检索数据输入至语言模型,生成初始回复数据,其中,检索数据为依据查询数据从目标数据集中检索到的待移除数据,初始回复数据为查询数据的预测过程中产生的误导数据;将查询数据、检索数据以及初始回复数据输入至语言模型,获取查询数据对应的目标回复数据。本申请解决了相关技术中采用模型参数更新或者梯度上升的方式训练查询数据处理模型其模型遗忘性能较差、数据泄露风险高、模型训练成本高的技术问题。

【技术实现步骤摘要】

本申请涉及大模型技术和数据查询,具体而言,涉及一种数据处理方法、电子设备和计算机程序产品


技术介绍

1、目前,大语言模型(large language models,简称llms)的快速进步为自然语言处理相关的各种方案提供了更好的文本生成能力、语言理解能力和语言交互能力。为了进一步提升模型性能,大语言模型的训练数据规模被大幅度扩展,训练数据中的敏感数据(比如版权书籍、用户私人信息、联系方式等)可能会在大语言模型的生成内容中暴露。为了确保llms的生成内容不会泄露敏感数据,相关
中提出机器遗忘(machine unlearning,简称mu)技术,从llms的训练数据中移除敏感数据从而完成训练。

2、相关技术中的mu技术通常通过对llms进行参数微调或者通过在预先设计的数据集上进行梯度上升,由此调整llms的记忆以减少敏感数据暴露的风险,但是,上述mu技术会为llms的训练带来较高的计算成本,削弱llms的整体性能。由于训练数据中的敏感数据以及遗忘技术的需求环境会在实际应用场景中会动态变化,这会进一步提升现有mu技术中参数更新的难度,进一步增加计算成本。此外,根据现有的mu技术,在llms的训练过程中访问模型参数将会限制训练得到的llms在更广泛的场景中的应用。

3、由上可知,如何提升大语言模型训练中的遗忘性能以降低敏感数据泄露风险、降低模型训练成本称为相关
中的重要技术问题之一。

4、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路</p>

1、本申请实施例提供了一种数据处理方法、电子设备和计算机程序产品,以至少解决相关技术中采用模型参数更新或者梯度上升的方式训练查询数据处理模型其模型遗忘性能较差、数据泄露风险高、模型训练成本高的技术问题。

2、根据本申请实施例的一个方面,提供了一种数据处理方法,包括:获取待处理的查询数据,其中,查询数据用于提供待解答的提问内容;将查询数据与检索数据输入至语言模型,生成初始回复数据,其中,检索数据为依据查询数据从目标数据集中检索到的待移除数据,初始回复数据为查询数据的预测过程中产生的误导数据;将查询数据、检索数据以及初始回复数据输入至语言模型,获取查询数据对应的目标回复数据。

3、根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理的文化知识查询数据,其中,文化知识查询数据用于提供待解答的文化知识提问内容;将文化知识查询数据与文化知识检索数据输入至语言模型,生成文化知识初始回复数据,其中,文化知识检索数据为依据文化知识查询数据从目标数据集中获取的待移除数据,文化知识初始回复数据为对文化知识查询数据的预测过程产生误导的知识;将文化知识查询数据、文化知识检索数据以及文化知识初始回复数据输入至语言模型,获取文化知识查询数据对应的文化知识目标回复数据。

4、根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:通过第一应用程序编程接口获取查询处理请求;通过第二应用程序编程接口返回查询处理响应;其中,查询处理请求中携带的请求数据包括:待处理的查询数据,查询数据用于提供待解答的提问内容,查询处理响应中携带的响应数据包括:查询数据对应的目标回复数据,目标回复数据利用查询数据、检索数据以及初始回复数据获取得到,初始回复数据基于查询数据与检索数据生成,检索数据为依据查询数据从目标数据集中获取的数据,初始回复数据为对查询数据的预测过程产生误导的知识。

5、根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取当前输入的查询处理对话请求;响应于查询处理对话请求,返回查询处理对话回复;其中,查询处理对话请求中携带的请求数据包括:待处理的查询数据,查询数据用于提供待解答的提问内容,查询处理对话回复中携带的信息包括:查询数据对应的目标回复数据,目标回复数据利用查询数据、检索数据以及初始回复数据获取得到,初始回复数据基于查询数据与检索数据生成,检索数据为依据查询数据从目标数据集中获取的数据,初始回复数据为对查询数据的预测过程产生误导的知识;在图形用户界面内展示目标回复数据。

6、根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器,存储有可执行程序;处理器,用于运行程序,其中,程序运行时执行上述任意一项的数据处理方法。

7、根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的可执行程序,其中,在可执行程序运行时控制计算机可读存储介质所在设备执行上述任意一项的数据处理方法。

8、根据本申请实施例的另一方面,还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述任意一项的数据处理方法。

9、在本申请实施例中,获取待处理的查询数据,其中,查询数据用于提供待解答的提问内容;将查询数据与检索数据输入至语言模型,生成初始回复数据,其中,检索数据为依据查询数据从目标数据集中检索到的待移除数据,初始回复数据为查询数据的预测过程中产生的误导数据;将查询数据、检索数据以及初始回复数据输入至语言模型,获取查询数据对应的目标回复数据。由此,本申请利用查询数据对应的遗忘知识集中的知识生成初始回复数据,从而通过初始回复数据得到目标回复数据,实现查询数据处理中的模型遗忘机制,这种模型遗忘机制不但能降低查询处理中的数据泄露风险,还不会带来较多的成本增加,也就是说,本申请达到了以较低成本针对查询数据给出准确的目标回复数据的目的,从而实现了提升查询数据处理模型的遗忘性能、降低敏感数据泄露风险以及降低查询数据处理成本的技术效果,进而解决了相关技术中采用模型参数更新或者梯度上升的方式训练查询数据处理模型其模型遗忘性能较差、数据泄露风险高、模型训练成本高的技术问题。

10、容易注意到的是,上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释,并不构成对本申请的限定。

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述数据处理方法还包括:

3.根据权利要求2所述的数据处理方法,其特征在于,依据所述查询数据对所述目标数据集进行数据检索,得到所述查询数据关联的主题与实体包括:

4.根据权利要求1所述的数据处理方法,其特征在于,将所述查询数据与所述检索数据输入至所述语言模型,生成所述初始回复数据包括:

5.根据权利要求1所述的数据处理方法,其特征在于,将所述查询数据、所述检索数据以及所述初始回复数据输入至所述语言模型,获取所述查询数据对应的所述目标回复数据包括:

6.根据权利要求1所述的数据处理方法,其特征在于,所述数据处理方法还包括:

7.根据权利要求6所述的数据处理方法,其特征在于,基于所述分布内数据与所述合成数据生成所述目标数据集包括:

8.根据权利要求7所述的数据处理方法,其特征在于,基于所述分布内数据与所述合成数据生成所述目标数据集还包括:

9.一种数据处理方法,其特征在于,包括:

10.根据权利要求9所述的数据处理方法,其特征在于,所述数据处理方法还包括:

11.一种数据处理方法,其特征在于,包括:

12.一种数据处理方法,其特征在于,包括:

13.一种电子设备,其特征在于,包括:

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至12中任意一项所述的数据处理方法。

15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1至12中任意一项所述的数据处理方法。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述数据处理方法还包括:

3.根据权利要求2所述的数据处理方法,其特征在于,依据所述查询数据对所述目标数据集进行数据检索,得到所述查询数据关联的主题与实体包括:

4.根据权利要求1所述的数据处理方法,其特征在于,将所述查询数据与所述检索数据输入至所述语言模型,生成所述初始回复数据包括:

5.根据权利要求1所述的数据处理方法,其特征在于,将所述查询数据、所述检索数据以及所述初始回复数据输入至所述语言模型,获取所述查询数据对应的所述目标回复数据包括:

6.根据权利要求1所述的数据处理方法,其特征在于,所述数据处理方法还包括:

7.根据权利要求6所述的数据处理方法,其特征在于,基于所述分布内数据与所述合成数据生成所述目标数据集包...

【专利技术属性】
技术研发人员:李赵东晖汪会明苏德文丛高邴立东
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1