一种AIGC隐私数据保护方法、系统、设备及存储介质技术方案

技术编号：43240729 阅读：18 留言：0更新日期：2024-11-05 17:25

本发明专利技术实施例公开了一种AIGC隐私数据保护方法、系统、设备及存储介质，本发明专利技术实施例通过按照不可区分度的安全概念进行隐私保护，使服务方无法从N个用户中找出某一具体用户的问题和答案。具体包括：1)将多个用户的问题随机组合成一个问题序列，服务方虽然能看到全部问题总数，但无法获知每个问题对应的具体用户；2)通过FHE方案对多个用户问题进行加密后汇总，使得其他用户无法获知问题内容；3)多个用户通过隐匿查询算法获取己方问题对应的答案，无法获知其他用户答案。在半诚实模型下可以有效保护用户的问题和答案不被服务方获知,同时在安全性和性能之间取得了较好的平衡。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及大模型数据安全，具体涉及一种aigc隐私数据保护方法、系统、设备及存储介质。

技术介绍

1、aigc(artificial intelligence generative content，生成式人工智能)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术，是人工智能1.0时代进入2.0时代的重要标志。

2、aigc技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习，aigc可以根据输入的条件或指导，生成与之相关的内容。例如，通过输入关键词、描述或样本，aigc可以生成与之相匹配的文章、图像、音频等。

3、目前aigc的应用变得越来越普及，其主要参与方包括2方：服务方和用户。基于aigc的api服务原理及过程简述如下：

4、1)服务方通过大模型训练得到大模型参数，并通过api接口调用方式对用户提供大模型推理服务；

5、2)用户通过调用服务方的api接口输入prompt问题(简称为问题)；

6、3)服务方将问题作为大模型的输入，通过大模型参数推理过程获得输出并发送给用户；

7、4)用户最终获得模型推理结果即问题答案(简称为答案)。

8、从隐私保护角度来看，aigc应用中需要保护的数据隐私包括服务方的大模型参数、用户输入的问题和用户获得的答案。

9、目前基于pet技术的aigc应用隐私保护方案主要有：1)基于tee

10、目前基于pet技术的aigc应用隐私保护方案都存在一定局限性：1)基于tee的aigc隐私保护需要运行在支持tee技术的cpu/gpu上，因此需要对cpu生产商绝对信任，这也导致tee技术的安全需要依赖于cpu/gpu生产商；2)基于mpc的aigc隐私保护对通信带宽要求较高，在网络带宽较低且延时较大时，应用运行时间会远远大于明文运行时间；3)基于fhe的aigc的隐私保护：基于fhe技术实现的aigc应用会导致密文计算量特别巨大，因此运行时间极长。

11、此外，现有公开的aigc隐私保护方案中都注重于保护服务方的大模型参数和用户方问题，未实现保护用户方的答案。

技术实现思路

1、为此，本专利技术实施例提供一种aigc隐私数据保护方法、系统、设备及存储介质，以解决现有技术仅保护大模型参数和用户方问题，未实现保护用户方的答案的技术问题。

2、为了实现上述目的，本专利技术实施例提供如下技术方案：

3、根据本专利技术实施例的第一方面，提供了一种aigc隐私数据保护方法，所述方法包括：

4、s1、获取当前在调用aigcapi应用的所有用户并获取用户数与所有用户的问题/答案token长度，选取最大值为最终token长度；

5、s2、为所有当前在调用aigcapi应用的用户创建索引，使每个用户通过加密算法获得一个随机数；

6、s3、服务方利用安全参数为每个用户生成对应私钥并根据所述私钥生成公钥并将公钥公开给所有用户；

7、s4、依次对用户的问题进行加密获得对应用户的问题密文并将所有用户的问题密文进行汇总，生成总密文数据并发送至服务方；

8、s5、服务方利用私钥对总密文数据进行解密获得明文数组与各个用户的问题token，利用aigcapi应用参数进行明文推理运算并获取对应答案；

9、s6、服务方根据各个答案和对应随机数，以对应随机数为查询参数向用户提供隐匿查询服务，用户根据查询参数获取对应答案。

10、进一步地，获取当前在调用aigcapi应用的所有用户并获取用户数与所有用户的问题/答案token长度，选取最大值为最终token长度，包括：

11、获取所有用户的问题/答案token长度，判断问题/答案token长度是否一致；

12、如果一致则此时的token长度为最终token长度；

13、如果不一致，则选取最大值为最终token长度，将token长度小于最大值的问题/答案通过补齐停止符的方式使所有问题/答案的token长度相同。

14、进一步地，为所有当前在调用aigcapi应用的用户创建索引，使每个用户通过加密算法获得一个随机数，包括：

15、每个用户通过加密算法gen_index获得一个与其他用户均不相等的随机数；

16、其中，每个用户的随机数均对其他用户保密。

17、服务方利用安全参数为每个用户生成对应私钥并根据所述私钥生成公钥并将公钥公开给所有用户，包括：

18、根据安全参数生成fhe私钥并根据fhe私钥生成fhe加密公钥；

19、根据所述fhe私钥生成重线性公钥和/或密文自举公钥；

20、将所述fhe加密公钥、重线性公钥和密文自举公钥公开给所有用户；

21、双方基于fhe公钥和私钥的运算规定如下：

22、对于fhe方案的密文计算为：

23、密文乘法函数：

24、mul(enc(a0),enc(a1))＝enc(a0×a1)

25、密文加法函数：

26、add(enc(a0),enc(a1))＝enc(a0+a1)

27、多个密文加法函数：

28、multiadd(enc(a0),enc(a1),…,enc(an))＝enc(a0+a1+…+an)

29、密文减法函数：

30、sub(enc(a0),enc(a1))＝enc(a0-a1)

31、其中，加密函数enc(a0)表示对明文数据a0加密得到的密文，解密函数dec(c0)表示对密文数据c0解密得到的明文数据。

32、进一步地，依次对用户的问题进行加密获得对应用户的问题密文并将所有用户的问题密文进行汇总，生成总密文数据并发送至服务方，包括：

33、对用户的问题进行加密获得对应用户的问题密文，包括：

34、对问题中的问题最终token长度lenq个token记为qi，对qi进行编码得到lenq个数字记为ei；

35、生成随机数ri，ri长度等于t个token编码数字长度，ri需要保密；

36、lq＝lenq+t,l＝n×lq，初始化数组qi[l]为全0；

37、根据随机数posi，将ri和lenq个数字依次放置到数组qi中的(posi-1)×lq至posi×lq-1区间；

38、利用fhe公钥对qi的l个数进行加密得到密文数组cqi[l]；

39、其中，lq为单个用户的总token长度，等于单个用户的问题token长度加上随机数ri的token格式保存长度，t表示随机数ri按照token编本文档来自技高网...

【技术保护点】

1.一种AIGC隐私数据保护方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种AIGC隐私数据保护方法，其特征在于，获取当前在调用AIGCAPI应用的所有用户并获取用户数与所有用户的问题/答案token长度，选取最大值为最终token长度，包括：

3.如权利要求2所述的一种AIGC隐私数据保护方法，其特征在于，为所有当前在调用AIGCAPI应用的用户创建索引，使每个用户通过加密算法获得一个随机数，包括：

4.如权利要求3所述的一种AIGC隐私数据保护方法，其特征在于，服务方利用安全参数为每个用户生成对应私钥并根据所述私钥生成公钥并将公钥公开给所有用户，包括：

5.如权利要求4所述的一种AIGC隐私数据保护方法，其特征在于，依次对用户的问题进行加密获得对应用户的问题密文并将所有用户的问题密文进行汇总，生成总密文数据并发送至服务方，包括：

6.如权利要求5所述的一种AIGC隐私数据保护方法，其特征在于，依次对用户的问题进行加密获得对应用户的问题密文并将所有用户的问题密文进行汇总，生成总密文数据并发送至服务方，包括：

7.如权利要求6所述的一种AIGC隐私数据保护方法，其特征在于，服务方利用私钥对总密文数据进行解密获得明文数组与各个用户的问题token，利用AIGCAPI应用参数进行明文推理运算并获取对应答案，包括：

8.一种AIGC隐私数据保护系统，其特征在于，所述系统包括：

9.一种AIGC隐私数据保护设备，其特征在于，所述设备包括：处理器和存储器；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种AIGC隐私数据保护方法的步骤。

...

【技术特征摘要】

1.一种aigc隐私数据保护方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种aigc隐私数据保护方法，其特征在于，获取当前在调用aigcapi应用的所有用户并获取用户数与所有用户的问题/答案token长度，选取最大值为最终token长度，包括：

3.如权利要求2所述的一种aigc隐私数据保护方法，其特征在于，为所有当前在调用aigcapi应用的用户创建索引，使每个用户通过加密算法获得一个随机数，包括：

4.如权利要求3所述的一种aigc隐私数据保护方法，其特征在于，服务方利用安全参数为每个用户生成对应私钥并根据所述私钥生成公钥并将公钥公开给所有用户，包括：

5.如权利要求4所述的一种aigc隐私数据保护方法，其特征在于，依次对用户的问题进行加密获得对应用户的问题密文并将所有用户的问题密文进行汇总，生成总密文数据并发...

【专利技术属性】
技术研发人员：潘光明，
申请(专利权)人：翼健上海信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人