System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种生成内容来源判断方法、装置和存储介质制造方法及图纸_技高网

一种生成内容来源判断方法、装置和存储介质制造方法及图纸

技术编号:41091177 阅读:5 留言:0更新日期:2024-04-25 13:51
本发明专利技术公开了一种生成内容来源判断方法,该方法基于由生成模型生成的目标类别样本集训练得到目标上下文向量,由随机获得的非目标类别样本集训练得到非目标上下文向量,将待测样本的文本特征分别与目标上下文向量的提示词特征和非目标上下文向量的提示词特征进行比较,如果接近目标上下文向量的提示词特征则证明该待测样本来源与生成模型,本发明专利技术利用上述过程首次提出了准确识别来源的方法。本发明专利技术还公开了一种生成内容来源判断装置和存储介质。

【技术实现步骤摘要】

本专利技术属于网络空间安全领域,具体涉及一种生成内容来源判断方法、装置和存储介质


技术介绍

1、人工智能生成的内容(aigc)最近受到了广泛关注。例如在图片生成领域,现有的aigc模型可以在各个领域生成质量上乘的图像。

2、随着aigc模型功能的不断增强,人类已很难识别一个给定内容样本是否由模型生成。这一挑战可能会导致许多安全问题。

3、在文本生成领域,大模型也可以生成以假乱真的虚假新闻,带来各类风险。为了应对aigc带来的挑战和机遇,要求在所有人工智能生成的内容上明确标注其生成来源(如stable diffusion、chatgpt)。这项措施旨在确保公众了解内容的真实性,并保护aigc的版权。因此,检查一个给定的可疑内容是否由特定的aigc模型生成(即生成内容来源模型认证),成为了一个亟待解决的问题。

4、在实际操作中,检查工作变得更具挑战性,因为模型的权重和梯度等中间计算结果等详细信息无法获得,监管人员只能基于该模型生成的少量内容来进行生成模型来源认证。

5、现有技术中,aigc检测方法主要集中于区分真实内容和伪造内容,其中特别强调深度伪造。这些方法旨在通过发现已有内容样本中的人工痕迹,将干净的内容样本和生成的内容样本分为两个不同的类别。例如,在输入和特征空间中检测局部人工伪影。

6、clip的英文全称是contrastive language-image pre-training,即一种基于对比文本-图像对的预训练方法或者模型。clip是一个预先训练好的多模态模型,用于预测图像是否与文本提示词相匹配。它包括一个图像编码器ev(·)和文本编码器et(·)。预训练的clip可将图像与提示词列表(每个提示词代表一个类别)进行比较,从而执行无样本多类别分类(zero-shot multi-class classification)。形式上,假设我们有k个类别。令xv∈x表示图像,表示代表第i个类别的第i个提示词。图像xv的第i类预测概率计算公式为:

7、

8、其中,sim(·)是测量两个嵌入之间距离的函数,例如点积。

9、现有的基于clip的分类器可以在每类只有几份内容样本的情况下实现出色的性能,但在检查一个给定的生成内容样本(例如图像)是否由特定的生成模型生成时,仅能获取少量由生成模型生成的样本。因此,标准的基于clip的分类器不能直接用于解决少样本单类分类(few-shot one-class classification)任务。

10、在最初的clip分类中,人工制作的文本提示词用于表示类别。提示词的设计需要专业知识,制作起来非常耗时。为了缓解这一问题,提出了上下文优化(contextoptimization,简称coop)的概念,即利用可学习的向量来提炼与提示词相关的词语。coop使模型能够自动优化合适的提示词,而不是手动设计提示词。形式上,第i个类别的提示词可表示为其中t是可学习的上下文向量,是连接操作,classi对应第i个类别的名称。优化的目标是最小化每个预测真值yi的误差。这是通过使用与可学习提示词相关的交叉熵损失函数来实现的。优化过程可描述为:

11、

12、其中n是图像的数量。实际上,[12]的研究表明,只需要少量的标注示例就能学习到有效的提示词。总之,提示词学习能让基于clip的分类在少量样本学习的情况下变得有效。

13、但是,现有的aigc检测方法旨在检测生成内容样本自然属性中的人工伪影(artifacts),而无法检测由某一特定生成模型生成的人工伪影。且这些方法需要大量的训练样本(例如图像),而在实际情况下只有少量由生成模型生成的内容样本可供使用。

14、现有的基于clip的分类器可以在每类只有几份内容样本的情况下实现出色的性能,但在检查一个给定的生成内容样本(例如图像)是否由特定的生成模型生成时,仅能获取少量由生成模型生成的样本。因此,标准的基于clip的分类器不能直接用于解决少样本单类分类(few-shot one-class classification)任务。


技术实现思路

1、本专利技术提供的一种生成内容来源判断方法能够准确的识别出样本由那个模型生成的,且通过较少的由生成模型生成的目标类别样本就能够训练得到。

2、本专利技术提供了一种生成内容来源判断方法,包括:

3、(1)从开源数据集采集得到非目标类别样本集,基于目标生成模型生成目标类别样本集,对非目标类别样本和目标类别样本分别进行类别标记;

4、(2)构建单类分类clip模型,所述单类分类clip模型包括目标单类分类clip单元和非目标单类分类clip单元,目标单类分类clip单元和非目标单类分类clip单元均包括参数固定的clip模型和可学习上下文向量;

5、(3)基于目标类别样本通过交叉熵损失函数训练目标单类分类clip单元的可学习上下文向量得到目标上下文向量,基于增加对抗扰动的非目标类别样本训练非目标单类分类clip单元的可学习上下文向量得到非目标上下文向量,基于目标上下文向量、非目标上下文向量和参数固定的clip模型构建目标来源判断模型;

6、(4)将待测类别样本输入目标来源判断模型得到目标损失值和非目标损失值,如果目标损失值大于非目标损失值则所述待测类别样本来源于目标生成模型。

7、进一步的,基于目标类别样本通过交叉熵损失函数训练目标单类分类clip单元的可学习上下文向量得到目标可学习上下文向量,包括:

8、将目标类别样本集对应的目标类别和可学习上下文向量进行加和得到可学习目标提示词,将可学习目标提示词和目标类别样本输入参数固定的clip模型分别得到目标提示词特征和目标样本特征;

9、基于目标提示词特征和目标样本特征通过交叉熵损失函数构建第一损失函数,通过第一损失函数基于目标类别样本集训练目标单类分类clip单元的可学习上下文向量得到目标上下文向量。

10、进一步的,所述基于增加对抗扰动的非目标类别样本训练非目标单类分类clip单元的非目标可学习上下文向量得到非目标上下文向量,包括:

11、将非目标类别样本集对应的非目标类别和可学习上下文向量进行加和得到可学习非目标提示词,将可学习非目标提示词和增加对抗扰动的非目标类别样本输入参数固定的clip模型分别得到非目标提示词特征和非目标样本特征;

12、基于非目标提示词特征和非目标样本特征通过交叉熵损失函数构建第二损失函数,通过第二损失函数基于非目标类别样本集训练非目标单类分类clip单元的可学习上下文向量得到非目标上下文向量。

13、进一步的,获得基于增加对抗扰动的非目标类别样本,包括:将上一次迭代得到的对抗性扰动加到非目标类别样本得到当前迭代输入的非目标类别样本。

14、进一步的,在每一次迭代时,得到的对抗性扰动δv为:

15、δv=∈·sign(g)...

【技术保护点】

1.一种生成内容来源判断方法,其特征在于,包括:

2.根据权利要求1所述的生成内容来源判断方法,其特征在于,基于目标类别样本通过交叉熵损失函数训练目标单类分类CLIP单元的可学习上下文向量得到目标可学习上下文向量,包括:

3.根据权利要求1所述的生成内容来源判断方法,其特征在于,所述基于增加对抗扰动的非目标类别样本训练非目标单类分类CLIP单元的非目标可学习上下文向量得到非目标上下文向量,包括:

4.根据权利要求1所述的生成内容来源判断方法,其特征在于,获得基于增加对抗扰动的非目标类别样本,包括:将上一次迭代得到的对抗性扰动加到非目标类别样本得到当前迭代输入的非目标类别样本。

5.根据权利要求4所述的生成内容来源判断方法,其特征在于,在每一次迭代时,得到的对抗性扰动δv为:

6.根据权利要求1所述的生成内容来源判断方法,其特征在于,所述参数固定的CLIP模型包括样本编码器和文本编码器:

7.根据权利要求1所述的生成内容来源判断方法,其特征在于,将待测类别样本输入目标来源判断模型得到目标损失值,包括:

<p>8.根据权利要求1所述的生成内容来源判断方法,其特征在于,将待测类别样本输入目标来源判断模型得到非目标损失值,包括:

9.一种生成内容来源判断装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-7中任一项所述的生成内容来源判断方法。

10.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现权利要求1-7中任一项所述的生成内容来源判断方法。

...

【技术特征摘要】

1.一种生成内容来源判断方法,其特征在于,包括:

2.根据权利要求1所述的生成内容来源判断方法,其特征在于,基于目标类别样本通过交叉熵损失函数训练目标单类分类clip单元的可学习上下文向量得到目标可学习上下文向量,包括:

3.根据权利要求1所述的生成内容来源判断方法,其特征在于,所述基于增加对抗扰动的非目标类别样本训练非目标单类分类clip单元的非目标可学习上下文向量得到非目标上下文向量,包括:

4.根据权利要求1所述的生成内容来源判断方法,其特征在于,获得基于增加对抗扰动的非目标类别样本,包括:将上一次迭代得到的对抗性扰动加到非目标类别样本得到当前迭代输入的非目标类别样本。

5.根据权利要求4所述的生成内容来源判断方法,其特征在于,在每一次迭代时,得到的对抗性扰动δv为:

<...

【专利技术属性】
技术研发人员:李一鸣陈禹坤顾金东秦湛任奎
申请(专利权)人:浙江大学杭州国际科创中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1