一种面向图像生成大模型的适应性内容消除器及消除方法技术

技术编号：44816877 阅读：6 留言：0更新日期：2025-03-28 20:04

本发明专利技术公开了一种面向图像生成大模型的适应性内容消除器及消除方法，所述消除方法包括：根据目标内容构建消除空间和保留空间，所述消除空间对应需要移除的语义信息，所述保留空间对应需要保留的语义信息；将用户输入的文本提示将转化为语义表征，并将其逐令牌投影至消除空间和保留空间中，得到保留空间的保留分量；测量当前文本提示的语义表征与目标内容的语义表征之间的语义距离，计算关联度；根据关联度结果，重构保留空间并矫正保留分量的方向。本发明专利技术无需耗费大量计算资源对模型进行微调，且未引入额外参数。在成功移除单个或多个目标内容的同时，对无关内容生成的影响可忽略不计，显著提升了生成模型的内容消除性能。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，具体的说是一种面向图像生成大模型的适应性内容消除器及消除方法。

技术介绍

1、近年来，文本生成图像（text-to-image, t2i）扩散模型的快速发展使用户能够通过简单的文本提示轻松生成高质量图像。这些模型凭借强大的生成能力，在内容创作、艺术设计和其他领域得到了广泛应用。然而，这类模型的训练通常依赖从网络中爬取的大规模数据集，这种数据的质量参差不齐，难免会包含不安全的内容。这导致模型在生成图像时可能无意间呈现冒犯性内容或涉及版权争议的内容，给实际应用带来了伦理、法律及安全上的挑战。为了解决这些问题，一种直观的解决方案是对数据集进行严格筛选后重新训练生成模型。然而，这种方式存在显著的局限性。首先，针对不同类型的目标内容往往需要设计特定的检测器来对数据进行筛选，这不仅增加了开发复杂度，还无法应对未知的或者新出现的目标内容。其次，重新从头训练大型生成模型成本极高，耗时且资源密集。此外，即便筛选后重新训练的模型，仍然可能因数据偏差而引入意想不到的不良倾向。另一种简单的解决方案是采用文本过滤器或安全检查器。例如，文本过滤器可以直接阻止包含目标内容的文本提示，安全检查器则通过检测生成图像来过滤包含不安全内容的结果。然而，这些方法的防护能力有限，容易被巧妙设计的恶意提示绕过，且无法从根本上解决问题。因此，开发一种低成本、高效且精确的技术来去除生成图像中的不需要语义（即内容消除）变得尤为重要。

2、现有内容消除技术主要分为两类，首先是基于微调的方法。这类方法通过对模型参数的微调，针对性地将目标内容与替代内

技术实现思路

1、在本实施例中提供了一种面向图像生成大模型的适应性内容消除器、消除方法、电子设备及存储介质，以在图像生成过程中精准移除不安全或涉及版权问题的目标内容，同时确保对其他无关内容的生成过程不产生任何负面影响。

2、第一方面，本专利技术实施例提供一种面向图像生成大模型的适应性内容消除方法，所述面向图像生成大模型的适应性内容消除方法包括：

3、根据目标内容构建消除空间和保留空间，所述消除空间对应需要移除的语义信息，所述保留空间对应需要保留的语义信息；

4、将用户输入的文本提示将转化为语义表征，包括对文本提示分词处理，将生成的词汇或短语作为令牌，并将其逐令牌投影至消除空间和保留空间中，得到保留空间的保留分量；

5、测量当前文本提示的语义表征与目标内容的语义表征之间的语义距离，计算关联度；

6、根据关联度结果，重构保留空间并矫正保留分量的方向。

7、在一个可选的实施例中，根据目标内容构建消除空间和保留空间，所述消除空间对应需要移除的语义信息，所述保留空间对应需要保留的语义信息，包括；

8、定义目标内容，获取目标内容的语义表征；

9、对于单个目标内容，使用目标内容的语义表征作为基向量来张成消除空间；

10、对于多个目标内容，通过施密特正交化方法对各个目标内容的语义表征进行处理，得到一组标准正交基，利用标准正交基来张成消除空间；

11、将与消除空间正交补的空间作为保留空间。

12、在一个可选的实施例中，将用户输入的文本提示将转化为语义表征，包括对文本提示分词处理，将生成的词汇或短语作为令牌，并将其逐令牌投影至消除空间和保留空间中，得到保留空间的保留分量，包括：

13、对用户输入的文本进行分词处理，生成独立词汇或短语，将生成的词汇或短语作为令牌，利用预训练的语言模型编码令牌，生成语义表征；

14、对于单个目标内容，计算在消除空间和保留空间上的投影，以获取令牌在消除空间的消除分量和保留空间的保留分量；

15、对于多个目标内容，对每个目标内容分别进行投影计算，得到总的消除分量和保留分量；

16、将计算出的保留分量替换原始语义表征参与后续生成过程。

17、在一个可选的实施例中，所述令牌包括特殊令牌，所述特殊令牌不进行投影。

18、在一个可选的实施例中，测量当前文本提示的语义表征与目标内容的语义表征之间的语义距离，计算关联度，包括：

19、获取当前文本提示的语义表征和目标内容的语义表征；

20、利用余弦相似度计算文本提示语义表征和目标内容语义表征之间的关联度。

21、在一个可选的实施例中，根据关联度结果，重构保留空间并矫正保留分量的方向，包括：

22、当关联度大于预设阈值时，表示文本提示语义表征和目标内容语义表征之间关联性强，则加强保留空间与消除空间的正交约束；

23、当关联度小于预设阈值时，表示文本提示语义表征和目标内容语义表征之间关联性弱或无关，则放松保留空间与消除空间正交约束，以减轻目标内容消除对无关内容生成的负面影响。

24、在一个可选的实施例中，根据关联度结果，重构保留空间并矫正保留分量的方向，还包括：

25、对于单个目标内容，根据目标内容的语义表征和当前文本提示对应的语义表征的余弦相似度直接对保留分量的方向矫正；

26、对于多个目标内容，根据相似度对于当前输入的文本提示沿着每个目标内容对应的方向上的投影进行模的放缩，对保留分量的方向沿着每个目标内容矫正。

27、与现有技术相比，本专利技术的面向图像生成大模型的适应性内容消除方法的有益效果如下：

28、本方法无论是针对单一还是多个目标内容，都能有效地将它们从生成的图像中移除，且无需耗费大量计算资源对模型进行微调，且未引入额外参数。在成功移除单个或多个目标内容的同时，对无关内容生成的影响可忽略不计，显著提升了生成模型的内容消除性能。

29、第二方面，本专利技术实施例提供一种面向图像生成大模型的适应性内容消除器，包括：

30、投影模块，所述投影模块包括语义空间构建单元和逐令牌投影单元，所述语义空间构建单元用于根据目标内容构建消除空间和保留空间，所述消除空间对应需要移除的语义信息，所述保留空间对应需要保留的语义信息；

31、所述逐令牌投影单元用于将用户输入的文本提示将转化为语义表征，包括对文本提示分词处理，将生成的词汇或短语作为令本文档来自技高网...

【技术保护点】

1.一种面向图像生成大模型的适应性内容消除方法，其特征在于，所述消除方法包括：

2.根据权利要求1所述的面向图像生成大模型的适应性内容消除方法，其特征在于，根据目标内容构建消除空间和保留空间，所述消除空间对应需要移除的语义信息，所述保留空间对应需要保留的语义信息，包括；

3.根据权利要求1所述的面向图像生成大模型的适应性内容消除方法，其特征在于，将用户输入的文本提示将转化为语义表征，包括对文本提示分词处理，将生成的词汇或短语作为令牌，并将其逐令牌投影至消除空间和保留空间中，得到保留空间的保留分量，包括：

4.根据权利要求3所述的面向图像生成大模型的适应性内容消除方法，其特征在于，所述令牌包括特殊令牌，所述特殊令牌不进行投影。

5.根据权利要求1所述的面向图像生成大模型的适应性内容消除方法，其特征在于，测量当前文本提示的语义表征与目标内容的语义表征之间的语义距离，计算关联度，包括：

6.根据权利要求1所述的面向图像生成大模型的适应性内容消除方法，其特征在于，根据关联度结果，重构保留空间并矫正保留分量的方向，包括：

<...

【技术特征摘要】

1.一种面向图像生成大模型的适应性内容消除方法，其特征在于，所述消除方法包括：

4.根据权利要求3所述的面向图像生成大模型的适应性内容消除方法，其特征在于，所述令牌包括特殊令牌，所述特殊令牌不进行投影。

5.根据权利要求1所述的面向图像生成大模型的适应性内容消除方法，其特征在于，测量当前文本提示的语义表征与目标内容的语义表征...

【专利技术属性】
技术研发人员：何向南，汪远，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人