筛选模型的训练方法、水印添加方法、装置及设备制造方法及图纸

技术编号：39724035 阅读：18 留言：0更新日期：2023-12-17 23:29

一种筛选模型的训练方法、水印添加方法、装置及设备，涉及人工智能技术领域。该方法包括：获取至少一个图像；对于任意一个图像，对图像添加噪声数据，得到图像对应的带噪声图像，噪声数据用于模拟水印对图像的影响；获取带噪声图像对应的画质评估结果，画质评估结果用于表征噪声数据对于画质的影响程度；基于图像以及画质评估结果，对筛选模型进行训练，得到训练后的筛选模型，训练后的筛选模型用于从视频中筛选出用于添加水印的视频帧。通过上述方法，使得训练后的筛选模型能够自动筛选适合用于添加水印的视频帧，降低水印对画质的影响，使得添加水印后的视频的画质更加清晰。使得添加水印后的视频的画质更加清晰。使得添加水印后的视频的画质更加清晰。

全部详细技术资料下载

【技术实现步骤摘要】
筛选模型的训练方法、水印添加方法、装置及设备

[0001]本申请实施例涉及人工智能(Artificial Intelligence，简称AI)
，特别涉及一种筛选模型的训练方法、水印添加方法、装置及设备。

技术介绍

[0002]音视频作品在传播中，经常会出现版权归属不明确的问题。为了明确音视频作品的版权，通常会在音视频作品中添加水印。
[0003]相关技术中，提供了一种水印添加方法，对视频进行分帧处理，得到视频帧，视频帧包括I帧、B帧和P帧三种类型的视频帧，在视频的I帧中添加水印。
[0004]然而上述方法中，I帧为P帧和B帧的参考帧，在I帧中添加水印，可能会传播到P帧和B帧，造成视频的画面失真。

技术实现思路

[0005]本申请实施例提供了一种虚拟环境中的筛选模型的训练方法、水印添加方法、装置及设备。本申请实施例提供的技术方案如下。
[0006]根据本申请实施例的一个方面，提供了一种筛选模型的训练方法，所述方法包括：
[0007]获取至少一个图像；
[0008]对于任意一个所述图像，对所述图像添加噪声数据，得到所述图像对应的带噪声图像，所述噪声数据用于模拟水印对所述图像的影响；
[0009]获取所述带噪声图像对应的画质评估结果，所述画质评估结果用于表征所述噪声数据对于画质的影响程度；
[0010]基于所述图像以及所述画质评估结果，对筛选模型进行训练，得到训练后的筛选模型，所述训练后的筛选模型用于从视频中筛选出用于添加水印的视频帧。
>[0011]根据本申请实施例的一个方面，提供了一种水印添加方法，所述方法包括：
[0012]获取视频中包含的多个视频帧；
[0013]通过筛选模型确定各个所述视频帧分别对应的画质预测结果，所述画质预测结果用于表征在所述视频帧中添加水印后对于画质的影响程度；
[0014]根据各个所述视频帧分别对应的画质预测结果，从所述多个视频帧中选择至少一个视频帧；
[0015]在所述至少一个视频帧中添加水印。
[0016]根据本申请实施例的一个方面，提供了一种筛选模型的训练装置，所述装置包括：
[0017]图像获取模块，用于获取至少一个图像；
[0018]噪声添加模块，用于对于任意一个所述图像，对所述图像添加噪声数据，得到所述图像对应的带噪声图像，所述噪声数据用于模拟水印对所述图像的影响；
[0019]结果获取模块，用于获取所述带噪声图像对应的画质评估结果，所述画质评估结果用于表征所述噪声数据对于画质的影响程度；
[0020]模型训练模块，用于基于所述图像以及所述画质评估结果，对筛选模型进行训练，得到训练后的筛选模型，所述训练后的筛选模型用于从视频中筛选出用于添加水印的视频帧。
[0021]根据本申请实施例的一个方面，提供了一种水印添加装置，所述装置包括：
[0022]获取模块，用于获取视频中包含的多个视频帧；
[0023]确定模块，用于通过筛选模型确定各个所述视频帧分别对应的画质预测结果，所述画质预测结果用于表征在所述视频帧中添加水印后对于画质的影响程度；
[0024]选择模块，用于根据各个所述视频帧分别对应的画质预测结果，从所述多个视频帧中选择至少一个视频帧；
[0025]添加模块，用于在所述至少一个视频帧中添加水印。
[0026]根据本申请实施例的一个方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器用于执行所述计算机程序以实现上述筛选模型的训练方法，或实现上述水印添加方法。
[0027]根据本申请实施例的一个方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序由处理器加载并执行以实现上述筛选模型的训练方法，或实现上述水印添加方法。
[0028]根据本申请实施例的一个方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序由处理器加载并执行以实现上述筛选模型的训练方法，或实现上述水印添加方法。
[0029]本申请实施例提供的技术方案可以带来如下有益效果：
[0030]通过对图像添加噪声数据，获得带噪声图像，确定带噪声图像的画质评估结果，采用噪声数据模拟水印对图像的影响，采用图像以及画质评估结果作为训练样本集，对筛选模型进行训练，得到训练后的筛选模型。使得训练后的筛选模型能够自动筛选适合用于添加水印的视频帧，降低水印对画质的影响，使得添加水印后的视频的画质更加清晰。
附图说明
[0031]图1是本申请一个实施例提供的方案实施环境的示意图；
[0032]图2是本申请一个实施例提供的筛选模型的训练方法的流程图；
[0033]图3是本申请一个实施例提供的残差块的示意图；
[0034]图4是本申请一个实施例提供的水印添加方法的流程图；
[0035]图5是本申请一个实施例提供的筛选模型的训练装置的框图；
[0036]图6是本申请一个实施例提供的水印添加装置的框图；
[0037]图7是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
[0038]为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。
[0039]在介绍本申请技术方案之前，先对本申请涉及的一些
技术介绍
知识进行介绍说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合，其均属于
本申请实施例的保护范围。本申请实施例包括以下内容中的至少部分内容。
[0040]人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括自然语言处理技术、机器学习/深度学习等几大方向。
[0041]计算机视觉技术(Computer Vision，简称CV)是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。大模型技术为计算机视觉技术发展带来重要变革，swin
‑
transformer，ViT(Vision Transfor本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种筛选模型的训练方法，其特征在于，所述方法包括：获取至少一个图像；对于任意一个所述图像，对所述图像添加噪声数据，得到所述图像对应的带噪声图像，所述噪声数据用于模拟水印对所述图像的影响；获取所述带噪声图像对应的画质评估结果，所述画质评估结果用于表征所述噪声数据对于画质的影响程度；基于所述图像以及所述画质评估结果，对筛选模型进行训练，得到训练后的筛选模型，所述训练后的筛选模型用于从视频中筛选出用于添加水印的视频帧。2.根据权利要求1所述的方法，其特征在于，所述对所述图像添加噪声数据，得到所述图像对应的带噪声图像，包括：从多种概率分布中，选择所述图像对应的概率分布；从所述图像对应的概率分布中，采样得到所述图像对应的噪声数据；对所述图像添加所述图像对应的噪声数据，得到所述图像对应的带噪声图像。3.根据权利要求2所述的方法，其特征在于，所述从多种概率分布中，选择所述图像对应的概率分布，包括：从所述多种概率分布中，随机选择一种概率分布，作为所述图像对应的概率分布；其中，所述多种概率分布包括以下至少两种：均匀分布、高斯分布、伯努利分布、几何分布、泊松分布、指数分布。4.根据权利要求2所述的方法，其特征在于，所述图像对应的噪声数据包括：所述图像中至少一个像素分别对应的噪声数据；所述对所述图像添加所述图像对应的噪声数据，得到所述图像对应的带噪声图像，包括：根据所述图像中所述至少一个像素的像素值，与所述至少一个像素分别对应的噪声数据，确定所述至少一个像素的更新后像素值；根据所述至少一个像素的更新后像素值，得到所述图像对应的带噪声图像。5.根据权利要求1所述的方法，其特征在于，所述基于所述图像以及所述画质评估结果，对筛选模型进行训练，得到训练后的筛选模型，包括：通过所述筛选模型对所述图像进行处理，得到所述图像对应的画质预测结果，所述画质预测结果用于表征在所述图像中添加水印后对于画质的影响程度；根据所述画质预测结果和所述画质评估结果，计算所述筛选模型的损失函数值，所述损失函数值用于度量所述画质预测结果和所述画质评估结果之间的差异程度；根据所述损失函数值，调整所述筛选模型的参数，得到所述训练后的筛选模型。6.根据权利要求5所述的方法，其特征在于，所述画质评估结果包括画质评分，所述画质评分是基于多种不同的画质类型确定的，所述画质预测结果包括预测评分；所述根据所述画质预测结果和所述画质评估结果，计算所述筛选模型的损失函数值，包括：根据所述预测评分和所述画质评分，计算所述筛选模型的损失函数值。7.根据权利要求5所述的方法，其特征在于，所述筛选模型是在分类模型的基础上增加全连接层构建的模型，所述分类模型包括特征提取层和分类层；
所述通过所述筛选模型对所述图像进行处理，得到所述图像对应的画质预测结果，包括：通过所述特征提取层提取所述图像的特征信息，所述特征信息用于描述所述图像的语义特征；通过所述分类层根据所述特征信息对所述图像进行分类，得到所述图像对应的类别信息；通过所述全连接层根据所述图像对应的类别信息，得到所述图像对应的画质预测结果。8.根据权利要求5所述的方法，其特征在于，所述方法还包括：将所述图像缩放至固定尺寸，得到所述固定尺寸的图像；对所述固定尺寸的图像中各个像素的像素值进行归一化处理，得到归一化后的图像，所述归一化后的图像中各个像素的像素值处于第一取值范围内；对所述归一化后的图像中各个像素的像素值进行调整，得到调整后的图像，所述调整后的图像中各个像素的像素值处于第二取值范围内，所述第二取值范围以0为中心对称分布；其中，所述调整后的图像用作所述筛选模型的输入数据，得到所述图像对应的画质预测结果。9.根据权利要求1至8任一项所述的方法，其特征在于，所述获取至少一个图像，包括：对至少两个视频分别进行分帧处理，得到视频帧集合，所述至少两个视频被调整为相同的帧率；在所述视频帧集合中确定所述至少一个图像。10.根据权利要求9所述的方法，其特征在于，所述在所述视频帧集合中确定所述至少一个图像，包括：对于属于同一视频的视频帧，将所述视频划分为...

【专利技术属性】
技术研发人员：刘华罗，刘绍腾，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人