一种视频语义降噪方法、装置及电子设备制造方法及图纸

技术编号：37723872 阅读：17 留言：0更新日期：2023-06-02 00:25

本申请提供一种视频语义降噪方法、装置及电子设备，该方法包括：获取视频流中的当前视频帧，以及上一视频帧的语义降噪图像；使用语义解析网络模型对当前视频帧进行语义分割，获得语义掩模图像；使用神经网络模型对当前视频帧和语义掩模图像进行降噪，获得空域降噪图像，并对当前视频帧、语义掩模图像、空域降噪图像和上一视频帧的语义降噪图像进行时域融合，获得当前视频帧的语义降噪图像。在上述方案的实现过程中，通过将语义分割的语义掩模图像与空域降噪图像和上一视频帧的语义降噪图像进行时域融合，从语义掩模信息、时间域和空间域三个维度来共同降噪，从而有效地利用了语义掩模信息来提高视频流的降噪效果。模信息来提高视频流的降噪效果。模信息来提高视频流的降噪效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频语义降噪方法、装置及电子设备

[0001]本申请涉及视频处理和深度学习的
，具体而言，涉及一种视频语义降噪方法、装置及电子设备。

技术介绍

[0002]目前的图像降噪主要是通过训练深度卷积神经网络，对原始(Raw)域图像进行去噪，具体例如：对于图像降噪来说，使用训练好的神经网络提取原始域图像的色彩信息、亮度信息和纹理信息，从而在空间域两个维度上来估计和抑制噪声方差来实现降噪的效果。然而，对于视频流降噪来说，主要是在时间域和空间域两个维度上来实现视频流的降噪，在具体的实践过程中发现，使用目前的图像降噪方法对视频流的降噪效果不好。

技术实现思路

[0003]本申请实施例的目的在于提供一种视频语义降噪方法、装置及电子设备，用于改善视频流的降噪效果不好的问题。
[0004]本申请实施例提供了一种视频语义降噪方法，包括：获取视频流中的当前视频帧，以及上一视频帧的语义降噪图像；使用语义解析网络模型对当前视频帧进行语义分割，获得语义掩模图像；使用神经网络模型对当前视频帧和语义掩模图像进行降噪，获得空域降噪图像，并对当前视频帧、语义掩模图像、空域降噪图像和上一视频帧的语义降噪图像进行时域融合，获得当前视频帧的语义降噪图像。在上述方案的实现过程中，通过将语义分割的语义掩模图像与空域降噪图像和上一视频帧的语义降噪图像进行时域融合，从而不仅考虑了时间域和空间域两个维度上的信息，还考虑当前视频帧的语义掩模信息，从语义掩模信息、时间域和空间域三个维度来共同降噪，从而有效地利用了语义掩模信息来提高视频流的降...

【技术保护点】

【技术特征摘要】
1.一种视频语义降噪方法，其特征在于，包括：获取视频流中的当前视频帧，以及上一视频帧的语义降噪图像；使用语义解析网络模型对所述当前视频帧进行语义分割，获得语义掩模图像；使用神经网络模型对所述当前视频帧和所述语义掩模图像进行降噪，获得空域降噪图像，并对所述当前视频帧、所述语义掩模图像、所述空域降噪图像和所述上一视频帧的语义降噪图像进行时域融合，获得所述当前视频帧的语义降噪图像。2.根据权利要求1所述的方法，其特征在于，所述使用语义解析网络模型对所述当前视频帧进行语义分割，包括：使用所述语义解析网络模型从所述当前视频帧中分割出感兴趣区域；以所述感兴趣区域为前景图像，以所述当前视频帧为背景图像，生成所述语义掩模图像。3.根据权利要求2所述的方法，其特征在于，在所述使用所述语义解析网络模型从所述当前视频帧中分割出感兴趣区域之前，还包括：获取多个样本噪声图像和多个样本掩模图像，所述样本噪声图像是对样本原始图像进行加噪声获得的，所述样本掩模图像是所述样本原始图像对应的掩模图像；以所述多个样本噪声图像为训练数据，以所述多个样本掩模图像为训练标签，对语义解析神经网络进行训练，获得所述语义解析网络模型。4.根据权利要求3所述的方法，其特征在于，所述获取多个样本噪声图像和多个样本掩模图像，包括：获取前景图像、背景图像和所述前景图像的掩模图像，并对所述前景图像的掩模图像进行图像增广，获得所述样本掩模图像；对所述前景图像和所述背景图像进行图层合并，获得合并贴图；对所述合并贴图进行图像增广，获得增广贴图，并对所述增广贴图进行逆图像信号处理，获得所述样本原始图像；向所述样本原始图像中加入随机噪声，获得所述样本噪声图像。5.根据权利要求3所述的方法，其特征在于，在所述使用神经网络模型对所述当前视频帧和所述语义掩模图像进行降噪之前，还包括：获取多个样本原始图像，以及所述多个样本原始图像的样本掩模图像；以所述多个样本噪声图像和所述多个样本原始图像的样本掩模图像为训练数据，以...

【专利技术属性】
技术研发人员：刘建伟，
申请(专利权)人：上海砹芯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人