一种图像、音频编码的方法和装置制造方法及图纸

技术编号:23629280 阅读:27 留言:0更新日期:2020-04-01 00:02
本发明专利技术公开了一种图像、音频编码的方法和装置,用以解决现有技术中在编码方式转换的过程中,图像和声音易失真的问题。图像编码方法包括:当存在待编码转换的视频文件时,获取所述视频文件中的视频流;依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧图像。使重采样图像更加贴近源图像,进一步减少图像的失真。

【技术实现步骤摘要】
一种图像、音频编码的方法和装置
本专利技术涉及视频转换
,特别涉及一种图像、音频编码的方法和装置。
技术介绍
如今,视频文件在各个领域的应用越来越广泛,各个领域对视频文件有不一样的需求,比如,在影视领域常要发布多个版本如普清,高清和蓝光的影片,在游戏行领域,通常使用视频来制作游戏动画和使用图像来进行场景的贴图处理。在使用视频文件时,需要对视频文件进行解码,获取其中的源数据进行使用。不同的电子设备的解码芯片不同,支持的视频文件的编码方式也不同,因此需要提前对视频文件的编码方式进行转换。在对视频文件的编码方式进行转换时,实际上是对视频文件中的视频流和音频流中的源数据的编码方式进行转换,则就是对源数据进行重新编码。在对视频文件进行编码方式转换过程中,可能会造成图像的失真和声音的失真,尤其是图像容易失真。在视频文件的编码方式进行转换过程,如何保证图像和声音不失真,是需要解决的技术问题。
技术实现思路
本专利技术实施例公开了一种图像、音频编码的方法和装置,用以解决现有技术中在编码方式转换的过程中,图像和声音易失真的问题。为达到上述目的,本专利技术实施例公开了一种图像编码的方法,所述方法包括:当存在待编码转换的视频文件时,获取所述视频文件中的视频流;依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。进一步地,在依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间之前,所述方法还包括:依次针对每帧源图像,采样双三次插值算法将该帧源图像由原始分辨率转换为预设的第二目标分辨率,其中,第二目标分辨率高于原始分辨率。进一步地,在根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理之前,所述方法还包括:将该帧源图像按预设的图像块大小进行切分,得到每个图像块;所述根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理包括:针对每个图像块,根据预先确定的该通道对应的二维高斯混合模型,对该图像块中每个像素点在该通道上的分量值进行回归处理。进一步地,预先确定每个通道对应的二维高斯混合模型包括:针对Y通道,采用4个高斯分布确定Y通道对应的二维高斯混合模型;针对U通道和V通道,采用2个高斯分布确定U通道和V通道对应的二维高斯混合模型。本专利技术实施例提供了一种音频编码的方法,所述方法包括:当存在待编码转换的视频文件时,获取所述视频文件中的音频流,并解析音频流中的每个音频数据;按照预设的时间窗口,以及音频流的原始采样率,依次确定每个时间窗口中采集的每组音频数据;依次针对每组音频数据,采用预先确定的音频数据对应的高斯混合模型对该组音频数据中的每个音频数据的强度值进行回归处理;根据预设的目标采样率,以及目标编码方式对应的采样数,对回归处理后的每组音频数据进行采样,确定目标音频流中的每帧目标音频数据。进一步地,预先确定音频数据对应的高斯混合模型的过程包括:采用4个高斯分布确定音频数据对应的高斯混合模型。本专利技术实施例提供了一种电子设备,包括:处理器和存储器;所述处理器,用于读取所述存储器中的程序,执行下列过程:当存在待编码转换的视频文件时,获取所述视频文件中的视频流;依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。进一步地,所述处理器,还用于在依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间之前,依次针对每帧源图像,采样双三次插值算法将该帧源图像由原始分辨率转换为预设的第二目标分辨率,其中,第二目标分辨率高于原始分辨率。进一步地,所述处理器,还用于在根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理之前,将该帧源图像按预设的图像块大小进行切分,得到每个图像块;所述处理器,具体用于针对每个图像块,根据预先确定的该通道对应的二维高斯混合模型,对该图像块中每个像素点在该通道上的分量值进行回归处理。进一步地,所述处理器,还用于针对Y通道,采用4个高斯分布确定Y通道对应的二维高斯混合模型;针对U通道和V通道,采用2个高斯分布确定U通道和V通道对应的二维高斯混合模型。本专利技术实施例提供了一种电子设备,包括:处理器和存储器;所述处理器,用于读取所述存储器中的程序,执行下列过程:当存在待编码转换的视频文件时,获取所述视频文件中的音频流,并解析音频流中的每个音频数据;按照预设的时间窗口,以及音频流的原始采样率,依次确定每个时间窗口中采集的每组音频数据;依次针对每组音频数据,采用预先确定的音频数据对应的高斯混合模型对该组音频数据中的每个音频数据的强度值进行回归处理;根据预设的目标采样率,以及目标编码方式对应的采样数,对回归处理后的每组音频数据进行采样,确定目标音频流中的每帧目标音频数据。进一步地,所述处理器还用于采用4个高斯分布确定音频数据对应的高斯混合模型。本专利技术实施例提供了一种图像编码的装置,所述装置包括:获取模块,用于当存在待编码转换的视频文件时,获取所述视频文件中的视频流;转换模块,用于依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;编码模块,用于根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。本专利技术实施例提供了一种音频编码的装置,所述装置包括:获取模块,用于当存在待编码转换的视频文件时,获取所述视频文件中的音频流,并解析音频流中的每个音频数据;转换模块,用于按照预设的时间窗口,以及音频流的原始采样率,依次确定每个时间窗口中采集的每组音频数据;依次针对每组音频数据,采用预先确定的音频数据对应的高斯混合模型对该组音频数据中的每个音频数据的强度值进行回归处理;编码模块,具体用于根据预设的本文档来自技高网...

【技术保护点】
1.一种图像编码的方法,其特征在于,所述方法包括:/n当存在待编码转换的视频文件时,获取所述视频文件中的视频流;/n依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;/n根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。/n

【技术特征摘要】
1.一种图像编码的方法,其特征在于,所述方法包括:
当存在待编码转换的视频文件时,获取所述视频文件中的视频流;
依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;
根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。


2.如权利要求1所述的方法,其特征在于,在依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间之前,所述方法还包括:
依次针对每帧源图像,采样双三次插值算法将该帧源图像由原始分辨率转换为预设的第二目标分辨率,其中,第二目标分辨率高于原始分辨率。


3.如权利要求1或2所述的方法,其特征在于,在根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理之前,所述方法还包括:
将该帧源图像按预设的图像块大小进行切分,得到每个图像块;
所述根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理包括:
针对每个图像块,根据预先确定的该通道对应的二维高斯混合模型,对该图像块中每个像素点在该通道上的分量值进行回归处理。


4.如权利要求1所述的方法,其特征在于,预先确定每个通道对应的二维高斯混合模型包括:
针对Y通道,采用4个高斯分布确定Y通道对应的二维高斯混合模型;
针对U通道和V通道,采用2个高斯分布确定U通道和V通道对应的二维高斯混合模型。


5.一种音频编码的方法,其特征在于,所述方法包括:
当存在待编码转换的视频文件时,获取所述视频文件中的音频流,并解析音频流中的每个音频数据;
按照预设的时间窗口,以及音频流的原始采样率,依次确定每个时间窗口中采集的每组音频数据;
依次针对每组音频数据,采用预先确定的音频数据对应的高斯混合模型对该组音频数据中的每个音频数据的强度值进行回归处理;
根据预设的目标采样率,以及目标编码方式对应的采样数,对回归处理后的每组音频数据进行采样,确定目标音频流中的每帧目标音频数据。


6.如权利要求5所述的方法,其特征在于,预先确定音频数据对应的高斯混合模型的过程包括:
采用4个高斯分布确定音频数据对应的高斯混合模型。


7.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器,用于读取所述存储器中的程序,执行下列过程:当存在待编码转换的视频文件时,获取所述视频文件中的视频流;
依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间,针对每个通道,根据预先确定的该通道对应的二维高斯混合模型,对该帧源图像中每个像素点在该通道上的分量值进行回归处理;并根据预设的第一目标分辨率,对进行回归处理后的该帧源图像进行重采样,得到该帧源图像的重采样图像;
根据目标编码方式对应的编码参数对每帧重采样图像进行编码,确定目标视频流中的每帧目标图像。


8.如权利要求7所述的电子设备,其特征在于,所述处理器,还用于在依次针对所述视频流中的每帧源图像,将该帧源图像转换到YUV颜色空间之前,依次针对每帧源图像,采样双三次插值算法将该帧源图像由原始分辨率转换为预...

【专利技术属性】
技术研发人员:杨蕾陈虹
申请(专利权)人:中国移动通信有限公司研究院中国移动通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1