一种数据处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号：26226927 阅读：36 留言：0更新日期：2020-11-04 11:05

本申请实施例公开了一种数据处理方法、装置、设备及可读存储介质，该方法包括：获取目标视频的视频帧数据以及音频帧数据；根据视频帧数据，确定目标视频中目标对象的位置属性信息；目标对象与音频帧数据相关联；获取与位置属性信息相关联的声道编码参数，根据声道编码参数对音频帧数据进行方位增强处理，得到增强音频帧数据。采用本申请，可以提高视频中的音频优化效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、设备及可读存储介质
本申请涉及计算机
，尤其涉及一种数据处理方法、装置、设备以及可读存储介质。
技术介绍
随着多媒体技术的发展，视频已成为人们日常生活中获取信息与享受娱乐的主要载体。因为移动设备的普及，当前用户已逐渐依赖于使用移动设备来观看视频，且用户对在移动设备上观看视频时，对视频播放的要求也逐步提高。在播放视频时，如何优化视频播放音频，也相应地成为人们的关注点。在现有技术中，对于优化视频音频的过程，选择一种音频优化方式后，对于不同风格的视频音频，均采用相同的音频优化参数来进行优化，这种方式未考虑到视频场景的具象化。比如，对于安静的场景与动作激烈的场景，目前的优化方式均使用相同的优化参数来进行优化。这样不考虑视频场景，很难保证相同的优化参数，会适应于各种风格的视频场景，从而降低了音频优化效果，影响用户的视频观感。
技术实现思路
本申请实施例提供一种数据处理方法、装置、设备以及可读存储介质，可以提高视频中的音频优化效果。本申请实施例一方面提供了一种数据处理方法，包括：获取目标视频的视频帧数据以及音频帧数据；根据视频帧数据，确定目标视频中目标对象的位置属性信息；目标对象与音频帧数据相关联；获取与位置属性信息相关联的声道编码参数，根据声道编码参数对音频帧数据进行方位增强处理，得到增强音频帧数据。本申请实施例一方面提供了一种数据处理装置，包括：数据获取模块，用于获取目标视频的视频帧数据以及音频帧数据；位置识别模...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取目标视频的视频帧数据以及音频帧数据；/n根据所述视频帧数据，确定所述目标视频中目标对象的位置属性信息；所述目标对象与所述音频帧数据相关联；/n获取与所述位置属性信息相关联的声道编码参数，根据所述声道编码参数对所述音频帧数据进行方位增强处理，得到增强音频帧数据。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取目标视频的视频帧数据以及音频帧数据；
根据所述视频帧数据，确定所述目标视频中目标对象的位置属性信息；所述目标对象与所述音频帧数据相关联；
获取与所述位置属性信息相关联的声道编码参数，根据所述声道编码参数对所述音频帧数据进行方位增强处理，得到增强音频帧数据。

2.根据权利要求1所述的方法，其特征在于，所述获取目标视频的视频帧数据以及音频帧数据，包括：
获取目标视频，将所述目标视频输入至视频解封装组件，通过所述视频解封装组件对所述目标视频进行解封装，得到视频流数据以及音频流数据；
在所述视频解封装组件中，对所述视频流数据和所述音频流数据分别进行解码，得到所述视频帧数据以及所述音频帧数据。

3.根据权利要求1所述的方法，其特征在于，所述目标对象为处于静止状态的对象；
所述根据所述视频帧数据，确定所述目标视频中目标对象的位置属性信息，包括：
将所述视频帧数据输入至对象识别模型，在所述对象识别模型中获取N个连续视频帧数据；所述N个连续视频帧数据是指具有连续时间戳的视频帧数据；每个连续视频帧数据均包含所述目标对象；N为小于或等于M的正整数，M为所述视频帧数据的总数量；M为大于1的整数；
在所述N个连续视频帧数据中，识别所述目标对象的发声部位发生变化的视频帧数据，将所述目标对象的发声部位发生变化的视频帧数据作为变化视频帧数据；
确定所述目标对象在所述变化视频帧数据中的位置坐标；
根据所述位置坐标确定所述目标视频中目标对象的位置属性信息。

4.根据权利要求1所述的方法，其特征在于，所述目标对象为处于运动状态的对象；
所述根据所述视频帧数据，确定所述目标视频中目标对象的位置属性信息，包括：
将所述视频帧数据输入至对象识别模型，通过所述对象识别模型识别所述视频帧数据中的背景图像；
获取所述背景图像的背景像素值，获取所述视频帧数据对应的视频帧像素值；
确定所述背景像素值与所述视频帧像素值之间的差异像素值，将所述差异像素值所在的区域，确定为所述目标对象在所述视频帧数据中的位置坐标；
根据所述位置坐标确定所述目标视频中目标对象的位置属性信息。

5.根据权利要求3或权利要求4所述的方法，其特征在于，所述根据所述位置坐标确定所述目标视频中目标对象的位置属性信息，包括：
获取视频虚拟镜头的中心位置信息；所述视频虚拟镜头为模拟拍摄所述目标对象的虚拟镜头；
根据所述位置坐标，确定所述目标对象与所述中心位置信息之间的景深距离；
确定所述目标对象与所述视频虚拟镜头之间的位置偏移角度；
将所述景深距离与所述位置偏移角度确定为所述目标对象的位置属性信息。

6.根据权利要求5所述的方法，其特征在于，所述获取与所述位置属性信息相关联的声道编码参数，根据所述声道编码参数对所述音频帧数据进行方位增强处理，得到增强音频帧数据，包括：
获取参数映射表；所述参数映射表包括至少两个参数映射关系；一个参数映射关系包括一个位置属性信息与一个声道编码参数之间的映射关系；一个位置属性信息包括一个景深距离与一个位置偏移角度；
在所述参数映射表中，获取与所述目标对象的位置属性信息具有映射关系的声道编码参数；
根据具有映射关系的声道编码参数对所述音频帧数据进行方位增强处理，得到增强音频帧数据。

7.根据权利要求6所述的方法，其特征在于，所述具有映射关系的声道编码参数包含第一声道编码参数以及第二声道编码参数；
所述根据具有映射关系的声道编码参数对所述音频帧数据进行方位增强处理，得到增强音频帧数据，包括：
根据所述第一声道编码参数对所述音频帧数据进行卷积处理，得到第一增强音频帧数据；
根据所述第二声道编码参数对所述音频帧数据进行卷积处理，得到第二增...

【专利技术属性】
技术研发人员：梁启仍，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人