音视频同步方法、装置、服务器和计算机可读存储介质制造方法及图纸

技术编号：24504397 阅读：16 留言：0更新日期：2020-06-13 06:45

本发明专利技术提供了一种音视频同步方法、装置、服务器和计算机可读存储介质，涉及多屏数据处理技术领域，包括将多个发送端的音频源数据和视频源数据分别缓存在每个发送端对应的音频缓冲区和视频缓冲区；周期性的从每个音频缓冲区获取多个发送端的第一指定时长的音频源数据进行混合，得到音频混合数据；确定音频混合数据中每个音频源数据的音频初始时间戳；基于每个音频源数据的音频初始时间戳判断视频混合数据中是否存在与同一发送端发送的音频源数据不同步的视频源数据；如果是，调节与视频源数据不同步的音频源数据的时延，以使音频混合数据与视频混合数据同步。本发明专利技术可以保证在多人连麦的情况下音视频数据保持同步，提升了用户体验。

Audio and video synchronization methods, devices, servers and computer-readable storage media

全部详细技术资料下载

【技术实现步骤摘要】
音视频同步方法、装置、服务器和计算机可读存储介质
本专利技术涉及多屏数据处理
，尤其是涉及一种音视频同步方法、装置、服务器和计算机可读存储介质。
技术介绍
目前，多屏业务在工作、社交、娱乐等方面均具有越来越多的应用，但当网络不稳定时会导致网络丢包率较高，传输控制协议(TransmissionControlProtocol，TCP)的传输质量严重下降，重传拥塞导致音视频延时非常大，在无线信道下，易出现音视频长时间卡住不动然后快放的现象，效率低，占用系统资源高。诸如，在当前的直播多人连麦情况下，由于用户数据报文协议(UserDatagramProtocol，UDP)不能对所传数据提供担保，导致出现音视频数据不同步的现象。针对上述由于音视频时延大导致音视频数据不同步的现象，目前尚未提出有效的解决方案。
技术实现思路
本专利技术的目的在于提供一种音视频同步方法、装置、服务器和计算机可读存储介质，可以保证在多人连麦的情况下音视频数据保持同步，提升了用户体验。第一方面，实施例提供一种音视频同步方法，所述方法包括：接收多个发送端的音频源数据和视频源数据，并分别缓存在每个所述发送端对应的音频缓冲区和视频缓冲区；周期性的从每个所述音频缓冲区获取多个所述发送端的第一指定时长的所述音频源数据并进行混合，得到音频混合数据；确定所述音频混合数据中每个所述音频源数据的音频初始时间戳；基于每个所述音频源数据的所述音频初始时间戳判断视频混合数据中是否存在与同一所述发送端发送的所述音频源数据不同步的所述视频源...

【技术保护点】
1.一种音视频同步方法，其特征在于，所述方法包括：/n接收多个发送端的音频源数据和视频源数据，并分别缓存在每个所述发送端对应的音频缓冲区和视频缓冲区；/n周期性的从每个所述音频缓冲区获取多个所述发送端的第一指定时长的所述音频源数据并进行混合，得到音频混合数据；/n确定所述音频混合数据中每个所述音频源数据的音频初始时间戳；/n基于每个所述音频源数据的所述音频初始时间戳判断视频混合数据中是否存在与同一所述发送端发送的所述音频源数据不同步的所述视频源数据；其中，所述视频混合数据为周期性的从每个所述视频缓冲区获取所述多个发送端的第二指定时长的所述视频源数据并进行混合得到的；/n如果是，调节与所述视频源数据不同步的所述音频源数据的时延，以使所述音频混合数据与视频混合数据同步。/n

【技术特征摘要】
1.一种音视频同步方法，其特征在于，所述方法包括：
接收多个发送端的音频源数据和视频源数据，并分别缓存在每个所述发送端对应的音频缓冲区和视频缓冲区；
周期性的从每个所述音频缓冲区获取多个所述发送端的第一指定时长的所述音频源数据并进行混合，得到音频混合数据；
确定所述音频混合数据中每个所述音频源数据的音频初始时间戳；
基于每个所述音频源数据的所述音频初始时间戳判断视频混合数据中是否存在与同一所述发送端发送的所述音频源数据不同步的所述视频源数据；其中，所述视频混合数据为周期性的从每个所述视频缓冲区获取所述多个发送端的第二指定时长的所述视频源数据并进行混合得到的；
如果是，调节与所述视频源数据不同步的所述音频源数据的时延，以使所述音频混合数据与视频混合数据同步。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将同步的所述音频混合数据与视频混合数据进行合并，得到目标混合数据；所述目标混合数据包括目标时间戳；
将所述目标混合数据推送至内容分发网络CDN。

3.根据权利要求1所述的方法，其特征在于，所述确定所述音频混合数据中每个所述音频源数据的音频初始时间戳的步骤，包括：
基于当前输入每个所述音频缓冲区的所述音频源数据的当前时间戳和所述音频缓冲区的长度确定所述音频混合数据的每个所述音频源数据的音频初始时间戳。

4.根据权利要求1所述的方法，其特征在于，所述视频源数据包括指定数量的帧图像；所述方法还包括：
将多个所述视频源数据的当前帧图像进行合并，得到合并帧图像；
基于所述第二指定时长的所述合并帧图像确定所述视频混合数据。

5.根据权利要求1所述的方法，其特征在于，每个所述视频源数据包括视频初始时间戳；基于每个所述音频源数据的所述音频初始时间戳判断视频混合数据中是否存在与同一所述发送端发送的所述音频源数据不同步的所述视频源数据的步骤，包括：
基于每个所述音频源数据的所述音频初始时间戳和每个所述视频源数据的所述视频初始时间戳判断所视频混合数据中是否存在与同一所述发送端发送的所述音频源数据不同步的所述视频源数据。

6.根据权利要...

【专利技术属性】
技术研发人员：郭志鸣，梁学群，
申请(专利权)人：北京三体云时代科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人