基于连麦直播的线上合唱方法、装置及线上合唱系统制造方法及图纸

技术编号：39257530 阅读：8 留言：0更新日期：2023-10-30 12:09

本申请涉及一种基于连麦直播的线上合唱方法、装置及线上合唱系统；所述方法包括：接收至少两个连麦主播的音频信息和视频信息；对所述音频信息进行解析获取音频帧及其同步信息，以及对所述视频信息进行解析获取视频帧及其抠图信息；其中，所述同步信息包括语音音频帧时间戳及伴奏歌曲的伴奏进度；根据各个连麦主播的同步信息，分别将所述音频帧、视频帧与伴奏歌曲进行同步；根据各个连麦主播的抠图信息从相应的视频帧中抠出人像图像，并将所述音频帧、人像图像与伴奏歌曲进行合成得到合唱音视频数据；该技术方案，实现了虚拟同台合唱互动效果，增强直播互动性，延迟低、同步性好，实现主播之间异地沉浸式共演音效果，提升了合唱演示效果。示效果。示效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于连麦直播的线上合唱方法、装置及线上合唱系统
[0001]本申请要求于2022年04月14日提交中国专利局、申请号为202210387980.X、专利技术名称为“网络直播的连麦互动方法、装置及直播系统”的中国专利申请的优先权，其申请文件内容通过引用结合在本申请中。

[0002]本申请涉及网络直播
，特别是一种基于连麦直播的线上合唱方法、装置及线上合唱系统。

技术介绍

[0003]目前，随着5G、云计算，人工智能技术的发展，各类设备的便携化，在线直播早已深入人们的各类生活，渗透到了游戏、娱乐和社交等领域，基于在线直播的数字音乐产业也蓬勃发展，例如在线KTV，特别是元宇宙概念的出现，在技术上已经逐步实现并形成了一定生态基础，元宇宙所带来的丰富的应用场景，前沿的技术创新，极大改变了人们当下的生活方式和习惯，基于元宇宙可以搭建虚拟的KTV舞台，并提供给异地用户之间的虚拟同台合唱和互动功能，促进了用户体验的全面升级。
[0004]当前线上合唱共演方案，主播和唱歌嘉宾连麦虚拟房间的情况下，唱歌嘉宾开唱，主播端通过虚拟房间对应的另一个虚拟房间接收唱歌嘉宾端发送的干声，主播端将干声和主播端的本地伴奏混合得到K歌混音，并生成面向观众的直播流；该技术方案的主播端通过两个有关联的虚拟房间，收集唱歌嘉宾K歌的干声并生成直播流，其功能仅限于音频互动，缺乏视频互动功能，且其混音功能在客户端实现，对终端的要求较高，当用户网络差异较大时，容易导致在终端做音频的同步比较困难。
[0005]另外，还有一种异地共演技术，利...

【技术保护点】

【技术特征摘要】
1.一种基于连麦直播的线上合唱方法，其特征在于，包括：接收至少两个连麦主播的音频信息和视频信息；对所述音频信息进行解析获取音频帧及其同步信息，以及对所述视频信息进行解析获取视频帧及其抠图信息；其中，所述同步信息包括语音音频帧时间戳及伴奏歌曲的伴奏进度；根据各个连麦主播的同步信息，分别将所述音频帧、视频帧与伴奏歌曲进行同步；根据各个连麦主播的抠图信息从相应的视频帧中抠出人像图像，并将所述音频帧、人像图像与伴奏歌曲进行合成得到合唱音视频数据。2.根据权利要求1所述的基于连麦直播的线上合唱方法，其特征在于，所述抠图信息为与所述视频帧拼接的半透明通道图像；其中，所述半透明通道图像为对所述视频帧的人像图像预抠图得到。3.根据权利要求1所述的基于连麦直播的线上合唱方法，其特征在于，根据各个连麦主播的同步信息，分别将所述音频帧、视频帧与伴奏歌曲进行同步，包括：获取所述伴奏歌曲的伴奏视频帧和伴奏音频帧；分别根据各个连麦主播的同步信息，将所述音频帧的语音音频帧时间戳与伴奏歌曲的伴奏音频帧时间戳进行同步；分别根据各个连麦主播的同步信息，将所述音频帧的语音音频帧时间戳与所述视频帧的视频帧时间戳进行同步；将所述伴奏视频帧对应的伴奏视频帧时间戳与伴奏音频帧对应的伴奏音频帧时间戳进行同步。4.根据权利要求3所述的基于连麦直播的线上合唱方法，其特征在于，根据各个连麦主播的抠图信息从相应的视频帧中抠出人像图像，并将所述音频帧、人像图像与伴奏歌曲进行合成得到合唱音视频数据，包括：获取各个连麦主播的音频帧以及伴奏音频帧；将所述音频帧和伴奏音频帧进行混音编码得到音频数据；获取各个连麦主播的视频帧以及伴奏视频帧；根据各个连麦主播的视频帧对应的抠图信息分别抠出人像图像；将所述人像图像和伴奏视频帧进行合成并编码得到视频数据。5.根据权利要求4所述的基于连麦直播的线上合唱方法，其特征在于，还包括：对所述视频信息中的SEI信息进行解析获取所述视频帧对应的图像相关信息；其中，所述图像相关信息包括主播AI信息和主播特效信息。6.根据权利要求5所述的基于连麦直播的线上合唱方法，其特征在于，将所述人像图像和伴奏视频帧进行合成并编码得到视频数据，包括：获取所述伴奏视频帧以及所述主播特效信息对应的特效渲染素材；以所述伴奏视频帧为背景图像，将各个连麦主播的人像图像绘制到所述背景图像上；根据所述主播AI信息将所述特效渲染素材绘制到该连麦主播在所述背景图像上对应区域画面中；输出合成图像并编码得到视频数据。7.根据权利要求6所述的基于连麦直播的线上合唱方法，其特征在于，将各个连麦主播
的人像图像绘制到所述背景图像上之前，还包括：获取各个人像图像的大小参数及背景图像大小分辨率；根据背景图像分辨率及人像图像的大小参数对各个人像图像进行归一化处理，得到图像大小相匹配的人像图像。8.根据权利要求6所述的基于连麦直播的线上合唱方法，其特征在于，所述主播AI信息包括主播...

【专利技术属性】
技术研发人员：赵国庆，刘伟安，李劲，
申请(专利权)人：广州方硅信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人