视频会议控制方法、装置及其系统、电子设备及存储介质制造方法及图纸

技术编号：34605320 阅读：39 留言：0更新日期：2022-08-20 09:09

本申请公开了一种视频会议控制方法、装置及其系统、电子设备及存储介质，视频会议控制方法应用于服务器，包括获取第一客户端采集的媒体流数据，媒体流数据包括视频流数据以及音频流数据；根据第二客户端的用户信息，确定用户信息对应的目标语言种类，用户信息至少包括用户的地理位置信息；将音频流数据转换为目标语言种类对应的目标文本；将媒体流数据以及目标文本发送至第二客户端，以使得第二客户端同步播放媒体流数据以及目标文本。本方法实现了根据第二客户端的用户信息对应的目标语言种类以及第一客户端采集的媒体流数据，生成第二客户端的播放字幕，提高了视频会议的会议效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
视频会议控制方法、装置及其系统、电子设备及存储介质

[0001]本申请涉及多媒体通信
，更具体地，涉及一种视频会议控制方法、装置及其系统、电子设备及存储介质。

技术介绍

[0002]视频会议，是指位于两个或多个地点的人们，通过通信设备和网络，进行面对面交谈的会议。根据参会地点数目不同，视频会议可分为点对点会议和多点会议。
[0003]视频会议成为了人们沟通的一种重要媒介方式。在视频会议过程中，与会人员主要通过收听报告人的音频内容了解报告人的会议报告内容。
[0004]然而，对于不同地区的与会人员，以及听障与会人员，仅通过收听报告人的音频内容，很难掌握会议内容，导致视频会议的会议效率较低。

技术实现思路

[0005]鉴于上述问题，本申请提出了一种视频会议控制方法、装置及其系统、电子设备及存储介质，以克服或者至少部分地解决以上现有技术的问题。
[0006]第一方面，本申请实施例提供了一种视频会议控制方法，应用于服务器，视频会议控制方法包括：获取第一客户端采集的媒体流数据，媒体流数据包括视频流数据以及音频流数据；根据第二客户端的用户信息，确定用户信息对应的目标语言种类，用户信息至少包括用户的地理位置信息；将音频流数据转换为目标语言种类对应的目标文本；将媒体流数据以及目标文本发送至第二客户端，以使得第二客户端同步播放媒体流数据以及目标文本。
[0007]第二方面，本申请实施例提供了一种视频会议控制方法，应用于第二客户端，视频会议控制方法包括：接收服务器发送的媒体流数据以及

【技术保护点】

【技术特征摘要】
1.一种视频会议控制方法，其特征在于，应用于服务器，包括：获取第一客户端采集的媒体流数据，所述媒体流数据包括视频流数据以及音频流数据；根据第二客户端的用户信息，确定所述用户信息对应的目标语言种类，所述用户信息至少包括用户的地理位置信息；将所述音频流数据转换为所述目标语言种类对应的目标文本；将所述媒体流数据以及所述目标文本发送至所述第二客户端，以使得所述第二客户端同步播放所述媒体流数据以及所述目标文本。2.根据权利要求1所述的视频会议控制方法，其特征在于，在所述将所述音频流数据转换为所述目标语言种类对应的目标文本之前，还包括：确定是否翻译所述音频流数据；所述将所述音频流数据转换为所述目标语言种类对应的目标文本，包括：当确定翻译所述音频流数据时，将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型，所述目标翻译模型用于将所述音频流数据翻译为所述目标语言种类对应的目标文本；接收所述目标翻译模型输出的所述目标文本。3.根据权利要求2所述的视频会议控制方法，其特征在于，所述确定是否翻译所述音频流数据，包括：将所述视频流数据、所述音频流数据以及所述目标语言种类进行匹配，获得第一匹配度；当所述第一匹配度大于或者等于第一匹配度阈值时，则确定不翻译所述音频流数据；当所述第一匹配度小于第一匹配度阈值时，则确定翻译所述音频流数据。4.根据权利要求2所述的视频会议控制方法，其特征在于，所述当确定翻译所述音频流数据时，将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型之前，还包括：当确定翻译所述音频流数据时，确定是否存在预先训练的目标翻译模型；所述当确定翻译所述音频流数据时，将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型，包括：当确定翻译所述音频流数据，且存在预先训练的目标翻译模型时，将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型。5.根据权利要求4所述的视频会议控制方法，其特征在于，还包括：当确定翻译所述音频流数据，且不存在预先训练的目标翻译模型时，生成提示信息，以使得用户人工训练用于将所述音频流数据翻译为所述目标语言种类对应的目标文本的人工翻译模型；将所述音频流数据输入至所述人工翻译模型。6.根据权利要求4所述的视频会议控制方法，其特征在于，所述当确定翻译所述音频流数据时，确定是否存在预先训练的目标翻译模型，包括：当确定翻译所述音频流数据时，将所述目标语言种类与预存翻译模型进行匹配，获得第二匹配度；
当所述第二匹配度大于或者等于第二匹配度阈值时，则确定存在预先训练的目标翻译模型；当所述第二匹配度小于第二匹配度阈值时，则确定不存在预先训练的目标翻译模型。7.根据权利要求2所述的视频会议控制方法，其特征在于，还包括：当确定不翻译所述音频流数据时，将所述音频流数据输入至预先训练的语音识别模型，所述语音识别模型用于对所述音频流数据进行语音识别，获得识别文本；接收所述语音识别模型输出的所述识别文本；确定所述识别文本的语言种类是否为所述目标语言种类；当确定所述识别文本的语言种类为所述目标语言种类时，将所述识别文本确定所述目标语言对应的目标文本。8.根据权利要求...

【专利技术属性】
技术研发人员：崔洋洋，余俊澎，王星宇，
申请(专利权)人：游密科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人