视频会议控制方法、装置及其系统、电子设备及存储介质制造方法及图纸

技术编号:34605320 阅读:24 留言:0更新日期:2022-08-20 09:09
本申请公开了一种视频会议控制方法、装置及其系统、电子设备及存储介质,视频会议控制方法应用于服务器,包括获取第一客户端采集的媒体流数据,媒体流数据包括视频流数据以及音频流数据;根据第二客户端的用户信息,确定用户信息对应的目标语言种类,用户信息至少包括用户的地理位置信息;将音频流数据转换为目标语言种类对应的目标文本;将媒体流数据以及目标文本发送至第二客户端,以使得第二客户端同步播放媒体流数据以及目标文本。本方法实现了根据第二客户端的用户信息对应的目标语言种类以及第一客户端采集的媒体流数据,生成第二客户端的播放字幕,提高了视频会议的会议效率。率。率。

【技术实现步骤摘要】
视频会议控制方法、装置及其系统、电子设备及存储介质


[0001]本申请涉及多媒体通信
,更具体地,涉及一种视频会议控制方法、装置及其系统、电子设备及存储介质。

技术介绍

[0002]视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。
[0003]视频会议成为了人们沟通的一种重要媒介方式。在视频会议过程中,与会人员主要通过收听报告人的音频内容了解报告人的会议报告内容。
[0004]然而,对于不同地区的与会人员,以及听障与会人员,仅通过收听报告人的音频内容,很难掌握会议内容,导致视频会议的会议效率较低。

技术实现思路

[0005]鉴于上述问题,本申请提出了一种视频会议控制方法、装置及其系统、电子设备及存储介质,以克服或者至少部分地解决以上现有技术的问题。
[0006]第一方面,本申请实施例提供了一种视频会议控制方法,应用于服务器,视频会议控制方法包括:获取第一客户端采集的媒体流数据,媒体流数据包括视频流数据以及音频流数据;根据第二客户端的用户信息,确定用户信息对应的目标语言种类,用户信息至少包括用户的地理位置信息;将音频流数据转换为目标语言种类对应的目标文本;将媒体流数据以及目标文本发送至第二客户端,以使得第二客户端同步播放媒体流数据以及目标文本。
[0007]第二方面,本申请实施例提供了一种视频会议控制方法,应用于第二客户端,视频会议控制方法包括:接收服务器发送的媒体流数据以及目标文本,媒体流数据经由第一客户端采集并发送至服务器,媒体流数据包括视频流数据以及音频流数据,目标文本基于服务器根据第二客户端的用户信息,将音频流数据转换获得,用户信息至少包括用户的地理位置信息;同步播放媒体流数据以及目标文本。
[0008]第三方面,本申请实施例提供了一种视频会议控制系统,包括第一客户端、第二客户端以及服务器,服务器连接于第一客户端以及第二客户端;第一客户端,用于采集媒体流数据,并将媒体流数据发送至服务器,媒体流数据包括视频流数据以及音频流数据;服务器,用于执行如上述第一方面提供的视频会议控制方法;第二客户端,用于执行如上述第二方面提供的视频会议控制方法。
[0009]第四方面,本申请实施例提供了一种视频会议控制装置,应用于服务器,视频会议控制装置包括第一获取模块、语言确定模块、转换模块以及发送模块。第一获取模块,用于获取第一客户端采集的媒体流数据,媒体流数据包括视频流数据以及音频流数据;语言确定模块,用于根据第二客户端的用户信息,确定用户信息对应的目标语言种类,用户信息至少包括用户的地理位置信息;转换模块,用于将音频流数据转换为目标语言种类对应的目
标文本;发送模块,用于将媒体流数据以及目标文本发送至第二客户端,以使得第二客户端同步播放媒体流数据以及目标文本。
[0010]第五方面,本申请实施例提供了一种视频会议控制装置,应用于第二客户端,视频会议控制装置包括数据接收模块以及播放模块。数据接收模块,用于接收服务器发送的媒体流数据以及目标文本,媒体流数据经由第一客户端采集并发送至服务器,媒体流数据包括视频流数据以及音频流数据,目标文本基于服务器根据第二客户端的用户信息,将音频流数据转换获得,用户信息至少包括用户的地理位置信息;播放模块,用于同步播放媒体流数据以及目标文本。
[0011]第六方面,本申请实施例提供了一种电子设备,包括存储器;一个或多个处理器,与存储器耦接;一个或多个应用程序,其中,一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于执行如上述第一方面或第二方面提供的视频会议控制方法。
[0012]第七方面,本申请实施例提供了一种计算机可读取存储介质,计算机可读取存储介质中存储有程序代码,程序代码可被处理器调用执行如上述第一方面或第二方面提供的视频会议控制方法。
[0013]本申请提供的方案,服务器通过获取第一客户端采集的媒体流数据,媒体流数据包括视频流数据以及音频流数据,并根据第二客户端的用户信息,确定用户信息对应的目标语言种类,用户信息至少包括用户的地理位置信息,并将音频流数据转换为目标语言种类对应的目标文本,以及将媒体流数据以及目标文本发送至第二客户端,以使得第二客户端同步播放媒体流数据以及目标文本,实现了根据第二客户端的用户信息对应的目标语言种类以及第一客户端采集的媒体流数据,生成第二客户端的播放字幕,避免了与第二客户端对应的不同地区的与会人员以及听障与会人员无法通过收听第一客户端的音频流数据来掌握会议内容,提高了视频会议的会议效率。
[0014]进一步地,根据第二客户端的用户信息,确定第二客户端的用户信息对应的目标语言种类,并根据目标语言种类生成对应的播放字幕,可保证每个第二客户端对应的与会人员观看到的播放字幕的语言种类为自己掌握的语言种类,提高了与会人员的会议体验。
附图说明
[0015]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1示出了本申请实施例提供的视频会议控制系统的一种场景示意图。
[0017]图2示出了本申请实施例提供的视频会议控制方法的一种流程示意图。
[0018]图3示出了本申请实施例提供的视频会议控制方法的另一种流程示意图。
[0019]图4示出了本申请实施例提供的视频会议控制方法的再一种流程示意图。
[0020]图5示出了本申请实施例提供的视频会议控制装置的一种结构框图。
[0021]图6示出了本申请实施例提供的视频会议控制装置的另一种结构框图。
[0022]图7示出了本申请实施例提供的电子设备的一种结构框图。
[0023]图8示出了本申请实施例提供的用于保存或者携带现实根据本申请实施例提供的视频会议控制方法的程序代码的计算机可读存储介质。
具体实施方式
[0024]下面详细描述本申请的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。
[0025]下文的公开提供了许多不同的实施方式或例子用来实现本申请的不同结构。为了简化本申请的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本申请。此外,本申请可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。
[0026]视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。...

【技术保护点】

【技术特征摘要】
1.一种视频会议控制方法,其特征在于,应用于服务器,包括:获取第一客户端采集的媒体流数据,所述媒体流数据包括视频流数据以及音频流数据;根据第二客户端的用户信息,确定所述用户信息对应的目标语言种类,所述用户信息至少包括用户的地理位置信息;将所述音频流数据转换为所述目标语言种类对应的目标文本;将所述媒体流数据以及所述目标文本发送至所述第二客户端,以使得所述第二客户端同步播放所述媒体流数据以及所述目标文本。2.根据权利要求1所述的视频会议控制方法,其特征在于,在所述将所述音频流数据转换为所述目标语言种类对应的目标文本之前,还包括:确定是否翻译所述音频流数据;所述将所述音频流数据转换为所述目标语言种类对应的目标文本,包括:当确定翻译所述音频流数据时,将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型,所述目标翻译模型用于将所述音频流数据翻译为所述目标语言种类对应的目标文本;接收所述目标翻译模型输出的所述目标文本。3.根据权利要求2所述的视频会议控制方法,其特征在于,所述确定是否翻译所述音频流数据,包括:将所述视频流数据、所述音频流数据以及所述目标语言种类进行匹配,获得第一匹配度;当所述第一匹配度大于或者等于第一匹配度阈值时,则确定不翻译所述音频流数据;当所述第一匹配度小于第一匹配度阈值时,则确定翻译所述音频流数据。4.根据权利要求2所述的视频会议控制方法,其特征在于,所述当确定翻译所述音频流数据时,将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型之前,还包括:当确定翻译所述音频流数据时,确定是否存在预先训练的目标翻译模型;所述当确定翻译所述音频流数据时,将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型,包括:当确定翻译所述音频流数据,且存在预先训练的目标翻译模型时,将所述音频流数据以及所述目标语言种类输入至预先训练的目标翻译模型。5.根据权利要求4所述的视频会议控制方法,其特征在于,还包括:当确定翻译所述音频流数据,且不存在预先训练的目标翻译模型时,生成提示信息,以使得用户人工训练用于将所述音频流数据翻译为所述目标语言种类对应的目标文本的人工翻译模型;将所述音频流数据输入至所述人工翻译模型。6.根据权利要求4所述的视频会议控制方法,其特征在于,所述当确定翻译所述音频流数据时,确定是否存在预先训练的目标翻译模型,包括:当确定翻译所述音频流数据时,将所述目标语言种类与预存翻译模型进行匹配,获得第二匹配度;
当所述第二匹配度大于或者等于第二匹配度阈值时,则确定存在预先训练的目标翻译模型;当所述第二匹配度小于第二匹配度阈值时,则确定不存在预先训练的目标翻译模型。7.根据权利要求2所述的视频会议控制方法,其特征在于,还包括:当确定不翻译所述音频流数据时,将所述音频流数据输入至预先训练的语音识别模型,所述语音识别模型用于对所述音频流数据进行语音识别,获得识别文本;接收所述语音识别模型输出的所述识别文本;确定所述识别文本的语言种类是否为所述目标语言种类;当确定所述识别文本的语言种类为所述目标语言种类时,将所述识别文本确定所述目标语言对应的目标文本。8.根据权利要求...

【专利技术属性】
技术研发人员:崔洋洋余俊澎王星宇
申请(专利权)人:游密科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1