本发明专利技术实施例提供一种视频通讯中用于呈现通讯信息的方法,其特征在于,包括:控制采集视频通讯现场的音频信息与视频信息;根据音频信息判断视频通讯现场中的发言人的位置,发言人为视频通讯现场参加者中发言的人;根据发言人的位置从视频信息中获取发言视频信息,其中,发言视频信息为发言人在发言时段的视频信息;控制发言视频信息呈现。
【技术实现步骤摘要】
本专利技术涉及通迅领域,尤其涉及用于视频通讯的音视频信息的呈现方法、装置及 系统。
技术介绍
现有用于视频会议的通讯技术中,一方会场的显示设备通常会显示另一方会场的 所有参会人员,如另一方会场中的参会人员过多,会导致显示设备显示过多人员而不能重 点突出正在发言的人。 因此,需要研究开发出一种通讯方法及系统克服上述缺陷。
技术实现思路
第一方面,本专利技术实施例提供了一种视频通讯中用于呈现通讯信息的方法,包括: 控制采集所述视频通讯现场的音频信息与视频信息;根据所述音频信息判断所述视频通讯 现场中的发言人的位置,所述发言人为为所述视频通讯现场参加者中发言的人,所述多个 参加者为多个参加所述视频通讯的人;根据所述发言人的位置从所述视频信息中获取发言 视频信息,其中,所述发言视频信息为所述发言人在所述发言时段的视频信息;控制所述发 目视频?目息呈现。 在第一方面的第一种可能的实现方式中,所述控制采集所述视频通讯现场的音频 信息与视频信息包括:控制数个采集设备采集所述音频信息与所述视频信息,所述数个采 集设备中的每个采集设备包括一个音频采集模块及一个视频采集模块,所述视频采集模块 相对于所述音频采集模块的位置为预设的,所述音频采集模块采集所述多个参加者中一个 或数个参加者的音频信息,所述视频采集模块采集所述一个或数个参加者的视频信息,所 述音频采集模块采集的所述多个参加者中一个或数个参加者的音频信息构成所述音频信 息中的一路音频信息,所述视频采集模块采集的所述一个或数个参加者的视频信息构成所 述视频信息中的一路视频信息;所述根据所述音频信息判断所述视频通讯现场中的发言人 的位置包括:将所述音频信息中音量最大,音量超过音量阈值,且所述音量超过所述音量阈 值的持续时间超过时间阈值的一路音频信息作为所述发言人的声音信息;及根据所述发 言人的声音信息,判断所述发言人相对于采集所述发言人的声音信息的音频采集模块的位 置;所述根据所述发言人的位置从所述视频信息中获取发言视频信息包括:根据所述发言 人相对于采集所述发言人的声音信息的音频采集模块的位置及采集所述发言人的视频信 息的视频采集模块相对于采集所述发言人的声音信息的音频采集模块的位置,判断所述发 言人相对于采集所述发言人的视频信息的视频采集模块的位置;识别出采集所述发言人的 视频信息的视频采集模块采集的一路视频信息中的所述一个或数个参加者的影像,并记录 所述一个或数个参加者的影像相对于采集所述发言人的视频信息的视频采集模块的位置; 根据所述发言人相对于采集所述发言人的视频信息的视频采集模块的位置及所述一个或 数个参加者的影像相对于采集所述发言人的视频信息的视频采集模块的位置,确定采集所 述发言人的视频信息的视频采集模块采集的一路视频信息中所述发言人的影像;及从采集 所述发言人的视频信息的视频采集模块采集的一路视频信息中,提取所述发言时段中所述 发言人的影像。 在第一方面的第二种可能的实现方式中,所述控制采集所述视频通讯现场的音频 信息与视频信息包括:控制一个采集设备采集设备采集所述音频信息与所述视频信息,所 述采集设备包括一个音频采集模块及一个视频采集模块,所述音频采集模块相对于所述视 频采集模块的位置为预设的,所述音频采集模块采集所述音频信息,所述音频信息为所述 多个参加者的音频信息,所述视频采集模块采集所述视频信息,所述视频信息为所述多个 参加者的视频信息;所述根据所述音频信息判断所述视频通讯现场中的发言人的位置包 括:根据所述音频信息,判断所述发言人相对于所述音频采集模块的位置;所述根据所述 发言人的位置从所述视频信息中获取发言视频信息包括:根据所述发言人相对于所述音频 采集模块的位置及所述视频采集模块相对于所述音频采集模块的位置,判断所述发言人相 对于所述视频采集模块的位置;识别出所述视频信息中的所述多个参加者的影像,并记录 所述多个参加者的影像相对于所述视频采集模块的位置;根据所述发言人相对于所述视频 采集模块的位置及所述多个参加者的影像相对于所述视频采集模块的位置,确定所述视频 信息中所述发言人的影像;及从所述视频信息中,提取所述发言时段中所述发言人的影像。 结合第一方面第一种可能的实现方式以及第二种可能的实现方式中的任意一种 可能的实现方式,在第三种可能的实现方式中,其中,所述音频采集模块为麦克风阵列,其 中,所述麦克风阵列包括至少两个麦克风。 结合第一方面,或者第一方面第一至第二种任意一种可能的实现方式,在第四种 可能的实现方式中,所述控制所述发言视频信息呈现包括:控制所述发言视频信息实时呈 现。 结合第一方面,或者第一方面第一至第二种任意一种可能的实现方式,在第五种 可能的实现方式中,所述控制所述发言视频信息呈现包括:控制记录所述发言视频信息; 及控制记录的所述发言视频信息在所述发言时段结束后呈现。 结合第一方面第五种可能的实现方式,在第六种可能的实现方式中,还包括:若所 述发言人的音量低于音量最低阈值,且所述发言人的音量低于音量最低阈值的持续时间长 于最长时间阈值,则判断所述发言时段结束;或若收到发言结束信号,则判断所述发言时段 结束。 结合第一方面第五种可能的实现方式以及第六种可能的实现方式中的任意一种 可能的实现方式,在第七种可能的实现方式中,所述控制所述发言视频信息呈现还包括生 成与所述发言视频信息对应的记录图标,所述控制记录的所述发言视频信息在所述发言时 段结束后呈现包括根据接收到的指示所述记录图标是否得到触碰的信号,控制开启播放或 停止播放所述发言视频信息。 结合第一方面第七种可能的实现方式,在第八种可能的实现方式中,所述方法还 包括根据接收到的指示所述记录图标是否得到触碰的信号,控制开启播放或停止播放下列 信息中的至少一种信息:发言音频信息及与所述发言音频信息对应的文本信息,所述发言 音频信息为所述音频信息中在所述发言时段中的音频信息。 结合第一方面第五种可能的实现方式、第一方面第六种可能的实现方式及第一方 面第七种可能的实现方式中任意一种可能的实现方式,在第九种可能的实现方式中,还包 括:在所述发言时段中,禁止发言音频信息及所述发言视频信息实时呈现,所述发言音频信 息为所述音频信息中在所述发言时段中的音频信息。 结合第一方面、第一方面第一种可能的实现方式、第一方面第二种可能的实现方 式、第一方面第三种可能的实现方式及第一方面第四种可能的实现方式中任意一种可能的 实现方式,在第十种可能的实现方式中,所述控制所述发言视频信息呈现包括:控制记录所 述发言视频信息;接收指示信息,所述指示信息用于指示待播放的发言视频信息的时间范 围;及控制呈现所述时间范围内的所述发言视频信息。 第二方面,本专利技术实施例提供了一种视频通讯中用于呈现通讯信息的装置,包括: 控制采集模块,用于控制一个或多个采集设备采集所述视频通讯现场的音频信息与视频信 息;判断模块,用于根据所述音频信息判断所述视频通讯现场中的发言人的位置,所述发言 人为多个参加者中在发言时段发言的参加者,所述多个参加者为多个参加所述视频通讯的 人;获取模块,用于根据所述发言人的位置从所述视频信息中获取发言视频信息,其中,所 述发言视频信息为所述发言人在所述发言时段的视频信息;本文档来自技高网...
【技术保护点】
一种视频通讯中用于呈现通讯信息的方法,其特征在于,包括:控制采集所述视频通讯现场的音频信息与视频信息;根据所述音频信息判断所述视频通讯现场中的发言人的位置,所述发言人为所述视频通讯现场参加者中发言的人;根据所述发言人的位置从所述视频信息中获取发言视频信息,其中,所述发言视频信息为所述发言人在发言时段的视频信息;控制所述发言视频信息呈现。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈子冲,赵寅,吕培,周炯,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。