实现视频会议中提词的方法以及装置制造方法及图纸

技术编号:5444539 阅读:241 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了实现视频会议中提词的方法以及会场终端。其中,一种实现视频会议中提词的方法,包括:视频会议终端获取至少一个提词字幕图片;对该至少一个提词字幕图片进行编辑处理,并按照指定的图片显示顺序将经过编辑处理的提词字幕图片缓存到所述本地会场终端的显存中;接收提词指令;根据该提词指令,在本地会场终端显示的远端会议视频的指定区域,按照显存中指定的图片显示顺序,滚动显示经过编辑处理的该提词字幕图片。本发明专利技术实施例提供的技术方案有利于降低视频会议中提词功能的实现成本和复杂度,提高会场部署灵活性。

【技术实现步骤摘要】

本专利技术涉及通信
,具体涉及实现视频会议中提词的方法以及装置。技术背景随着用户需求的演变和视频会议技术的发展,视频会议技术已经越来越广泛的应 用在学术交流,远程教育、商务磋商、峰会论坛等多种场景。在很多场景下,参与会议的发言者可能都需要基于一定的发言稿来进行相应发 言。为使得发言者无须低头看发言稿,而直接面对摄像头发言,以增强与远端与会人员的会 议交流,现有的很多会议系统都考虑到为发言人提供提词的功能。现有技术中较常用的提词功能的实现方式是,部署专用提词设备(包含一台专门 显示提词信息的显示器)为与会者提词,会议终端通过软件控制提词设备实时提词。实践发现,现有利用专用提词设备进行提词的技术中,需增加额外的硬件和配套 软件来实现提词,其实现成本相对较高,管理相对较复杂,功能扩展也相对较差;且提词的 显示器的安装位置直接影响提词效果,使会场部署受到诸多的限制。
技术实现思路
本专利技术实施例提供实现视频会议中提词的方法以及装置,以降低视频会议中提词 功能的实现成本和复杂度,提高会场部署灵活性。为解决上述技术问题,本专利技术实施例提供以下技术方案一种实现视频会议中提词的方法,包括视频会议终端获取至少一个提词字幕图片;对所述至少一个提词字幕图片进行编辑处理,并按照指定的图片显示顺序将经过 编辑处理的所述提词字幕图片缓存到所述视频会议终端的显存中;接收提词指令;根据所述提词指令,在所述视频会议终端显示的远端会议视频的指定区域,按照 显存中指定的图片显示顺序,滚动显示经过编辑处理的所述提词字幕图片。一种实现视频会议中提词的方法,包括视频会议终端获取提词字幕文件;接收提词指令;采样发言者音频;对所述采样的发言者音频进行语音识别,获得与采样的所述发言者音频对应的文 字信息;将获得的与采样的所述发言者音频对应的文字信息,与提词字幕文件包含的提词 字幕信息进行匹配;根据匹配结果,在所述视频会议终端显示的远端会议视频的指定区域,显示所述 提词字幕文件包含的提词字幕信息中,与当前采样的所述发言者音频对应的文字信息相匹配部分的下一部分提词字幕信息。一种视频会议终端,包括获取模块,用于获取至少一个提词字幕图片;处理缓存模块,用于对所述获取模块获取的至少一个提词字幕图片进行编辑处 理,并按照指定的图片显示顺序将经过编辑处理的所述提词字幕图片缓存到所述视频会议 终端显存中;接收模块,用于接收提词指令;滚动显示模块,用于根据所述接收模块接收的提词指令,在所述视频会议终端显 示的远端会议视频的指定区域,按照显存中指定的图片显示顺序,滚动显示经过编辑处理 的所述提词字幕图片。一种视频会议终端,包括第二获取模块,用于获取提词字幕文件;接收模块,用于接收提词指令;采样模块,用于采样发言者音频;语音识别模块,用于对所述采样模块采样的发言者音频进行语音识别,获得与采 样的所述发言者音频对应的文字信息;匹配模块,用于将所述语音识别模块获得的与采样的所述发言者音频对应的文字 信息,与提词字幕文件包含的提词字幕信息进行匹配;显示控制模块,用于根据所述匹配模块的匹配结果,在所述视频会议终端显示的 远端会议视频的指定区域,显示所述提词字幕文件包含的提词字幕信息中,与当前采样的 所述发言者音频对应的文字信息相匹配部分的下一部分提词字幕信息。由上可见,在本专利技术实施例提供的一种方案中,由视频会议终端直接获取包含发 言所需的提词信息的提词字幕图片,并按指定的顺序将经过编辑处理的提词字幕图片缓存 到视频会议终端显存中,在接收提词指令后,在远端会议视频的指定区域,按照显存中指定 的图片显示顺序滚动显示经过编辑处理的提词字幕图片,由于是直接以包含发言所需的提 词信息的提词字幕图片为基础进行处理,处理复杂度可适当降低;由于引入了滚动显示机 制,在远端会议视频的指定区域滚动显示提词字幕图片,有利于在清晰显示提词字幕的同 时,不影响到远端会议视频的正常观看,进而提升会议体验;并且,由于可利用会议终端固 有硬件资源实现提词功能,可降低视频会议中提词功能的硬件实现成本和系统复杂度,提 高会场部署灵活性。在本专利技术实施例提供的另一种方案中,由视频会议终端直接获取包含发言所需的 提词信息的提词字幕文件,在接收提词指令后,采样发言者音频;对采样的发言者音频进行 语音识别,获得与采样的发言者音频对应的文字信息;将获得的与采样的该发言者音频对 应的文字信息,与提词字幕文件包含的提词字幕信息进行匹配;根据匹配结果,在视频会议 终端显示的远端会议视频的指定区域,显示该提词字幕文件包含的提词字幕信息中,与当 前采样的发言者音频对应的文字信息相匹配部分的下一部分提词字幕信息。由于引入音频 识别技术和根据发言者语音的实时滚动显示机制,在远端会议视频的指定区域滚动显示提 词字幕,可实现自动实时的提词,并且有利于在清晰显示提词字幕的同时,不影响到远端会 议视频的正常观看,较大的提升会议体验;并且,由于可利用会议终端固有硬件资源实现提词功能,可降低视频会议中提词功能的硬件实现成本和系统复杂度,提高会场部署灵活性。 附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其 他的附图。图1是本专利技术实施例一提供的一种实现视频会议中提词的方法流程示意图2是本专利技术实施例二提供的一种实现视频会议中提词的方法流程示意图3_a是本专利技术实施例二提供的一种按页保存提词字幕图片示意图3_b是本专利技术实施例二提供的一种基于发言者语速滚动提词的示意图3-c是本专利技术实施例二提供叠加图片的地址跳转示意图3-d是本专利技术实施例二提供的一种提词字幕图片切分并叠加到本地视频的示 意 图4是本专利技术实施例三提供一种视频会议终端示意图5是本专利技术实施例四提供的一种实现视频会议中提词的方法流程示意图6是本专利技术实施例五提供一种视频会议终端示意图。具体实施方式本专利技术实施例提供一种实现视频会议中提词的方法以及装置,可降低视频会议中 提词功能的实现成本和复杂度,提高会场部署灵活性。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术 实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述 的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域普 通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的 范围。实施例一本专利技术实现视频会议中提词的方法的一个实施例,可包括视频会议终端获取至 少一个提词字幕图片;对上述至少一个提词字幕图片进行编辑处理,并按照指定的图片显 示顺序将经过编辑处理的该提词字幕图片缓存到视频会议终端的显存中;接收提词指令; 根据上述提词指令,在视频会议终端显示的远端会议视频的指定区域,按照显存中指定的 图片显示顺序,滚动显示经过编辑处理的上述提词字幕图片。参见图1,具体步骤可包括110、视频会议终端获取至少一个提词字幕图片;在实际应用中,视频会议终端获取提词字幕图片(其中包含发言者发言所需的提 词信息)的方式可以是多种多样的,例如会议终端既可从外部获取提词字幕图片本文档来自技高网...

【技术保护点】
一种实现视频会议中提词的方法,其特征在于,包括:  视频会议终端获取至少一个提词字幕图片;  对所述至少一个提词字幕图片进行编辑处理,并按照指定的图片显示顺序将经过编辑处理的所述提词字幕图片缓存到所述视频会议终端的显存中;  接收提词指令;根据所述提词指令,在所述视频会议终端显示的远端会议视频的指定区域,按照显存中指定的图片显示顺序,滚动显示经过编辑处理的所述提词字幕图片。

【技术特征摘要】
1.一种实现视频会议中提词的方法,其特征在于,包括 视频会议终端获取至少一个提词字幕图片;对所述至少一个提词字幕图片进行编辑处理,并按照指定的图片显示顺序将经过编辑 处理的所述提词字幕图片缓存到所述视频会议终端的显存中; 接收提词指令;根据所述提词指令,在所述视频会议终端显示的远端会议视频的指定区域,按照显存 中指定的图片显示顺序,滚动显示经过编辑处理的所述提词字幕图片。2.根据权利要求1所述的方法,其特征在于,所述滚动显示经过编辑处理的所述提词 字幕图片,包括基于预定的滚动速率,滚动显示经过编辑处理的所述提词字幕图片; 或者,基于与发言者语速相匹配的滚动速率,滚动显示经过编辑处理的所述提词字幕 图片;或者,根据发言者滚动显示控制指令,滚动显示经过编辑处理的所述提词字幕图片。3.根据权利要求1所述的方法,其特征在于,所述基于与发言者语速相匹配的滚动速率,滚动显示经过编辑处理的所述提词字幕图 片,包括采样发言者音频;对所述采样的发言者音频进行语音识别,获得与采样的所述发言者音频对应的文字信息;将获得的与采样的所述发言者音频对应的文字信息,与经过编辑处理的所述提词字幕 图片所能呈现的提词字幕信息进行匹配;根据匹配结果,显示经过编辑处理的所述提词字幕图片所能呈现的提词字幕信息中, 与当前采样的所述发言者音频对应的文字信息相匹配部分的下一部分提词字幕信息的对 应图片位置。4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括将当前滚动显示的经过编辑处理的所述提词字幕图片切分成多块,并将其叠加到本地 会议视频的指定区域,得到本地叠加视频;将所述本地叠加视频进行编码并向远端视频会议终端发送。5.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述至少一个提词字幕 图片进行编辑处理,包括将所述至少一个提词字幕图片编辑处理成带α信息的提词字幕图片。6.一种实现视频会议中提词的方法,其特征在于,包括 视频会议终端获取提词字幕文件;接收提词指令; 采样发言者音频;对所述采样的发言者音频进行语音识别,获得与采样的所述发言者音频对应的文字信息;将获得的与采样的所述发言者音频对应的文字信息,与提词字幕文件包含的提词字幕 信息进行匹配;根据匹配结果,在所述视频会议终端显示的远端会议视频的指定区域,显示所述提词 字幕文件包含的提词字幕信息中,与当前采样的所述发言者音频对应的文字信息相匹配部 分的下一部分提词字幕信息。7.一种视频会议终端,其特征在于,包括 获取模块,用于获取至少一个提词字幕图片;处理缓存模块,用于对所述获取模块获取的至少一个提词字幕图片进行编辑处理,并 按照指定的图片显示顺序将经过编辑处理的所述提词字幕图片缓存到所述视频会议终端 显存中;接收模块,用于接收提词指令;滚动显示模块,用于...

【专利技术属性】
技术研发人员:戴华波王海涛
申请(专利权)人:华为终端有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1