基于数据处理的语音交互方法和系统技术方案

技术编号:33840367 阅读:19 留言:0更新日期:2022-06-16 12:05
本发明专利技术提供了一种基于数据处理的语音交互方法和系统,涉及语音交互技术领域,本发明专利技术针对基于虚拟现实的远程会议场景进行了适配,通过在收到第一参会人员的私密交流请求后,实时采集第一参会人员的语音信息,并利用语音识别技术来构建备选会议名称集合,并基于备选会议名称确定目标第二参会人员,最终将所述语音信息发送至目标第二参会人员的虚拟现实设备,实现两个参会人员在多人会议的场景下方便、快速的进行私密交流。速的进行私密交流。速的进行私密交流。

【技术实现步骤摘要】
基于数据处理的语音交互方法和系统


[0001]本专利技术涉及语音交互
,具体涉及一种基于数据处理的语音交互方法和系统。

技术介绍

[0002]远程会议是指利用现代化的通讯手段,实现跨区域召开会议。现有的远程会议通常是指视频会议系统,只有视频、文字与图片的交互,沉浸感和交互便利程度都有明显的不足。为了提高远程会议的沉浸感和交互便利程度,目前已有相关技术将虚拟现实引入视频会议系统,通过在虚拟空间中渲染出会议场景和参会人员的虚拟形象,同时参会人员佩戴虚拟现实设备来模拟真实世界的会议体验,能够极大的提高远程会议的沉浸感和交互便利程度。
[0003]现有的基于虚拟现实的远程会议中,需要通过虚拟现实设备的麦克风采集参会人员的语音信息,并广播给虚拟会议场景中的所有人。但目前的基于虚拟现实的远程会议的语音交互功能与普通的视频会议系统语音交互功能类似,如果参会人员需要与虚拟会议场景中的某一人通话,有如下两种方式:1)类似与现实会议的悄悄话,距离说话者的距离越远,声音越小,即在开麦的状态下,降低说话音量,以和附近的人进行私密的语音交流,但这种方式的私密性较差,且需要两人在虚拟场景中相互靠近,说话声音不好控制。
[0004]2)由参会人员手动选择目标后实现两人的私密交流,如果参会人员过多,则在参会人员手动选择的操作难度和繁琐程度就会大幅提高。
[0005]显然,目前的语音交互方式并不能很好适用在基于虚拟现实的远程会议场景,因此,目前亟需一种能够适配基于虚拟现实的远程会议的语音交互方法。

技术实现思路
<br/>[0006](一)解决的技术问题针对现有技术的不足,本专利技术提供了一种基于数据处理的语音交互方法和系统,解决了目前的语音交互方案无法适配基于虚拟现实的远程会议场景的问题。
[0007](二)技术方案为实现以上目的,本专利技术通过以下技术方案予以实现:第一方面,提供了一种基于数据处理的语音交互方法,该方法包括:在收到第一参会人员的私密交流请求后,实时采集第一参会人员的语音信息;所述第一参会人员为录入私密语音的参会人员;利用语音识别算法从所述语音信息中提取出第二参会人员的会议名称,构建备选会议名称集合;所述第二参会人员为除第一参会人员以外的参会人员;基于备选会议名称集合确定目标第二参会人员;将所述语音信息发送至目标第二参会人员的虚拟现实设备。
[0008]进一步的,所述利用语音识别算法从所述语音信息中提取出第二参会人员的会议名称,构建备选会议名称集合,包括:获取所有参会人员的真实名称和参会昵称构建会议名称库;基于会议名称库识别出语音信息中所有第二参会人员的会议名称以及第二参会人员的会议名称在语音信息中的词序信息;基于第二参会人员的会议名称在语音信息中的词序顺序构建备选会议名称集合。
[0009]进一步的,所述基于备选会议名称集合确定目标第二参会人员,包括:当备选会议名称集合不为空集时,获取备选会议名称集合中首个第二参会人员的会议名称,作为备选第二参会人员;若备选第二参会人员的词序信息为前n个词,则将备选第二参会人员作为目标第二参会人员;否则,将备选会议名称集合设为空集。
[0010]进一步的,该方法还包括:在收到第一参会人员的私密交流请求后,同时实时采集第一参会人员的虚拟现实设备的显示画面信息以及第一参会人员的注视区域;利用目标识别算法识别出所述显示画面中的第二参会人员的虚拟形象,构建备选形象集合;且所述基于备选会议名称集合确定目标第二参会人员,还包括:当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员。
[0011]进一步的,所述当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员,包括:若第一参会人员的注视区域中仅有一个虚拟形象时,将该虚拟形象对应的第二参会人员作为目标第二参会人员;否则,则将最接近注视区域中心的虚拟形象对应的第二参会人员作为目标第二参会人员。
[0012]第二方面,提供了一种基于数据处理的语音交互系统,该系统包括:数据采集模块,用于在收到第一参会人员的私密交流请求后,实时采集第一参会人员的语音信息;所述第一参会人员为录入私密语音的参会人员;语音识别模块,用于利用语音识别算法从所述语音信息中提取出第二参会人员的会议名称,构建备选会议名称集合;所述第二参会人员为除第一参会人员以外的参会人员;目标第二参会人员确定模块,用于基于备选会议名称集合确定目标第二参会人员;语音交互模块,用于将所述语音信息发送至目标第二参会人员的虚拟现实设备。
[0013]进一步的,所述语音识别模块包括:会议名称库构建单元,用于获取所有参会人员的真实名称和参会昵称构建会议名称库;会议名称提取单元,用于基于会议名称库识别出语音信息中所有第二参会人员的会议名称以及第二参会人员的会议名称在语音信息中的词序信息;备选会议名称集合构建单元,基于第二参会人员的会议名称在语音信息中的词序顺序构建备选会议名称集合。
[0014]进一步的,所述目标第二参会人员确定模块,包括:第一确定策略单元,用于当备选会议名称集合不为空集时,获取备选会议名称集合中首个第二参会人员的会议名称,作为备选第二参会人员;若备选第二参会人员的词序信息为前n个词,则将备选第二参会人员作为目标第二参会人员;否则,将备选会议名称集合设为空集。
[0015]进一步的,所述数据采集模块还用于在收到第一参会人员的私密交流请求后,同时实时采集第一参会人员的虚拟现实设备的显示画面信息以及第一参会人员的注视区域;且该系统还包括:虚拟形象识别模块,用于利用目标识别算法识别出所述显示画面中的第二参会人员的虚拟形象,构建备选形象集合;且所述目标第二参会人员确定模块,还包括:第二确定策略单元,用于当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员。
[0016]进一步的,所述当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员,包括:若第一参会人员的注视区域中仅有一个虚拟形象时,将该虚拟形象对应的第二参会人员作为目标第二参会人员;否则,则将最接近注视区域中心的虚拟形象对应的第二参会人员作为目标第二参会人员。
[0017](三)有益效果本专利技术实施例针对基于虚拟现实的远程会议场景进行了适配,通过在收到第一参会人员的私密交流请求后,实时采集第一参会人员的语音信息,并利用语音识别技术来构建备选会议名称,并基于备选会议名称确定目标第二参会人员,最终将所述语音信息发送至目标第二参会人员的虚拟现实设备,实现两个参会人员在多人会议的场景下方便、快速的进行私密交流。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据处理的语音交互方法,其特征在于,该方法包括:在收到第一参会人员的私密交流请求后,实时采集第一参会人员的语音信息;所述第一参会人员为录入私密语音的参会人员;利用语音识别算法从所述语音信息中提取出第二参会人员的会议名称,构建备选会议名称集合;所述第二参会人员为除第一参会人员以外的参会人员;基于备选会议名称集合确定目标第二参会人员;将所述语音信息发送至目标第二参会人员的虚拟现实设备。2.如权利要求1所述的一种基于数据处理的语音交互方法,其特征在于,所述利用语音识别算法从所述语音信息中提取出第二参会人员的会议名称,构建备选会议名称集合,包括:获取所有参会人员的真实名称和参会昵称构建会议名称库;基于会议名称库识别出语音信息中所有第二参会人员的会议名称以及第二参会人员的会议名称在语音信息中的词序信息;基于第二参会人员的会议名称在语音信息中的词序顺序构建备选会议名称集合。3.如权利要求2所述的一种基于数据处理的语音交互方法,其特征在于,所述基于备选会议名称集合确定目标第二参会人员,包括:当备选会议名称集合不为空集时,获取备选会议名称集合中首个第二参会人员的会议名称,作为备选第二参会人员;若备选第二参会人员的词序信息为前n个词,则将备选第二参会人员作为目标第二参会人员;否则,将备选会议名称集合设为空集。4.如权利要求3所述的一种基于数据处理的语音交互方法,其特征在于,该方法还包括:在收到第一参会人员的私密交流请求后,同时实时采集第一参会人员的虚拟现实设备的显示画面信息以及第一参会人员的注视区域;利用目标识别算法识别出所述显示画面中的第二参会人员的虚拟形象,构建备选形象集合;且所述基于备选会议名称集合确定目标第二参会人员,还包括:当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员。5.如权利要求4所述的一种基于数据处理的语音交互方法,其特征在于,所述当备选会议名称集合为空集时,基于备选形象集合和所述第一参会人员的注视区域确定第一参会人员注视的虚拟形象作为目标第二参会人员,包括:若第一参会人员的注视区域中仅有一个虚拟形象时,将该虚拟形象对应的第二参会人员作为目标第二参会人员;否则,则将最接近注视区域中心的虚拟形象对应的第二参会人员作为目标第二参会人员。6.一种基于数据处理的语音交互系统,其特征在于,该系统包括:数据采集模块,用于在收到第...

【专利技术属性】
技术研发人员:张腾飞马骏谭维涛彭超
申请(专利权)人:深圳市一恒科电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1