语音控制装置及语音控制方法制造方法及图纸

技术编号:8613119 阅读:157 留言:0更新日期:2013-04-20 02:54
本发明专利技术提供一种语音控制装置,不使用视觉而可确认选择了立体地配置于虚拟空间的声源的哪个。该语音控制装置是进行有关立体地配置于虚拟空间的声源的处理的装置,其具有决定虚拟空间中的选择位置即指针的当前位置的指针位置计算单元(664)、和生成音响指针的音响指针生成单元(667),所述音响指针通过与周围的音响状态的差异来表示指针的当前位置。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及进行有关立体地配置于虚拟空间的声源的处理的。
技术介绍
近年来,可将短的文本消息经由网络在用户间轻松交换的服务正在增加。另外,存在可将发话语音上传到网络上的服务器在用户间简单共享的服务。因此,作为将这些服务融合的形式,期待不用眼睛阅读而是可用耳朵听从多个用户发来的消息的服务。这是由于如果能够用耳朵确认从多个用户发来的短句(嘀咕),则可以不使用视觉而获取多个信息。例如在专利文献I中记载了处理多个语音信息的技术。专利文献I记载的技术中,将分配给多个语音数据的多个声源立体地配置于虚拟空间,输出各语音数据。另外,专利文献I记载的技术中,在画面上显示各声源的位置关系图,通过光标表示选择了哪一语音。通过使用该技术对各输出源分配不同的声源,从而可以容易地听清来自多个其它用户的语音。而且,用户可以一边确认选择了哪一语音一边进行各种操作(例如音量的变更)。现有技术文献专利文献专利文献1:日本特开2005-269231号公报专利技术要解决的问题但是,在上述的专利文献I中,存在如果不看画面就不能确认选择了哪一语音的问题。为了实现更便于用户的服务,希望不使用视觉而能够确认选择了哪一语音。
技术实现思路
本专利技术的目的在于,提供一种,其不使用视觉而能够确认选择了立体地配置于虚拟空间中的声源的哪个。解决问题的方案本专利技术的语音控制装置,其进行有关立体地配置于虚拟空间的声源的处理,其中,具有指针位置计算单元,其决定所述虚拟空间中的选择位置即指针的当前位置;音响指针生成单元,其生成音响指针,所述音响指针通过与周围的音响状态的差异表示所述指针的当前位置。本专利技术提供一种语音控制方法,进行有关立体地配置于虚拟空间的声源的处理,其中,具有决定所述虚拟空间中的选择位置即指针的当前位置的步骤;生成音响指针的步骤,所述音响指针通过与周围的音响状态的差异表示所述指针的当前位置。专利技术效果根据本专利技术 ,不使用视觉而能够确认选择了立体地配置于虚拟空间的声源的哪个。附图说明图1是表示包含本专利技术一实施方式的语音控制装置的终端装置的结构之一例的框图;图2是表示本实施方式的控制单元的结构之一例的框图;图3是表示本实施方式的合成语音数据的声场感觉之一例的示意图;图4是表示本实施方式的终端装置的动作之一例的流程图;图5是表示本实施方式的位置计算处理之一例的流程图;图6是表示本实施方式的合成语音数据的声场感觉的另一例的示意图;符号说明100终端装置200通信网络300语音消息管理服务器400语音输入输出装置500操作输入装置 600语音控制装置610通信接口单元620语音输入输出单兀630操作输入单元640存储单元650播放单元660控制单元661声源插入控制单元662声源配置计算单元663操作模式判别单元664指针位置计算单元665指针判定单元666选择声源记录单元667音响指针生成单元668语音合成单元669操作指令控制单元具体实施例方式下面,参照附图详细说明本专利技术的一实施方式。本实施方式是将本专利技术适用于可带出户外且可与其它用户进行语音交流的终端装置的例子。图1是表示包含本专利技术一实施方式的语音控制装置的终端装置的结构之一例的框图。图1所示的终端装置100是可经由因特网或内部网等通信网络200与语音消息管理服务器300连接的装置。终端装置100通过语音消息管理服务器300与其它终端装置(未图示)进行语音消息的数据交换。以下将语音消息的数据简称为“语音消息”。在此,语音消息管理服务器300是管理从各终端装置上传的语音消息且将各语音消息在被上传的时刻向多个终端装置分发的装置。语音消息例如作为WAV等规定格式的文件被进行传输及保存。特别是,也可以在从语音消息管理服务器300分发语音消息时,作为流媒体格式的数据进行传输。在此,在所上传的语音消息中随附有包含进行了上传的用户(发送源)的用户名、上传日期时间及语音消息的长度的元数据。元数据例如作为XML(extensible markup language,可扩展标记语言)等规定格式的文件被传输及保存。终端装置100具有语音输入输出装置400、操作输入装置500及语音控制装置600。语音输入输出装置400将从语音控制装置600输入的语音消息语音化并向用户输出,且将从用户输入的语音消息信号化并向语音控制装置600输出。本实施方式中,将语音输入输出装置400设为具备麦克风及耳机的头戴式送受话器。语音输入输出装置400输入的语音中含有以上传为目的的用户的语音消息、和以对语音控制装置600的操作为目的的操作指令的语音数据。下面,将操作指令的语音数据称为“语音指令”。另外,语音消息不限于用户的发话语音,也可以是通过语音合成生成的语音或音乐等。另外,对于本专利技术中所说的“语音”,根据作为语音消息而例举的例子可知,是指不限于人类的声音的一般声音。即,“语音”是指如音乐、虫等动物类的鸣叫声、来自机械的噪音等人工的声音、及瀑布或雷等自然的声音那样泛指的声音(sound)。操作输入装置500检测用户的动作及操作(以下总称为“操作”),将表示检测到的操作的内容的操作信息输出到语音控制装置600。在本实施方式中,操作输入装置500为安装于上述头戴式送受话器的 3D (dimension,维)运动传感器。3D运动传感器可获取方位及加速度。因此,在本实施方式中,操作信息是作为表示实空间中的用户的头部的朝向的信息的方位和加速度。下面,将用户的头部简称为“头部”。另外,在本实施方式中,将实空间中的用户的头部的朝向设为脸的正面的朝向。此外,设语音输入输出装置400及操作输入装置500例如通过有线电缆或蓝牙(BlueTooth(注册商标))等无线通信分别与语音控制装置600连接。语音控制装置600将从语音消息管理服务器300接收的语音消息作为虚拟空间内的声源进行配置,且向语音输入输出装置400输出。具体而言,语音控制装置600将从语音消息管理服务器300发送来的其它用户的语音消息作为虚拟空间的声源立体地进行配置。下面,将从语音消息管理服务器300发送来的其它用户的语音消息称作“接收语音消息”。而且,语音控制装置600将其转换为从配置于虚拟空间的声源可听到语音消息那样的语音数据,并输出到语音输入输出装置400。即,语音控制装置600将多个接收语音消息以容易区分开地听清的方式配置于虚拟空间并提供给用户。另外,语音控制装置600将从语音输入输出装置400输入的用户的语音消息发送到语音消息管理服务器300。下面,将从语音输入输出装置400输入的用户的语音消息称作“发送语音消息”。即,语音控制装置600将发送语音消息上传到语音消息管理服务器300。另外,语音控制装置600决定虚拟空间中的选择位置即指针的当前位置,使用音响指针表示该位置。在本实施方式中,设指针为表示作为操作对象被选择的位置的操作指针。音响指针是指在虚拟空间上通过与和周围的语音消息的音响状态的不同来表示指针(本实施方式中为操作指针)的当前位置的指针。音响指针例如取与操作指针的当前位置相对应的声源的语音消息和其它语音消息之间的差异的方式。该差异包括因音质或音量等不同而使所选择的语音消息比其它未选择的语音消息清晰的情况。这种情况下,用户可根据各语音消息的音质或音量的变化来把握选择了哪一声源。另外,音响指本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2011.03.08 JP 2011-0505841.语音控制装置,其进行有关立体地配置于虚拟空间的声源的处理,具有 指针位置计算单元,其决定所述虚拟空间中的选择位置即指针的当前位置;以及 音响指针生成单元,其生成音响指针,所述音响指针利用与周围的音响状态的差异表示所述指针的当前位置。2.如权利要求1所述的语音控制装置, 所述音响指针包括从所述指针的当前位置输出的规定的声音。3.如权利要求1所述的语音控制装置, 所述音响指针包括与所述指针的当前位置对应的所述声源的语音与其它语音的差异。4.如权利要求3所述的语音控制装置, 所述语音的差异包括所述声源的语音比所述其它语音更清晰。5.如权利要求1所述的语音控制装置,具有 声源配置计算单元,其将所述声源立体地配置于所述虚拟空间; 语音合成单元,其生成对所述声源的语音及所述音响指针进行合成而得到的语音; 操作输入单元,其接受对所述指针的当前位置的决定操作; 操作指令控制单元,其在所述声源位于成为所述决定操作对象的位置时,进行指定了所述声源的所述处理。6.如权利要求5所述的语音控制装置, 所述操作输入单元还接受对所述指针的移动操作。7.如权利要求...

【专利技术属性】
技术研发人员:中井健太郎
申请(专利权)人:松下电器产业株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1