本实用新型专利技术提供了一种集成远场语音识别和声场录制的系统,系统包括麦克风阵列和数据处理终端,并具有远场语音识别和声场录制两种工作模式,麦克风阵列对声音信号进行采集,数据处理终端连接麦克风阵列,接收麦克风阵列采集的声音信号,并对声音信号进行处理,实现远场语音识别和声场录制。本实用新型专利技术可以工作于远场语音识别和声场录制两种模式,分别完成远场语音识别功能和声场录制功能,利用一个麦克风阵列和一套系统即可同时实现远场语音识别功能和声场录制功能,功能多样,一机两用,节约了设备成本;可以采用语音指令或者移动终端切换工作模式,切换方式灵活简单,便于用户操作。
【技术实现步骤摘要】
本技术总体上涉及语音处理
,尤其涉及集成远场语音识别和声场录制的系统。
技术介绍
近几年人工智能,人工智能的前端最重要的是信息的正确获取,特别是音视频技术受到格外关注,但与视频技术的进步相比,虽说在近场单通道语音识别上获得很大进展,已经达到非常高的正确识别率,但远场语音交互技术还需要更大的发展,基于麦克风阵列的远场语音识别是其中最关键的技术。同样的,AR(AugmentedReality,增强现实)/VR(VirtualReality,虚拟现实)技术在近些年开始逐步走向应用,相对于视觉体验,音频体验同样相对滞后,其中一项重要的技术是原始声场的采集与重现,利用麦克风技术阵列技术,同样可以实现原始声场的采集。但是现有产品及技术都是针对其中某项应用进行的设计,仅仅能实现远场语音识别或者声场录制,而在实际应用过程中,例如在办公场所或者家庭客厅中,一方面有远场语音识别与控制的需求,例如利用远场识别控制电视或者投影仪的操作灯;另一方面又有声场录制的需求,例如与远方朋友或亲人全息通话,或者会议室内的全息音视频会议通讯等,现有技术并没有能够同时满足上述两种需求的系统。例如,亚马逊推出的echo音箱利用麦克风阵列技术进行远场语音采集。在音箱顶部布放了6+1个麦克风,其中6个麦克风均匀布放构成一个环形阵列,另外中心布放一个麦克风,利用麦克风阵列信号处理技术,实现远场语音识别,但并没有声场录音的功能。其他类似的智能音箱都采用了类似的方案,但都只实现远场语音识别功能。1.2.2现有技术一的缺点又例如,CN104754471A利用麦克风阵列中的两两组合成新的麦克风对进行处理,计算获得声场各阶分量,利用解码矩阵合成各扬声器激励,从而重建二维声场。但其只能进行声场录制,没有远场语音识别功能。
技术实现思路
(一)要解决的技术问题本技术提供了一种集成远场语音识别和声场录制的系统,既能实现远场语音识别,又能够实现声场录制,并且能进行两种模式的灵活切换。(二)技术方案本技术提供了一种集成远场语音识别和声场录制的系统,包括:麦克风阵列和数据处理终端;其中,所述系统包括远场语音识别和声场录制两种工作模式;所述麦克风阵列对声音信号进行采集;所述数据处理终端连接所述麦克风阵列,接收所述麦克风阵列采集的声音信号,并对所述声音信号进行处理,实现远场语音识别和声场录制。优选地,所述麦克风阵列为圆形阵、矩形阵或椭圆形阵。优选地,所述麦克风阵列的麦克风数量大于等于4,麦克风之间的间距小于8cm。优选地,所述数据处理终端为计算机。优选地,当系统处于远场语音识别工作模式时,所述麦克风阵列采集远场语音信号,所述数据处理终端对所述远场语音信号进行远场语音识别;当系统处于声场录制工作模式时,所述麦克风阵列采集多通道音频信号,所述数据处理终端对所述多声道音频信号进行声场录制。优选地,所述数据处理终端包括:语音控制模块、远场语音识别模块和声场录制模块;在所述语音控制模块的控制下,所述远场语音识别模块对远场语音信号进行远场语音识别,系统进入远场语音识别工作模式;在所述语音控制模块的控制下,所述声场录制模块对多声道音频信号进行声场录制,系统进入声场录制工作模式,实现工作模式的切换。优选地,还包括控制端;所述控制端为手机。优选地,所述数据处理终端包括远程控制模块,远场语音识别模块和声场录制模块,所述远程控制模块与所述控制端无线连接;所述控制端向所述远程控制模块发送控制信号,在所述远程控制模块的控制下,所述远场语音识别模块对远场语音信号进行远场语音识别,系统进入远场语音识别工作模式;所述控制端向所述远程控制模块发送控制信号,在所述远程控制模块的控制下,所述声场录制模块对多声道音频信号进行声场录制,系统进入声场录制工作模式,实现工作模式的切换。优选地,所述远场语音识别模块为广义旁瓣对消器。(三)有益效果从上述技术方案可以看出,本技术的集成远场语音识别和声场录制的系统具有以下有益效果:(1)将远场语音识别和声场录制集成在一个系统中,利用同一个小型麦克风阵列,即可实现远场语音识别又可实现声场录制,相对于现有技术,只需一套系统即可同时实现远场语音识别功能和声场录制功能,功能多样,一机两用,节约了设备成本;(2)可以采用语音指令或者移动终端切换工作模式,切换方式灵活简单,便于用户操作。附图说明为了更完整地理解本技术及其优势,现在将参考结合附图的以下描述,其中:图1为本技术实施例的集成远场语音识别和声场录制的系统的结构示意图;图2为本技术实施例的集成远场语音识别和声场录制的系统的处理流程图;图3为集成远场语音识别和声场录制的流程图。具体实施方式根据结合附图对本技术示例性实施例的以下详细描述,本技术的其它方面、优势和突出特征对于本领域技术人员将变得显而易见。在本技术中,术语“包括”和“含有”及其派生词意为包括而非限制;术语“或”是包含性的,意为和/或。在本说明书中,下述用于描述本技术原理的各种实施例只是说明,不应该以任何方式解释为限制技术的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本技术的示例性实施例。下述描述包括多种具体细节来帮助理解,但这些细节应认为仅仅是示例性的。因此,本领域普通技术人员应认识到,在不背离本技术的范围和精神的情况下,可以对本文中描述的实施例进行多种改变和修改。此外,为了清楚和简洁起见,省略了公知功能和结构的描述。此外,贯穿附图,相同参考数字用于相似功能和操作。本技术实施例提供了一种集成远场语音识别和声场录制的系统,该系统可以工作于远场语音识别和声场录制两种模式,分别完成远场语音识别功能和声场录制功能,如图1所示,该系统包括:麦克风阵列和数据处理终端;其中,麦克风阵列包括四个麦克风构成的小型圆形阵列,麦克风阵列用于对声音信号进行采集,当系统进行远场语音识别时,麦克风阵列采集远场语音信号,当系统进行声场录制时,麦克风阵列采集多通道音频信号。数据处理终端连接麦克风阵列,接收麦克风阵列采集的声音信号,并对声音信号进行处理。数据处理终端具有远场语音识别和声场录制两种工作模式,当其工作于远场语音识别模式时,对远场语音信号进行远场语音识别,当其工作于声场录制模式时,对多声道音频信号进行声场录制。由此可见,本技术将远场语音识别和声场录制集成在一个系统中,利用同一个小型麦克风阵列,即可实现远场语音识别又可实现声场录制,相对于现有技术,只需一套系统即可同时实现远场语音识别功能和声场录制功能,功能多样,一机两用,节约了设备成本。在本技术中,数据处理终端可以是计算机等数据处理设备,包括:语音控制模块、远场语音识别模块和声场录制模块。用户根据所需的应用场景和使用目的,可以通过语音切换数据处理终端的工作模式。例如,当需要进行远场语音识别时,用户可发出相应的语音指令,语音控制模块接收语音指令,并根据语音指令生成控制信号,远场语音识别模块对远场语音信号进行远场语音识别,使数据处理终端工作于远场语音识别模式。当需要进行全息音/视频会议或环绕声场采集时,用户可发出相应的语音指令,语音控制模块接收语音指令,并根据语音指令生成控制信号,声场录制模块对多声道音频信号进行声场录制,使数据处理终本文档来自技高网...
【技术保护点】
一种集成远场语音识别和声场录制的系统,其特征在于,包括:麦克风阵列和数据处理终端;其中,所述系统包括远场语音识别和声场录制两种工作模式;所述麦克风阵列对声音信号进行采集;所述数据处理终端连接所述麦克风阵列,接收所述麦克风阵列采集的声音信号,并对所述声音信号进行处理,实现远场语音识别和声场录制。
【技术特征摘要】
1.一种集成远场语音识别和声场录制的系统,其特征在于,包括:麦克风阵列和数据处理终端;其中,所述系统包括远场语音识别和声场录制两种工作模式;所述麦克风阵列对声音信号进行采集;所述数据处理终端连接所述麦克风阵列,接收所述麦克风阵列采集的声音信号,并对所述声音信号进行处理,实现远场语音识别和声场录制。2.如权利要求1所述的系统,其特征在于,所述麦克风阵列为圆形阵、矩形阵或椭圆形阵。3.如权利要求2所述的系统,其特征在于,所述麦克风阵列的麦克风数量大于等于4,麦克风之间的间距小于8cm。4.如权利要求1所述的系统,其特征在于,所述数据处理终端为计算机。5.如权利要求1所述的系统,其特征在于,当系统处于远场语音识别工作模式时,所述麦克风阵列采集远场语音信号,所述数据处理终端对所述远场语音信号进行远场语音识别;当系统处于声场录制工作模式时,所述麦克风阵列采集多通道音频信号,所述数据处理终端对所述多声道音频信号进行声场录制。6.如权利要求5所述的系统,其特征在于,所述数据处理终端包括:语音控制模块、远场语音...
【专利技术属性】
技术研发人员:陈日林,冯大航,陈孝良,苏少炜,
申请(专利权)人:北京声智科技有限公司,
类型:新型
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。