基于混响模拟的语音识别测试方法及系统技术方案

技术编号:31313597 阅读:28 留言:0更新日期:2021-12-12 21:51
本发明专利技术提供了一种基于混响模拟的语音识别测试方法及系统,其方法包括如下步骤:首先,设置第一测试场景,第一测试场景的混响参数采集设备置于第一封闭边界内且环绕预设待测位置放置,混响参数采集设备对第一声源发出的第一测试音频进行混响参数采集,然后,设置第二测试场景,并且第二测试场景内的音频生成器生成拟真混响测试音频,第二音源发出拟真混响测试音频,待测设备接收拟真混响测试音频,最后,待测设备输出识别结果,处理器对识别结果进行判断;其系统包括第一测试场景、第二测试场景、待测设备和处理器。本发明专利技术中采用对真实混响进行模拟的方法,代替了传统的在真实环境中进行测试的方法,不再受场地制约,而且操作更加方便快捷。便快捷。便快捷。

【技术实现步骤摘要】
基于混响模拟的语音识别测试方法及系统


[0001]本专利技术涉及混响模拟
,具体地,涉及基于混响模拟的语音识别测试方法及系统。

技术介绍

[0002]语言一直以来是人与人之间最重要的交流方式,但是,随着人工智能快速发展,语言不再仅仅是人与人之间的交流方式,语言也成为了人与机器沟通的重要手段,人工智能语音识别技术作为人机交流接口,成为了人与机器沟通的关键技术,人工智能语音识别技术为我们的生活提供各种各样的可能性,使我们的生活更容易,并且它也能推动我们生活中各个领域的创新,在几乎所有领域都会有人工智能语音识别技术应用的机会,其中,包括工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等等领域。语音识别技术有巨大的市场潜力。
[0003]人工智能语音识别技术应用在人工智能语音设备上,人工智能语音设备存在着许多应用场景,如卧室、餐厅、会议室、阳台、厨房、浴室、音乐厅、会议室等等,上述不同的场景下的空间特性是一般是不一样的,因此,各场景的混响情况也不一样。
[0004]因为人工智能语音设备会应用在不同的混响场景下,因此人工智能语音设备在出厂前都会进行不同混响场景情况下的语音识别测试,人工智能语音设备在进行语音性能测试前,需要布置各种环境来模拟不同的混响状况,浪费了大量的人力物力,而且布置各种真实环境还会受到场地的制约,因此一些复杂的场景布置起来十分不便,而且在测试完一个场景后,需要将测试设备转移到另一个场景进行测试,因此无法同时对多个场景进行测试,效率低下。

技术实现思路

[0005]针对现有技术中的缺陷,本专利技术的目的是提供一种基于混响模拟的语音识别测试方法及系统。
[0006]第一方面,本专利技术提供一种基于混响模拟的语音识别测试方法,包括如下步骤:
[0007]步骤S1,设置第一测试场景,所述第一测试场景包括至少一个第一声源、若干第一封闭边界及多个混响参数采集设备,其中:
[0008]所述第一声源位于所述第一封闭边界内;
[0009]所述混响参数采集设备置于所述第一封闭边界内,并于三维空间中环绕预设待测位置放置;
[0010]步骤S2,通过所述第一声源发出的第一测试音频,所述第一测试音频经所述第一封闭边界的反射形成混响音,每个混响参数采集设备根据采集方向上接收到的所述混响音执行混响采集,并生成对应的混响参数;
[0011]步骤S3,根据所述混响参数和第二测试音频,生成拟真混响测试音频,所述第二测试音频包括代表预设测试指令的测试指令语料;
[0012]步骤S4,设置第二测试场景,所述第二测试场景包括第二封闭边界和多个第二声源,待测设备置于所述第二测试场景中,其中:
[0013]所述第二封闭边界用于实现内部封闭环境与外部开放环境间的隔音,以及消除所述内部封闭环境可能生成的所述混响音;
[0014]多个所述第二声源和所述待测设备均位于所述第二封闭边界内,所述待测设备与每个所述第二声源之间的相对位置关系与所述待测位置与每个混响参数采集设备之间的相对位置关系一致;
[0015]步骤S5,通过所述第二声源发出的所述拟真混响测试音频,所述待测设备根据接收到的所述拟真混响测试音频进行语音识别并生成相应的语音识别结果;
[0016]步骤S6,判断所述语音识别结果与所述预设测试指令是否相一致,并对所述判断结果进行记录。
[0017]可选地,所述第二声源发出的所述拟真混响测试音频,根据所述相对位置关系一致的所述混响参数采集设备生成的所述混响参数和所述第二测试音频生成。
[0018]可选地,于所述步骤S2中,所述混响采集包括:
[0019]步骤S21,所述第一声源于第一测试音频集合中,依次序提取一个所述第一测试音频进行发出,所述第一测试音频集合中包括多个频率不同的第一测试音频,每个所述第一测试音频具有相同的第一持续时间;
[0020]步骤S22,所述混响参数采集设备对所述采集方向上接收到的音频信号进行持续采集,获取所述音频信号的第二持续时间以及频率变化情况;
[0021]直至每个所述混响参数采集设备均无法采集到音频信号的情况时,再重复执行步骤S21至步骤S22,直至所述第一声源对所述第一测试音频集合中的全部所述第一测试音频完成播放。
[0022]可选地,所述混响参数包括每个所述第一测试音频的频率所对应的混响持续时间和频率衰变曲线;
[0023]所述混响持续时间包括对应频率下所述第二持续时间和所述第一持续时间的差值;
[0024]所述频率衰变曲线包括对应频率下所述混响持续时间内的所述频率变化情况。
[0025]可选地,于所述步骤S3中,所述拟真混响测试音频的生成包括:
[0026]步骤S31,对所述第二测试音频进行特征段提取,并获取所述特征段的平均频率;
[0027]步骤S32,根据所述平均频率,选择对应的所述混响参数,并基于选择的所述混响参数生成混响叠加音频;
[0028]步骤S33,将所述混响叠加音频与所述第二测试音频进行叠加,以生成所述拟真混响测试音频。
[0029]可选地,所述第二测试音频还包括代表所述预设测试指令的环境噪音语料,所述环境噪音语料用于为所述语音识别测试提供真实环境模拟。
[0030]可选地,所述拟真混响测试音频包括测试指令混响音频和环境噪音混响音频;
[0031]所述测试指令混响音频根据所述测试指令语料和所述混响参数生成;
[0032]所述环境噪音混响音频根据所述环境噪音语料和所述混响参数生成。
[0033]可选地,多个所述第二声源中的至少一部分发出所述测试指令混响音频;
[0034]多个所述第二声源中的至少一部分对所述环境噪音混响音频进行播。
[0035]可选地,发出所述测试指令混响音频的所述第二声源与所述待测设备处于同一水平面上。
[0036]第二方面,本专利技术还提供一种基于混响音模拟的语音识别测试系统,应用于上述所述的语音识别测试方法中,,包括:
[0037]第一测试场景,用于提供混响参数采集环境,包括至少一个第一声源、第一封闭边界以及多个混响采集设备,其中:
[0038]所述第一声源位于所述第一封闭边界内,用于发出第一测试音频,所述第一测试音频经所述第一封闭边界的反射形成混响音;
[0039]多个所述混响参数采集设备,置于所述第一封闭边界内,并于三维空间中环绕待测位置放置,用于根据采集方向上接收到的所述混响音执行混响采集,并生成对应的混响参数;
[0040]音频生成器,用于根据所述混响参数和第二测试音频生成拟真混响测试音频,所述第二测试音频包括代表预设测试指令的测试指令语料;
[0041]第二测试场景,用于为待测设备提供语音识别测试环境,所述第二测试场景包括第二封闭边界和多个第二声源,所述待测设备置于所述第二测试场景中,其中:
[0042]所述第二封闭边界用于实现内部封闭环境与外部开放环境间的隔音,以及消除所述内部封闭环境可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混响模拟的语音识别测试方法,其特征在于,包括如下步骤:步骤S1,设置第一测试场景,所述第一测试场景包括至少一个第一声源、若干第一封闭边界及多个混响参数采集设备,其中:所述第一声源位于所述第一封闭边界内;所述混响参数采集设备置于所述第一封闭边界内,并于三维空间中环绕预设待测位置放置;步骤S2,通过所述第一声源发出的第一测试音频,所述第一测试音频经所述第一封闭边界的反射形成混响音,每个混响参数采集设备根据采集方向上接收到的所述混响音执行混响采集,并生成对应的混响参数;步骤S3,根据所述混响参数和第二测试音频,生成拟真混响测试音频,所述第二测试音频包括代表预设测试指令的测试指令语料;步骤S4,设置第二测试场景,所述第二测试场景包括第二封闭边界和多个第二声源,待测设备置于所述第二测试场景中,其中:所述第二封闭边界用于实现内部封闭环境与外部开放环境间的隔音,以及消除所述内部封闭环境可能生成的所述混响音;多个所述第二声源和所述待测设备均位于所述第二封闭边界内,所述待测设备与每个所述第二声源之间的相对位置关系与所述待测位置与每个混响参数采集设备之间的相对位置关系一致;步骤S5,通过所述第二声源发出的所述拟真混响测试音频,所述待测设备根据接收到的所述拟真混响测试音频进行语音识别并生成相应的语音识别结果;步骤S6,判断所述语音识别结果与所述预设测试指令是否相一致,并对所述判断结果进行记录。2.根据权利要求1所述的语音识别方法,其特征在于,所述第二声源发出的所述拟真混响测试音频,根据所述相对位置关系一致的所述混响参数采集设备生成的所述混响参数和所述第二测试音频生成。3.根据权利要求1所述的语音识别测试方法,其特征在于,于所述步骤S2中,所述混响采集包括:步骤S21,所述第一声源于第一测试音频集合中,依次序提取一个所述第一测试音频进行发出,所述第一测试音频集合中包括多个频率不同的第一测试音频,每个所述第一测试音频具有相同的第一持续时间;步骤S22,所述混响参数采集设备对所述采集方向上接收到的音频信号进行持续采集,获取所述音频信号的第二持续时间以及频率变化情况;直至每个所述混响参数采集设备均无法采集到音频信号的情况时,再重复执行步骤S21至步骤S22,直至所述第一声源对所述第一测试音频集合中的全部所述第一测试音频完成播放。4.根据权利要求3所述的语音识别测试方法,其特征在于,所述混响参数包括每个所述第一测试音频的频率所对应的混响持续时间和频率衰变曲线;所述混响持续时间包括对应频率下所述第二持续时间和所述第一持续时间的差值;所述频率衰变曲线包括对应频率下所述混响持续时间内的所述频率变化情况。
5.根据权利要求4所述的语音识别测试方法,...

【专利技术属性】
技术研发人员:邹凯文
申请(专利权)人:深聪半导体珠海有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1