机器人的语音去噪方法、机器人装置以及存储装置制造方法及图纸

技术编号:23485620 阅读:24 留言:0更新日期:2020-03-10 12:53
本申请公开了一种机器人语言去噪的方法、机器人装置以及存储装置,其中方法包括:机器人分别在多个环境状态下播放预设语言片段,并同时获取每个环境状态下的第一声音数据;根据预设语言片段对每个所述第一声音数据进行处理以获得多个环境状态下的环境噪音库;机器人获取当前环境状态下的第二声音数据;利用环境噪音库对第二声音数据进行去噪处理。通过上述方式,本申请提供一种语言去噪的方法、装置以及存储装置,可以通过在不同环境状态的播放、获取、处理来完善得到环境噪音库,并利用环境噪音库来对后面的环境噪音进行去噪处理,由于采用了环境噪音库是采用了已知预设语言片段来获取,因而其环境噪音库具有很强的准确性,从而大大提升了去噪率。

Speech denoising method, robot device and memory device of robot

【技术实现步骤摘要】
机器人的语音去噪方法、机器人装置以及存储装置
本申请涉及去噪领域,特别是涉及一种机器人的语音去噪方法、机器人装置以及存储装置。
技术介绍
目前,智能设备与人之间的语言交互越来越频繁,如家用机器人,在与人类进行对话或者接收人类语言信息的时候,由于家用机器人的应用场所相对稳定,且每户家庭所处的环境又有所不同,所以如何提高对特定环境下语音中噪声的处理以提高识别效率,成为目前亟待解决的问题。
技术实现思路
本申请提供一种机器人的语音去噪方法、机器人装置以及存储装置。能够解决现有技术中去噪率较为低的问题。本申请采用的一个技术方案是:提供一种收音结束的判断方法,其方法包括:所述机器人分别在多个环境状态下播放预设语言片段,并同时获取每个所述环境状态下的第一声音数据;根据所述预设语言片段对每个所述第一声音数据进行处理以获得所述多个环境状态下的环境噪音库;所述机器人获取当前所述环境状态下的第二声音数据;利用所述环境噪音库对所述第二声音数据进行去噪处理。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种机器人,所述机器人包括存储器及连接所述存储器的处理器;其中,所述处理器分别在多个环境状态下播放预设语言片段,并同时获取每个所述环境状态下的第一声音数据;所述处理器根据所述预设语言片段对每个所述第一声音数据进行处理以获得所述多个环境状态下的环境噪音库;所述处理器获取当前所述环境状态下的第二声音数据;并利用所述环境噪音库对所述第二声音数据进行去噪处理。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种存储装置,包括能实现上述方法的程序文件。本申请的有益效果是:区别于现有技术,本申请可以通过在不同环境状态的播放、获取、处理来完善得到环境噪音库,并利用环境噪音库来对后面的环境噪音进行去噪处理,由于采用了环境噪音库是采用了已知预设语言片段来获取,因而其环境噪音库具有很强的准确性,从而大大提升了去噪率。附图说明图1是本申请机器人的语言去噪方法的第一实施方式的结构示意图;图2是本申请机器人的语言去噪方法的第二实施方式的结构示意图;图3是本申请机器人的语言去噪方法的第三实施方式的结构示意图;图4是本申请机器人装置一实施方式的结构示意框图;图5是本申请存储装置一实施方式的结构示意图。实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,若本申请实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。请参阅图1,图1是本申请一种机器人的语音去噪方法的第一实施例流程示意图,其具体包括如下步骤:S11,机器人分别在多个环境状态下播放预设语言片段,并同时获取每个环境状态下的第一声音数据。对于某些机器人而言,如家庭机器人,由于其在一个特定的环境下进行工作,并经常需要与人类进行沟通,包括接收人类的语音指令、与人类进行对话等等,所以如何准确的识别出人类的语音显得较为重要,由于工作环境的不确定性,其机器人所能接收的声音信息不仅包括人类的语音信息还有环境的噪音信息。虽然是在一个特定的环境下,但是对于环境下由于空间与时间上的不同,其是具有不同的情况的,如机器人在一个固定的地方,今天的环境噪音可能与明天有所区别,在同一天,不同位置的也对应不同的噪声。机器人在多个环境状态下播放预设语言片段,是包括机器人在不同的空间或者时间的状态下播放一段预设的语言片段,可以是一句话,也可以是一段话。在一个具体环境状态中,机器人通过扬声器播放一句话,并同时通过一个麦克风或多个麦克风对当前环境状态下的声音进行采集,从而获取到当前环境状态下的第一声音数据,这里的声音包括了机器人所播放的预设语言片段,也包括了当前环境状态下的环境噪音,其对应的第一声音数据也就包括了预设语言片段数据与环境噪音数据,由于声音本身是一种波,这里的数据也就是声音对应的波的数据。S12,根据预设语言片段对每个第一声音数据进行处理以获得多个环境状态下的环境噪音库。在获取到第一声音数据后,由于机器人已知了预设语言片段,所以可通过第一声音数据将预设语言片段所对应的预设语言数据进行剔除,从而获得其当前环境状态的环境噪音数据。请参阅图2,图2是本申请一种机器人的语音去噪方法的第二实施例的流程示意图,其具体是图1步骤S12的子步骤,具体包括如下步骤:S121,根据预设语言片段对第一声音数据进行处理,以使得第一声音数据删除与预设语言片段所对应的预设语言数据,以获得环境状态下的环境噪音数据。由于机器人知道本身所播出的预设语言片段与其所对应的预设语言数据也是明确的,第一声音数据包括了预设语言数据与环境噪音数据,且第一声音数据可以认为是一种波的频域,其包括预设语言片段所对应的波的频域与环境噪音所对应波的频域,通过傅里叶变化的频域算法,可以很清楚的得到环境噪音所对应波的频域,也就是环境噪音数据。S122,对环境噪音数据进行提取以得到环境噪音数据的声学特征信息。获取到环境噪音数据后,继续对环境噪音数据进行处理,从而获取到环境噪音的声学特征信息,如音色、频率、振幅以及相位信息等等。S123,对多个环境状态下所对应的多个环境噪音的声学特征信息进行存储以作为环境噪音库。将多个声学特征信息进行保存,并作为环境噪音库,上述实施例中,只是简单的对在一个环境状态下如何获得其环境噪音的声学特征信息进行的描述,在具体的实施例中,其需对多个环境状态进行采集与获取,并且逐渐完善其环境噪音库,具体的,在机器人没有进行对话时,可以通过在不同的地方、不同的时间下一直进行采集与获取,也就是一个一直学习的过程,从而可以获得尽可能多的环境噪音的声学特征信息。S13,机器人获取当前环境状态下的第二声音数据。在一个应用场景中,当机器人与人类进行对话时,获取当前环境状态下的声音以及其对应的第二声音数据,其中第二声音数据包括了人类声音数据与环境噪音数据。S14,利用环境噪音库对第二声音数据进行去噪处理。由于已经完善建立好环境噪音库,则可以利用环境噪音库对第二声音数据进行去噪处理从而获得人类声音数据。请参阅图3,图3是本申请一种机器人的语音去噪方法的第三实施例的流程示意图,其具体是图1步骤S14的子步骤,具体包括如下步骤:S141本文档来自技高网...

【技术保护点】
1.一种机器人的语言去噪方法,其特征在于,所述方法包括:/n所述机器人分别在多个环境状态下播放预设语言片段,并同时获取每个所述环境状态下的第一声音数据;/n根据所述预设语言片段对每个所述第一声音数据进行处理以获得所述多个环境状态下的环境噪音库;/n所述机器人获取当前所述环境状态下的第二声音数据;/n利用所述环境噪音库对所述第二声音数据进行去噪处理。/n

【技术特征摘要】
1.一种机器人的语言去噪方法,其特征在于,所述方法包括:
所述机器人分别在多个环境状态下播放预设语言片段,并同时获取每个所述环境状态下的第一声音数据;
根据所述预设语言片段对每个所述第一声音数据进行处理以获得所述多个环境状态下的环境噪音库;
所述机器人获取当前所述环境状态下的第二声音数据;
利用所述环境噪音库对所述第二声音数据进行去噪处理。


2.根据权利要求1所述的语音去噪方法,其特征在于,所述第一声音数据包括所述预设语言片段所对应的预设语言数据与所述环境状态下的环境噪音数据。


3.根据权利要求2所述的语音去噪方法,其特征在于,所述根据所述预设语言片段对每个所述第一声音数据进行处理以获得所述多个环境状态下的环境噪音库包括:
根据所述预设语言片段对所述第一声音数据进行处理,以使得所述第一声音数据删除与所述预设语言片段所对应的所述预设语言数据,以获得所述环境状态下的环境噪音数据;
对所述环境噪音数据进行提取以得到所述环境噪音数据的声学特征信息;
对所述多个环境状态下所对应的多个所述声学特征信息进行存储以作为所述环境噪音库。


4.根据权利要求3所述的语音去噪方法,其特征在于,所述利用所述环境噪音库对所述第二声音数据进行去噪处理,以获得第二声音数据中的原始语言数据包括:
对所述第二声音数据进行处理且判断所述环境噪音库是否存在与所述第二声音数据中的环境噪音数据相匹配的声学特征信息;
如果存在,则利用所述环境噪音库中的声学特征信息对所述第二声音数据中的所述环境噪音数据进行删除以完成去噪处理。


5.根据权利要求4所述的语音去噪方法,其特征在于,所述声学特征信息包括环境噪音的音色、频率、振幅以及相位信息。


6.一种机...

【专利技术属性】
技术研发人员:熊友军李浩明夏严辉李利阳温品秀
申请(专利权)人:深圳市优必选科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1