一种固定声源识别方法及装置制造方法及图纸

技术编号:30885117 阅读:17 留言:0更新日期:2021-11-22 20:28
本申请实施例公开了一种固定声源识别方法及装置,该方法包括:电子设备获取第一时间段内的第一音频流,第一音频流至少包括第一声音信号;在第一音频流中分离出第一声音信号;电子设备确定第一声音信号的第一属性信息;电子设备判断第一属性信息是否与固定声源库中的固定声源的属性信息相匹配;在第一属性信息与固定声源库中的固定声源的属性信息相匹配时,确定第一声音信号为固定声源发出的声音信号。电子设备将第一声音信号的第一属性信息与固定声源库进行匹配,如果第一属性信息与固定声源库中的固定声源的属性信息相匹配,说明第一声音信号为固定声源发出的声音信号,所以电子设备能够精准的识别出环境中存在的固定声源。源。源。

【技术实现步骤摘要】
一种固定声源识别方法及装置
[0001]本申请要求于2020年5月14日提交中国专利局、申请号为202010404799.6、专利技术名称为“一种固定声源识别方法及装置”的中国专利申请的优先权。


[0002]本申请涉及人工智能领域,更具体的说,涉及固定声源识别方法及装置。

技术介绍

[0003]随着技术的进步,智能语音识别功能被广泛的应用于电子设备中。例如,智能手机、智能音箱、智能电视和智能机器人等电子设备中均设置有智能语音识别功能。目前,在使用这一类电子设备的过程中,用户需要在安静的环境下发出语音指令,以使电子设备能够根据用户发出的语音指令来进行相应的操作。
[0004]如果用户所在的环境中存在噪音源,那么电子设备在接收到用户输入的语音指令的同时,还会接收到噪音源发出的噪音,使得用户输入的语音指令被噪音源发出的噪音所干扰,以使电子设备难以正确的识别出用户输入的语音指令对应的真实意图,从而导致电子设备识别语音的准确率降低。
[0005]因此,如何识别出电子设备周围环境下的噪音源,以避免电子设备受到环境噪音的干扰,成为目前亟须解决的技术问题。

技术实现思路

[0006]本申请实施例提供一种固定声源识别方法及装置,以识别出电子设备周围环境中的固定声源。
[0007]第一方面,本申请实施例提供了一种固定声源识别方法,方法应用于电子设备中,方法包括:电子设备获取第一时间段内的第一音频流,第一音频流至少包括第一声音信号;所述电子设备在所述第一音频流中分离出所述第一声音信号;电子设备确定第一声音信号的第一属性信息;电子设备判断第一属性信息是否与固定声源库中的固定声源的属性信息相匹配,固定声源库中包括一个或多个固定声源对应的属性信息,固定声源为位于同一个位置且发出一种已知声音类型的声源;在第一属性信息与固定声源库中的固定声源的属性信息相匹配时,确定第一声音信号为固定声源发出的声音信号。
[0008]在第一方面中,电子设备能够将第一音频流中的第一声音信号的第一属性信息与预先生成的固定声源库进行匹配,如果第一属性信息与固定声源库中的固定声源的属性信息相匹配,说明第一声音信号为固定声源发出的声音信号,所以电子设备能够精准的识别出环境中存在的固定声源。
[0009]在第一方面的一种可能的实现方式中,电子设备包括麦克风阵列,电子设备获取第一时间段内的第一音频流,包括:电子设备利用麦克风阵列在第一时间段内采集电子设备所处环境中的声音生成第一音频流。
[0010]在第一方面的一种可能的实现方式中,第一属性信息包括第一声音信号的发声位
置、声音类型和发声时间。
[0011]在第一方面的一种可能的实现方式中,电子设备确定第一声音信号的第一属性信息,包括:电子设备利用麦克风阵列确定第一声音信号的发声位置;电子设备根据第一声音信号的声音特征确定第一声音信号的声音类型;电子设备确定第一声音信号的发声时间。
[0012]在第一方面的一种可能的实现方式中,第一属性信息包括第一声音信号的发声位置、声音内容和发声时间。
[0013]在第一方面的一种可能的实现方式中,电子设备确定第一声音信号的第一属性信息,包括:电子设备利用麦克风阵列确定第一声音信号的发声位置;电子设备根据第一声音信号的声音特征确定第一声音信号的声音内容;电子设备确定第一声音信号的发声时间。
[0014]在第一方面的一种可能的实现方式中,第一属性信息包括第一声音信号的发声位置、声音类型、声音内容和发声时间。
[0015]在第一方面的一种可能的实现方式中,电子设备确定第一声音信号的第一属性信息,包括:电子设备利用麦克风阵列确定第一声音信号的发声位置;电子设备根据第一声音信号的声音特征确定第一声音信号的声音类型;电子设备根据第一声音信号的声音特征确定第一声音信号的声音内容;电子设备确定第一声音信号的发声时间。
[0016]在第一方面的一种可能的实现方式中,电子设备根据第一声音信号的声音特征确定第一声音信号的声音类型,包括:电子设备确定声音事件库中是否存在与第一声音信号的声音特征对应的声音类型,声音事件库包括一种或多种声音类型;在声音事件库中存在与第一声音信号的声音特征对应的声音类型时,将第一声音信号的声音特征对应的声音类型确定为第一声音信号的声音类型;在声音事件库中不存在与第一声音信号的声音特征对应的声音类型时,电子设备向外部服务器发送第一网络请求,电子设备接收外部服务器发送的第一响应请求,第一网络请求包括第一声音信号的声音特征,第一响应请求包括第一声音信号的声音特征对应的声音类型;或者,在声音事件库中不存在与第一声音信号的声音特征对应的声音类型时,电子设备确定第一声音信号的声音特征在第一位置出现的次数是否大于第一阈值,第一位置为第一声音信号的发声位置,如果第一声音信号的声音特征在第一位置出现的次数大于第一阈值,确定第一声音信号的声音类型为已知声音类型。
[0017]在第一方面的一种可能的实现方式中,电子设备能够在声音事件库或外部服务器中获取与第一声音信号的声音特征对应的声音类型。
[0018]在第一方面的一种可能的实现方式中,方法还包括:电子设备获取第二时间段内的第二音频流,第二音频流至少包括第二声音信号;电子设备确定第二声音信号的第二属性信息;电子设备判断第二属性信息是否存在于固定声源库中,固定声源库中包括一个或多个固定声源对应的属性信息,固定声源为位于同一个位置且发出一种已知声音类型的声源;在第二属性信息不存在于固定声源库中时,将第二属性信息存储至固定声源库中。
[0019]其中,电子设备能够建立固定声源库,并且还可以不断的更新固定声源库中的内容。
[0020]第二方面,本申请实施例提供了电子设备,包括存储器和与存储器连接的处理器,存储器用于存储指令;处理器用于执行指令,以使计算机设备执行以下操作:获取第一时间段内的第一音频流,第一音频流至少包括第一声音信号;在第一音频流中分离出第一声音信号;确定第一声音信号的第一属性信息;判断第一属性信息是否与固定声源库中的固定
声源的属性信息相匹配,固定声源库中包括一个或多个固定声源对应的属性信息,固定声源为位于同一个位置且发出一种已知声音类型的声源;在第一属性信息与固定声源库中的固定声源的属性信息相匹配时,确定第一声音信号为固定声源发出的声音信号。
[0021]在第二方面的一种可能的实现方式中,电子设备包括麦克风阵列;处理器,具体用于利用麦克风阵列在第一时间段内采集电子设备所处环境中的声音生成第一音频流。
[0022]在第二方面的一种可能的实现方式中,第一属性信息包括第一声音信号的发声位置、声音类型和发声时间。
[0023]在第二方面的一种可能的实现方式中,处理器,具体用于利用麦克风阵列确定第一声音信号的发声位置;根据第一声音信号的声音特征确定第一声音信号的声音类型;确定第一声音信号的发声时间。
[0024]在第二方面的一种可能的实现方式中,第一属性信息包括第一声音信号的发声位置、声音内容和发声本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种固定声源识别方法,其特征在于,所述方法应用于电子设备中,所述方法包括:所述电子设备获取第一时间段内的第一音频流,所述第一音频流至少包括第一声音信号;所述电子设备在所述第一音频流中分离出所述第一声音信号;所述电子设备确定所述第一声音信号的第一属性信息;所述电子设备判断所述第一属性信息是否与固定声源库中的固定声源的属性信息相匹配,所述固定声源库中包括一个或多个固定声源对应的属性信息,所述固定声源为位于同一个位置且发出一种已知声音类型的声源;在所述第一属性信息与所述固定声源库中的固定声源的属性信息相匹配时,确定所述第一声音信号为所述固定声源发出的声音信号。2.根据权利要求1所述的固定声源识别方法,其特征在于,所述电子设备包括麦克风阵列,所述电子设备获取第一时间段内的第一音频流,包括:所述电子设备利用所述麦克风阵列在所述第一时间段内采集所述电子设备所处环境中的声音生成所述第一音频流。3.根据权利要求2所述的固定声源识别方法,其特征在于,所述第一属性信息包括所述第一声音信号的发声位置、声音类型和发声时间。4.根据权利要求3所述的固定声源识别方法,其特征在于,所述电子设备确定所述第一声音信号的第一属性信息,包括:所述电子设备利用所述麦克风阵列确定所述第一声音信号的发声位置;所述电子设备根据所述第一声音信号的声音特征确定所述第一声音信号的声音类型;所述电子设备确定所述第一声音信号的发声时间。5.根据权利要求2所述的固定声源识别方法,其特征在于,所述第一属性信息包括所述第一声音信号的发声位置、声音内容和发声时间。6.根据权利要求5所述的固定声源识别方法,其特征在于,所述电子设备确定所述第一声音信号的第一属性信息,包括:所述电子设备利用所述麦克风阵列确定所述第一声音信号的发声位置;所述电子设备根据所述第一声音信号的声音特征确定所述第一声音信号的声音内容;所述电子设备确定所述第一声音信号的发声时间。7.根据权利要求2所述的固定声源识别方法,其特征在于,所述第一属性信息包括所述第一声音信号的发声位置、声音类型、声音内容和发声时间。8.根据权利要求7所述的固定声源识别方法,其特征在于,所述电子设备确定所述第一声音信号的第一属性信息,包括:所述电子设备利用所述麦克风阵列确定所述第一声音信号的发声位置;所述电子设备根据所述第一声音信号的声音特征确定所述第一声音信号的声音类型;所述电子设备根据所述第一声音信号的声音特征确定所述第一声音信号的声音内容;所述电子设备确定所述第一声音信号的发声时间。9.根据权利要求4或8所述的固定声源识别方法,其特征在于,所述电子设备根据所述第一声音信号的声音特征确定所述第一声音信号的声音类型,包括:所述电子设备确定声音事件库中是否存在与所述第一声音信号的声音特征对应的声
音类型,所述声音事件库包括一种或多种声音类型;在所述声音事件库中存在与所述第一声音信号的声音特征对应的声音类型时,将所述第一声音信号的声音特征对应的声音类型确定为所述第一声音信号的声音类型;在所述声音事件库中不存在与所述第一声音信号的声音特征对应的声音类型时,所述电子设备向外部服务器发送第一网络请求,所述电子设备接收所述外部服务器发送的第一响应请求,所述第一网络请求包括所述第一声音信号的声音特征,所述第一响应请求包括所述第一声音信号的声音特征对应的声音类型;或者,在所述声音事件库中不存在与所述第一声音信号的声音特征对应的声音类型时,所述电子设备确定所述第一声音信号的声音特征在第一位置出现的次数是否大于第一阈值,所述第一位置为所述第一声音信号的发声位置,如果所述第一声音信号的声音特征在所述第一位置出现的次数大于第一阈值,确定所述第一声音信号的声音类型为已知声音类型。10.根据权利要求1至8任意一项所述的固定声源识别方法,其特征在于,所述方法还包括:所述电子设备获取第二时间段内的第二音频流,所述第二音频流至少包括第二声音信号;所述电子设备确定所述第二声音信号的第二属性信息;所述电子设备判断所述第二属性信息是否存在于固定声源库中,所述固定声源库中包括一个或多个固定声源对应的属性信息,所述固定声源为位于同一个位置且发出一种已知声音类型的声源;在所述第二属性信息不存在于所述固定声源库中时,将所述第二属性信息存储至所述固定声源库中。11.一种电子设备,其特征在于,包括存储器和与所述存储...

【专利技术属性】
技术研发人员:李晓建胡伟湘王保辉李伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1