声源分离方法及其装置制造方法及图纸

技术编号:39840838 阅读:5 留言:0更新日期:2023-12-29 16:28
本公开提出了一种声源分离方法及其装置,涉及智能车辆技术领域,该方法包括:根据上一轮声源分离对应的分离矩阵,对上一个观察窗内的多个声音采集信号进行声源分离,得到上一轮声源分离对应的多个分离估计信号,获取分离估计信号对应的语音存在概率;根据语音存在概率更新上一轮声源分离对应的分离矩阵;根据更新后的分离矩阵对当前观察窗内的多个声音采集信号进行声源分离,得到本轮声源分离对应的多个分离估计信号

【技术实现步骤摘要】
声源分离方法及其装置、车辆及电子设备


[0001]本公开涉及智能车辆
,尤其涉及一种声源分离方法及其装置

车辆及电子设备


技术介绍

[0002]目前,随着智能车辆技术的不断发展,打造功能多样的智能座舱,提供更好的用户体验,已经成为车辆领域不可阻挡的趋势

语音作为新一代人机交互的方式,越来越广泛地被应用于嵌入式设备中,例如车机和家用电器

一般在一个声音采集信号中会包含多个音区的声源,需要从声音采集信号中分离出所需要的目标声源,基于目标声源进行交互,因此声源分离的效果能够很大程度影响人机交互的效果,影响用户体验

[0003]因此,如何增强声源分离的效果已经成为亟待解决的问题


技术实现思路

[0004]本公开旨在至少在一定程度上解决相关技术中的技术问题之一

[0005]为此,本公开的一个目的在于提出一种声源分离方法

[0006]本公开的第二个目的在于提出一种声源分离装置

[0007]本公开的第三个目的在于提出一种车辆

[0008]本公开的第四个目的在于提出一种电子设备

[0009]本公开的第五个目的在于提出一种计算机可读存储介质

[0010]为达上述目的,本公开第一方面提出了一种声源分离方法,包括:根据上一轮声源分离对应的分离矩阵,对上一个观察窗内的多个声音采集信号进行声源分离,得到上一轮声源分离对应的多个分离估计信号;针对每个所述分离估计信号,获取所述分离估计信号对应的语音存在概率;根据多个所述语音存在概率更新所述上一轮声源分离对应的分离矩阵;根据更新后的分离矩阵对当前观察窗内的多个声音采集信号进行声源分离,得到本轮声源分离对应的多个分离估计信号

[0011]根据本公开的一个实施方式,所述声音采集信号为声音采集设备对多个音区的声源进行采集得到的,所述声音采集信号的总个数与所述声源的总个数相同

[0012]根据本公开的一个实施方式,所述根据多个所述语音存在概率更新所述上一轮声源分离对应的分离矩阵,包括:获取上一轮声源分离对应的多个第一辅助函数,所述第一辅助函数为所述上一个观察窗内的多个声音采集信号对应的协方差矩阵;根据所述语音存在概率更新对应的所述第一辅助函数,得到本轮声源分离对应的多个第二辅助函数,所述第二辅助函数为所述当前观察窗内的多个声音采集信号对应的协方差矩阵;根据多个所述第二辅助函数,生成所述更新后的分离矩阵

[0013]根据本公开的一个实施方式,所述根据所述语音存在概率更新对应的所述第一辅助函数,得到本轮声源分离对应的多个第二辅助函数,包括:基于公式一,根据预设的观察窗长度

遗忘因子和所述语音存在概率对应的所述第一辅助函数,得到对应的所述第二辅
助函数;所述公式一为:
[0014][0015]其中,
L
为所述观察窗长度,
α
为所述遗忘因子,
y
k
(
ω

t)
为上一轮声源分离对应的分离估计信号,
V
k
(
ω

τ
)
为所述第二辅助函数,
V
k
(
ω

τ

L)
为所述第一辅助函数,
k
=1,2,
……

M

X(
ω

τ
)
为所述声音采集信号
x
i
(
ω

τ
)
组成的
M*1
的矩阵,
i
=1,2,
……

M

M
为所述声音采集信号的总个数以及所述声源的总个数,
p
k
为所述上一轮声源分离对应的分离估计信号
y
k
(
ω

τ
)
的语音存在概率,
ω
表示频率,
τ
表示时间

[0016]根据本公开的一个实施方式,所述根据多个所述第二辅助函数,生成所述更新后的分离矩阵,包括:基于公式二和公式三,根据多个所述第二辅助函数更新对应的分离子矩阵,所述分离子矩阵为
1*M
的矩阵;
[0017]所述公式二为:
[0018]w
k

(
ω

τ
)

(W(
ω

τ

L)V
k
(
ω

τ
))
‑1e
k

[0019]所述公式三为:
[0020][0021]其中,
W(
ω

τ

L)
为所述上一轮声源分离对应的分离矩阵,
w
k

(
ω

τ
)
为中间矩阵,
w
k
(
ω

τ
)
为所述分离子矩阵,
e
k

M*1
的矩阵,所述
e
k
的第
k
个元素为1,其余元素为0,
w
k

H
(
ω

τ
)

w
k

(
ω

τ
)
的共轭转置;根据多个更新后的分离子矩阵,得到所述更新后的分离矩阵,所述更新后的分离矩阵为
M*M
的矩阵

[0022]根据本公开的一个实施方式,所述获取所述分离估计信号对应的语音存在概率,包括:对所述分离估计信号进行语音端点检测,获取所述分离估计信号中存在语音的有效语音片段;根据所述有效语音片段,得到所述分离估计信号对应的所述语音存在概率

[0023]根据本公开的一个实施方式,从多轮声源分离后得到的多个分离估计信号中选取目标声源对应的分离估计信号;根据所述目标声源对应的分离估计信号,生成所述目标声源对应的目标估计信号

[0024]为达上述目的,本公开第二方面提出了一种声源分离装置,包括:第一获取模块,用于根据上一轮声源分离对应的分离矩阵,对上一个观察窗内的多个声音采集信号进行声源分离,得到上一轮声源分离对应的多个分离估计信号;第二获取模块,用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种声源分离方法,其特征在于,包括:根据上一轮声源分离对应的分离矩阵,对上一个观察窗内的多个声音采集信号进行声源分离,得到上一轮声源分离对应的多个分离估计信号;针对每个所述分离估计信号,获取所述分离估计信号对应的语音存在概率;根据多个所述语音存在概率更新所述上一轮声源分离对应的分离矩阵;根据更新后的分离矩阵对当前观察窗内的多个声音采集信号进行声源分离,得到本轮声源分离对应的多个分离估计信号
。2.
根据权利要求1所述的声源分离方法,其特征在于,所述声音采集信号为声音采集设备对多个音区的声源进行采集得到的,所述声音采集信号的总个数与所述声源的总个数相同
。3.
根据权利要求1所述的声源分离方法,其特征在于,所述根据多个所述语音存在概率更新所述上一轮声源分离对应的分离矩阵,包括:获取上一轮声源分离对应的多个第一辅助函数,所述第一辅助函数为所述上一个观察窗内的多个声音采集信号对应的协方差矩阵;根据所述语音存在概率更新对应的所述第一辅助函数,得到本轮声源分离对应的多个第二辅助函数,所述第二辅助函数为所述当前观察窗内的多个声音采集信号对应的协方差矩阵;根据多个所述第二辅助函数,生成所述更新后的分离矩阵
。4.
根据权利要求3所述的声源分离方法,其特征在于,所述根据所述语音存在概率更新对应的所述第一辅助函数,得到本轮声源分离对应的多个第二辅助函数,包括:基于公式一,根据预设的观察窗长度

遗忘因子和所述语音存在概率对应的所述第一辅助函数,得到对应的所述第二辅助函数;所述公式一为:其中,
L
为所述观察窗长度,
α
为所述遗忘因子,
y
k
(
ω

t)
为上一轮声源分离对应的分离估计信号,
V
k
(
ω

τ
)
为所述第二辅助函数,
V
k
(
ω

τ

L)
为所述第一辅助函数,
k
=1,2,
......

M

X(
ω

τ
)
为所述声音采集信号
x
i
(
ω

τ
)
组成的
M*1
的矩阵,
i
=1,2,
......

M

M
为所述声音采集信号的总个数以及所述声源的总个数,
p
k
为所述上一轮声源分离对应的分离估计信号
y
k
(
ω

τ
)
的语音存在概率,
ω
表示频率,
τ
表示时间
。5.
根据权利要求4所述的声源分离方法,其特征在于,所述根据多个所述第二辅助函数,生成所述更新后的分离矩阵,包括:基于公式二和公式三,根据多个所述第二辅助函数更新对应的分离子矩阵,所述分离子矩阵...

【专利技术属性】
技术研发人员:杨晓霞李洋陈伟
申请(专利权)人:北京罗克维尔斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1