当前位置: 首页 > 专利查询>重庆大学专利>正文

一种帕金森病受试者包络化语音样本段分级融合方法技术

技术编号:37146075 阅读:27 留言:0更新日期:2023-04-06 21:57
本发明专利技术涉及帕金森病语音识别技术领域,具体公开了一种帕金森病受试者包络化语音样本段分级融合方法,该方法基于样本段剪枝模块(SP)、样本段原型聚类模块(FC&IDMD)、样本段协同选择模块(SS/FSM),对帕金森病受试者包络化语音样本段进行分级快速融合,获得少量的高质量原型样本。这不仅有利于提取反映受试者整体病理情况的语音特征(诊断标志物),还能显著提高分类精度和泛化性能,能更好地满足临床应用的需求。的需求。的需求。

【技术实现步骤摘要】
一种帕金森病受试者包络化语音样本段分级融合方法


[0001]本专利技术涉及帕金森病语音识别
,尤其涉及一种帕金森病受试者包络化语音样本段分级融合方法。

技术介绍

[0002]语音识别是帕金森病(PD)诊断的一种有效方式,已成为了近年来的研究热点和难点。在对受试者进行语音采集时,需要采集大量的语音片段。然而,大量的语音片段会增加分类模型的复杂度;少数高质量的语音片段将有助于获得更高的诊断精度。此外,临床医生往往对寻找能反映整个受试者病理情况的诊断性语音标记物感兴趣。但由于每个语音样本片段的最佳相关特征各不相同,所以很难为受试者找到统一的诊断性语音标记物。

技术实现思路

[0003]本专利技术提供一种帕金森病受试者包络化语音样本段分级融合方法,解决的技术问题在于:如何将一个受试者的大量语音样本片段重构为少量片段,甚至重构为一个受试者只包含一个语音样本片段,从而有助于提取相关语音特征,进而找到能表征整个受试者病理情况的诊断标记物。
[0004]为解决以上技术问题,本专利技术提供一种帕金森病受试者包络化语音样本段分级融合方法,包括步骤:
[0005]S1、将目标数据集的N个受试者中每个受试者的所有语音样本段进行包络化,得到由N个原始受试者包络S
n
,n=1,2,...,N构成的原始数据集S;
[0006]S2、采用样本段剪枝模块对N个所述原始受试者包络S
n
进行第一级样本段剪枝,保留能够高质量表征受试者病理的样本片段,得到由对应的N个第一级受试者包络构成的数据集
[0007]S3、采用样本段原型聚类模块对N个所述第一级受试者包络进行第二级样本段原型聚类,得到由对应的N个第二级受试者包络V
(n)
构成的数据集
[0008]S4、采用样本段协同选择模块对N个所述第二级受试者包络V
(n)
进行第三级样本段协同选择,得到由对应的N个第三级受试者包络构成的数据集V
ss

[0009]进一步地,在所述步骤S1中,每个受试者有M个d维的语料样本,N个所述原始受试者包络构成的原始数据集S表示为:
[0010][0011]表示实数集,S
n
表示第n个受试者包络,S
n
具体为:
[0012][0013]进一步地,在所述步骤S2中,所述样本段剪枝模块执行以下步骤:
[0014]S21、对N个所述原始受试者包络均进行矩阵转置,并将其按列合并得到数据集S
nT
对应为S
n
的转置;
[0015]S22、从数据集中依次选取每一个特征向量s
j
=[s
1j s
2j ... s
Mj
],j∈1,2,...N
×
d,并在该数据集中通过计算欧氏距离来遍历寻找到该特征向量s
j
在各类中的K个最近邻:首先寻找来自和s
j
相同类别的K个近邻,并将该K个近邻的平均值记作NH(s
j
),然后寻找来自和s
j
不同类别的K个近邻,并将该K个近邻的平均值记作NM(s
j
);
[0016]S23、计算该特征向量s
j
到NH(s
j
)与NM(s
j
)的欧式距离,并通过以下公式迭代更新权重向量的第i∈(1,2,...,M)维:
[0017]w
i
=w
i

diff(s
ij
,NH(s
ij
))/T
D
+diff(s
ij
,NM(s
ij
))/T
D

[0018]函数diff(s
ij
,NH(s
ij
))表示计算s
j
与NH(s
j
)第i维的距离,diff(s
ij
,NM(s
ij
))表示计算s
j
与NM(s
ij
)第i维的距离,w
i
表示S
n
中第i个样本的权重,T
D
表示迭代次数;
[0019]S24、对得到的M维样本权重向量做升序排列,按照所设置的剪枝数cutoff依次减去较低权重值所对应的样本段,将剪枝后的数据集以受试者包络为单位进行转置得到样本变换后的数据集N'=M

cutoff即N个第一级受试者包络。
[0020]进一步地,在所述步骤S23中,diff(s
ij
,NH(s
ij
))表示为:
[0021]diff(s
ij
,NH(s
ij
))=|s
ij

NH(s
ij
)|/(max(s
i
·
)

min(s
i
·
)),
[0022]其中,
·
是绝对值符号,max(s
i
·
)和min(s
i
·
)分别表示中第i维的最大和最小值;
[0023]同理,diff(s
ij
,NM(s
ij
))表示为:
[0024]diff(s
ij
,NM(s
ij
))=|s
ij

NM(s
ij
)|/(max(s
i
·
)

min(s
i
·
))。
[0025]进一步地,在所述步骤S3中,V
(n)
也称作原型样本集,所述样本段原型聚类模块执行以下步骤:
[0026]S31、依次基于N个第一级受试者包络构造目标函数:
[0027][0028]约束条件:
[0029][0030]其中,输入数据集有N'个样本;将通过样本段原型聚类得到的原型样本集记为即第二级受试者包络;为隶属度矩阵;表示欧氏距离下样本到原型样本之间的距离;u
ik
为隶属度值,表示样本对聚类中心的隶属程度;C为聚类数目;λ为拉格朗日乘子;表示一个所有元素都为1的行向量;m>1为模糊系数;κ(
·
)是核函数;表示由原型样本集
V(n)
和隶属度矩阵U组成的聚类损失,表示原型样本集
V(n)
与数据集之间的样本分布差异;
[0031]S32、对目标函数进行求解,依次输出N个原型样本集V
(n)
,n=1,2,...,N,即对应的N个第二级受试者包络。
[0032]进一步地,所述步骤S3本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种帕金森病受试者包络化语音样本段分级融合方法,其特征在于,包括步骤:S1、将目标数据集的N个受试者中每个受试者的所有语音样本段进行包络化,得到由N个原始受试者包络S
n
,n=1,2,...,N构成的原始数据集S;S2、采用样本段剪枝模块对N个所述原始受试者包络S
n
进行第一级样本段剪枝,保留能够高质量表征受试者病理的样本片段,得到由对应的N个第一级受试者包络构成的数据集S3、采用样本段原型聚类模块对N个所述第一级受试者包络进行第二级样本段原型聚类,得到由对应的N个第二级受试者包络V
(n)
构成的数据集S4、采用样本段协同选择模块对N个所述第二级受试者包络V
(n)
进行第三级样本段协同选择,得到由对应的N个第三级受试者包络构成的数据集V
ss
。2.根据权利要求1所述的一种帕金森病受试者包络化语音样本段分级融合方法,其特征在于,在所述步骤S1中,每个受试者有M个d维的语料样本,N个所述原始受试者包络构成的原始数据集S表示为:的原始数据集S表示为:表示实数集,S
n
表示第n个受试者包络,S
n
具体为:3.根据权利要求2所述的一种帕金森病受试者包络化语音样本段分级融合方法,其特征在于,在所述步骤S2中,所述样本段剪枝模块执行以下步骤:S21、对N个所述原始受试者包络均进行矩阵转置,并将其按列合并得到数据集S
nT
对应为S
n
的转置;S22、从数据集中依次选取每一个特征向量s
j
=[s
1j s
2j
...s
Mj
],j∈1,2,...N
×
d,并在该数据集中通过计算欧氏距离来遍历寻找到该特征向量s
j
在各类中的K个最近邻:首先寻找来自和s
j
相同类别的K个近邻,并将该K个近邻的平均值记作NH(s
j
),然后寻找来自和s
j
不同类别的K个近邻,并将该K个近邻的平均值记作NM(s
j
);S23、计算该特征向量s
j
到NH(s
j
)与NM(s
j
)的欧式距离,并通过以下公式迭代更新权重向量的第i∈(1,2,...,M)维:
w
i
=w
i

diff(s
ij
,NH(s
ij
))/T
D
+diff(s
ij
,NM(s
ij
))/T
D
,函数diff(s
ij
,NH(s
ij
))表示计算s
j
与NH(s
j
)第i维的距离,diff(s
ij
,NM(s
ij
))表示计算s
j
与NM(s
ij
)第i维的距离,w
i
表示S
n
中第i个样本的权重,T
D
表示迭代次数;S24、对得到的M维样本权重向量做升序排列,按照所设置的剪枝数cutoff依次减去较低权重值所对应的样本段,将剪枝后的数据集以受试者包络为单位进行转置得到样本变换后的数据集即N个第一级受试者包络。4.根据权利要求3所述的一种帕金森病受试者包络化语音样本段分级融合方法,其特征在于,在所述步骤S23中,diff(s
ij
,NH(s
ij
))表示为:diff(s
ij
,NH(s
ij
))=|s
ij

NH(s
ij
)|/(max(s
i
·
)

min(s
i
·
)),其中,|
·
|是绝对值符号,max(s
i
·
)和min(s
i
·
)分别表示中第i维的最大和最小值;同理,diff(s
ij
,NM(s...

【专利技术属性】
技术研发人员:李勇明王艺雯王品颜芳张小恒黄智勇李帆
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1