一种基于稀疏表示的帕金森病数据集分类方法技术

技术编号:23498465 阅读:28 留言:0更新日期:2020-03-13 13:20
本发明专利技术提供了一种基于稀疏表示的帕金森病数据集分类方法。其特征在于将测试集通过训练集进行稀疏表示,并通过比较训练集中健康人组和患者组表示后所得到的残差大小,确定测试集的所属类别。本方法能较好的平衡计算复杂度和准确率,具有良好的工程应用前景。

A sparse representation based data set classification method for Parkinson's disease

【技术实现步骤摘要】
一种基于稀疏表示的帕金森病数据集分类方法
本专利技术涉及帕金森病数据集分类方法,特别是一种基于稀疏表示的帕金森病数据集分类方法。
技术介绍
帕金森病是一种退行性神经疾病,早期难以察觉而常被忽视,检测语言障碍将具有便利性,低成本,无创等优势。对帕金森病公共数据集的分类研究将有助于帕金森早期诊断的临床实践,现有基于语音特征的帕金森病数据集分类方法算法复杂度较高,并不利于工程实现,本专利技术实现了一种基于稀疏表示的帕金森病数据集分类方法。
技术实现思路
针对现有技术,本专利技术提供了一种基于稀疏表示的帕金森病数据集分类方法。该方法包括以下步骤:(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵(2)语音特征集变换。变换后语音特征集为其中(3)零均值(z-score)标准化S′生成新集合S″;(4)将标准数据集S″按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};(5)求解稀疏表示满足xma=xt,其中是稀疏列向量;(6)计算残差i=1,2,其中保留健康人所在组参数,将患者所在组参数置0,保留患者所在组参数,将健康人所在组参数置0;(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。>附图说明图1是根据本专利技术的一个实施例构成的系统方框图;具体实施方式本专利技术提出的帕金森病数据集分类方法结合附图及实施例进一步说明如下:本专利技术的方法流程如图1所示,包括以下步骤:(1)样本数据集由M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征构成;(2)样本数据集进行转换构成特征矩阵并零均值(z-score)标准化;(3)将标准化后特征矩阵按留一法划分为训练集和测试集;(4)求解测试集的稀疏表示;(5)通过比较残差大小判决测试集类别并遍历整个数据集得到平均准确率;本专利技术的上述技术方案与现有技术方案相比较,具有以下优点:A、相比已有方法计算复杂度较低;B、平均分类准确率较高;C、能有效兼容计算复杂度和分类准确率,具有良好工程前景。本专利技术上述方法各步骤的具体实施例详细说明如下:上述步骤(1)中数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体特征参考[1]:B.E.Sakar,M.E.Isenkul,C.O.Sakar,A.Sertbas,F.Gurgen,S.Delil,H.Apaydin,O.Kursun.CollectionandanalysisofaParkinsonspeechdatasetwithmultipletypesofsoundrecordings.IEEEJournalofBiomedical&HealthInformatics.17,828-834(2013).来设定。表1:语音样本信息样本序列样本描述第1个持续元音aaa第2个持续元音ooo第3个持续元音uuu第4个~第13个数字1~10第14个~第17个预设的短句第18个~第26个预设的单词上述步骤(4)中求解稀疏表示的方法为正交匹配追踪算法(OMP);上述步骤(5)中平均准确率的计算方法为:当预测的第m个测试集类别与实际类别相同时,测试集准确率否则则平均准确率本文档来自技高网...

【技术保护点】
1.一种基于稀疏表示的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:/n(1)对M个受试者(M

【技术特征摘要】
1.一种基于稀疏表示的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵
(2)语音特征集变换。变换后语音特征集为
其中
(3)零均值(z-score)标准化S′生成新集合S″;
(4)将标准数据集S″按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,...

【专利技术属性】
技术研发人员:张小恒
申请(专利权)人:重庆工商职业学院
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1