System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于中医声诊症候特征隐私保护的语音数据处理方法技术_技高网
当前位置: 首页 > 专利查询>嘉兴大学专利>正文

一种基于中医声诊症候特征隐私保护的语音数据处理方法技术

技术编号:44039860 阅读:0 留言:0更新日期:2025-01-15 01:17
本发明专利技术涉及一种基于中医声诊症候特征隐私保护的语音数据处理方法,包括:从声学设备获取作为训练语料的用户语音数据;用户语音数据中包括能够获得各种症候特征的待转语音数据和不能获得症候特征的目标语音数据;提取出待转语音数据中的F0<subgt;s</subgt;、AP<subgt;s</subgt;和MCEP<subgt;s</subgt;特征,以及目标语音数据中的F0<subgt;p</subgt;和MCEP<subgt;p</subgt;特征;将待转语音数据的F0<subgt;s</subgt;、MCEP<subgt;s</subgt;特征和目标语音数据的F0<subgt;p</subgt;、MCEP<subgt;p</subgt;特征输入至中医声诊症候特征隐私保护语音模型进行网络训练;使训练好语音模型将输入包含症候特征的待转语音数据的F0<subgt;s</subgt;和MCEP<subgt;s</subgt;特征转换为健康语音的F0<supgt;*</supgt;和MCEP<supgt;*</supgt;特征;将健康语音的F0<supgt;*</supgt;和MCEP<supgt;*</supgt;特征和待转语音数据中的F0<subgt;s</subgt;进行合成,得到进行中医声诊症候特征隐私保护的用户语音。本发明专利技术实现对用户语音数据的中医声诊隐私保护。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其是一种基于中医声诊症候特征隐私保护的语音数据处理方法


技术介绍

1、当前,随着中医声诊技术的发展,通过提取语音信号中的特征信息,将预诊案例的特征信息与预储存案例库的特征信息进行对比匹配,就可以输出该预诊案例的诊断报告;这种中医声诊的技术一方面在提供医疗辅助的同时,也造成了当用户在社交网络上分享的语音被恶意收集后,可以通过中医声诊的方法来获取用户健康属性,从而导致用户的健康属性暴露于风险之中。

2、而,目前研究语音转换技术大多集中在处理语音的情感属性和声纹属性,并无针对中医声诊对于健康属性暴露于风险问题的研究;因此对于如何在保证说话人的语音数据完整性的前提下,转换语音数据中的健康属性以保护患者的敏感信息,这是语音隐私保护领域亟待解决的问题。


技术实现思路

1、鉴于上述的分析,本专利技术旨在提供一种基于中医声诊症候特征隐私保护的语音数据处理方法,实现在不影响语音数据正常使用的前提下,保护用户的语音数据不能通过中医声诊系统推断出健康属性。

2、本专利技术的目的主要是通过以下技术方案实现的:

3、本专利技术公开了一种基于中医声诊症候特征隐私保护的语音数据处理方法,包括:

4、步骤s1、从声学设备获取作为训练语料的用户语音数据;所述用户语音数据中包括通过中医声诊的方式能够获得各种症候特征的待转语音数据和不能获得症候特征的健康条件下的目标语音数据;

5、步骤s2、提取出待转语音数据中的fos、aps和40维的mceps特征,以及目标语音数据中的fop和40维的mcepp特征;

6、步骤s3、将待转语音数据的fos、mceps特征和目标语音数据的fop、mcepp特征输入至中医声诊症候特征隐私保护语音模型进行网络训练;使训练好语音模型将输入包含症候特征的待转语音数据的fos和mceps特征转换为健康语音的fo*和mcep*特征;

7、步骤s4、将健康语音的fo*和mcep*特征和待转语音数据中的fos进行合成,得到进行中医声诊症候特征隐私保护的用户语音。

8、进一步地,作为训练语料的用户语音数据在通过中医声诊后对语料数据进行分类时,还对每个待转语音数据和目标语音数据进行数据类别标注;其中,待转语音数据标注为“s”,目标语音数据标注为“p”。

9、进一步地,通过word声码器进行待转语音数据中的fos、aps和40维的mceps特征,以及目标语音数据中的fop和40维的mcepp特征的提取。

10、进一步地,中医声诊症候特征隐私保护语音模型包括生成器网络和鉴别器网络;其中,

11、生成器网络的输入数据为由待转语音数据的fos、mceps特征和目标语音数据的fop、mcepp特征组成的特征向量;生成器对于待转语音数据的fos、mceps特征进行特征降维并加入注意力机制后得到待转语音的待转语音的健康独立表征z;对于目标语音数据的fop、mcepp特征进行特征降维并加入注意力机制后得到目标语音的健康嵌入表征c;并将待转语音的健康独立表征z和目标语音的健康嵌入表征c进行深度特征融合后得到健康语音的fo*和mcep*特征;

12、鉴别器网络的输入为健康语音的fo*和mcep*特征;鉴别器网络对输入的健康语音的fo*和mcep*特征进行中医声诊症候特征鉴别,当鉴别为“s”时,对生成器网络的参数进行迭代更新,当鉴别为“p”时,则停止更新生成器网络,将生成器网络输出的健康语音的fo*和mcep*特征输出。

13、进一步地,所述生成器网络包括顺序连接的编码器网络、注意力机制模块和解码器网络;其中,

14、编码器网络和注意力机制模块顺序连接,将输入的待转语音数据的fos、mceps特征进行特征降维得到待转语音的待转语音的健康独立表征z,将输入的目标语音数据的fop、mcepp特征进行特征降维得到目标语音的健康嵌入表征c;

15、解码器网络,将输入的待转语音的健康独立表征z和目标语音的健康嵌入表征c进行深度特征融合concat操作,输出最终融合为新的语言特征矢量的健康语音的fo*和mcep*特征。

16、进一步地,编码器网络为由多尺度卷积神经网络组成,进一步的对语音特征进行降维;加入了attention机制,使得语音特征在编码的过程中更加专注于语音数据的类别种类。

17、进一步地,编码器网络包括9个conv层和对应的bathnorm层以及2个linear层;conv层包括三类,其中,第一conv层和第二conv层为conv5-512;第三到第八conv层为conv3-64;第九conv层为conv1-512;对应的bathnorm层也为三类,其中第一bathnorm层和第二bathnorm层为bathnorm1d-512;第三到第八bathnorm层为bathnorm1d-64;第九bathnorm层为bathnorm1d-512;linear层包括第一linear层linear-256和第二linear层linear-512。

18、进一步地,中医声诊症候特征隐私保护语音模型的总框架损失函数为:

19、ltcm=λreclrec+λcl(c)

20、其中,λrec、λc为超参数,lrec为生成器网络的重构损失,l(c)为编码器网络的损失函数。

21、进一步地,编码器网络的损失函数l(c)为:

22、

23、其中,x为输入的特征向量,z为编码器网络输出待转语音的健康独立表征;yi,j为表示真实标签是否属于第i个样本的前j个类别,pi,j为表示模型预测第i个样本属于第j个类别的概率,i=1,...,n,j=1,...,k,n表示样本数量,k为类别数量;

24、生成器网络的重构损失lrec为:

25、

26、其中,eθ(x)与ee(x)分别指编码器网络中对特征向量x中类别为“s”和“p”的特征进行编码的网络输出;d(·,·)为距离函数;为期望值函数,||·||1为l1范数。

27、进一步地,鉴别器网络包括顺序连接的第一卷积层、第二卷积层、第三卷积层、第一bathnorm层、linear层和第二bathnorm层;

28、其中,第一、第二和第三卷积层分别为conv1-1536、conv1-128、conv1-1536;第一bathnorm层为bathnorm1d-3072;linear层为linear-192;第二bathnorm层为bathnorm1d-3072。

29、本专利技术有益效果如下:

30、本专利技术的基于中医声诊症候特征隐私保护的语音数据处理方法,在成功保护了患者的语音数据发布后的隐私信息的同时也保留了语音数据的其他属性。最终的效果为用户分享自己的语音数据,在听感与内容上保持着原有的属性,但无法根据中医声诊的理论知识判断出用户的相应证候要素,从而保护到了用户的隐私。

本文档来自技高网...

【技术保护点】

1.一种基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,包括:

2.根据权利要求1所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

3.根据权利要求2所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

4.根据权利要求3所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

5.根据权利要求3所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

6.根据权利要求5所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

7.根据权利要求6所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

8.根据权利要求6所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

9.根据权利要求8所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

10.根据权利要求4所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

【技术特征摘要】

1.一种基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,包括:

2.根据权利要求1所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

3.根据权利要求2所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

4.根据权利要求3所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

5.根据权利要求3所述的基于中医声诊症候特征隐私保护的语音数据处理方法,其特征在于,

...

【专利技术属性】
技术研发人员:张先超罗力刘忆宁
申请(专利权)人:嘉兴大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1