System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于联邦学习的咳嗽声识别方法技术_技高网
当前位置: 首页 > 专利查询>郑州大学专利>正文

一种基于联邦学习的咳嗽声识别方法技术

技术编号:42715291 阅读:14 留言:0更新日期:2024-09-13 12:05
本发明专利技术公开了一种基于联邦学习的咳嗽声识别方法,属于咳嗽声识别和联邦学习领域。具体包括:中央服务器联合各医疗机构使用其所属患者的咳嗽声数据开展模型训练,以帧为单位对声音片段实现咳嗽声识别。使用联邦学习方法,使得中央服务器在保证各方数据的私密性与安全性训练模型,且使用价值权重抽取参与训练的客户端,优化联邦学习训练效率;使用动态正则化方法更新模型,提高模型泛化能力;使用保留本地层的模型上传策略构建本地模型;使用服务器状态参数聚合全局模型,提高模型收敛速度。

【技术实现步骤摘要】

本专利技术涉及咳嗽声识别和联邦学习领域,具体涉及一种基于联邦学习的咳嗽声识别方法


技术介绍

1、咳嗽是呼吸系统的一种重要防御机制,具有清除呼吸道异物和分泌物的保护作用,并伴有声音。在医学相关研究中,咳嗽常被认为是某些疾病的重要症状,如covid-19。咳嗽诊断通常依赖于患者的主观主诉或咳嗽问卷评估,而为了实现客观、准确、可靠的诊断,需要从音频数据中自动识别咳嗽声音。传统的咳嗽识别算法需要医疗机构安排病人佩戴相关设备进行数据收集,再进行集中式的机器学习训练。为了捕捉真实的咳嗽声音,患者需要长时间佩戴相关设备并持续录音,由于咳嗽声音仅偶尔出现且持续时间短,录制音频的绝大部分片段均为患者的日常生活与交流声音。单个医院的数据量较少难以训练出一个鲁棒的模型,而由多个医院联合开展咳嗽声识别训练则需要汇总各方的数据,在数据上传过程中可能造成患者隐私泄露问题。

2、联邦学习是一种分布式机器学习方法,其结构由一个服务器和若干客户端组成。本专利技术所述的一种基于联邦学习的咳嗽声识别方法包含一个中央服务器与多个客户端,中央服务器可以是地区内较权威的医疗机构,或委托的第三方公司,各客户端为各个医疗机构,其咳嗽声数据由各医疗机构通过设备收集其所属患者的咳嗽声音样本组成。每个客户端使用自己的本地数据训练一个模型,并只将训练后的咳嗽声识别模型发送回服务器,服务器将接收到的客户端模型进行聚合得到一个全局模型,在此过程中客户端本地声音数据不进行上传,克服了隐私泄露问题。同时,本专利技术从多角度对传统联邦学习进行优化,进一步提升咳嗽声识别效果。>

技术实现思路

1、针对现有技术中的上述不足,本专利技术提供了一种基于联邦学习的咳嗽声识别方法,包括:

2、s1中央服务器初始化联邦学习训练环境,生成初始全局模型;

3、s2客户端对本地包含咳嗽声的音频片段进行预处理,并划分训练数据集与测试数据集;

4、s3中央服务器使用基于数据价值权重的抽取策略抽取部分客户端参与联邦训练,下发全局模型;

5、s4参与本轮联邦学习训练的客户端在接收到全局模型之后,将其设置为初始本地模型并使用基于动态正则化损失项的模型更新策略对本地模型进行更新,并将更新后的全局模型设置为新的本地模型,计算其损失梯度权重;

6、s5本地模型更新完成后,客户端将模型拆分为特征提取器与全连接层两部分,将特征提取器部分上传至服务器,全连接层留至本地;

7、s6中央服务器接收参与训练的客户端上传的特征提取器模型,使用基于状态参数的全局模型聚合更新方法更新全局特征提取器模型,然后返回步骤3,直至所述中央服务器的所述全局网络模型收敛或达到指定训练次数。

8、进一步的,所述客户端对本地声音数据进行预处理,包括但不限于直接使用一维声音信号数据作为输入,对一维声音信号数据提取其梅尔频谱图特征或梅尔倒谱系数特征作为输入等。

9、进一步的,所述客户端对本地声音数据进行训练数据集与测试数据集划分,其比例为4:1。

10、进一步的,所述中央服务器使用基于数据价值权重的抽取策略抽取部分客户端参与联邦学习,公式为

11、进一步的,所述客户端在本地训练过程中使用基于动态正则化损失项的模型更新策略包括:

12、s1根据所述客户端新接收的全局模型、正在被更新的本地模型以及上一轮联邦学习中本地模型的损失梯度权重向量构建动态正则化惩罚损失函数;

13、s2所述客户端通过交叉熵损失函数和所述动态正则化惩罚损失函数计算总损失函数;

14、s3根据所述客户端的咳嗽声数据,按照最小化所述总损失函数原则,训练客户端接收的中央服务器全局模型,获得更新后的模型参数并将其设置为客户端本地模型。

15、进一步的,根据权利要求5所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述动态正则化惩罚损失函数为:

16、

17、其中,wk表示所述客户端中正在训练更新的本地模型;wt-1表示中央服务器下发的全局模型原始参数;表示上一轮联邦学习中所述客户端的本地模型的损失梯度权重向量;λ表示正则化超参数。

18、进一步的,所述客户端更新的本地模型的目标是:

19、

20、其中,x表示输入数据,y表示输入数据对应的标签,表示表示客户端k在第t轮次训练完成的所述客户端本地模型权重,表示所述交叉熵损失函数,表示所述动态正则化惩罚损失函数。

21、进一步的,根据权利要求6所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述客户端在本地训练阶段完成后,将重新设定本地模型的损失梯度权重向量。

22、进一步的,所述客户端在上传模型至服务器时,将本地模型进行拆分为特征提取器部分φ与全连接层部分θ。

23、进一步的,所述中央服务器接收参与训练的客户端所上传的本地模型后,使用基于状态参数的全局模型聚合更新方法更新全局特征提取器模型,其公式为:

24、

25、

26、其中,ht表示中央服务器的状态参数,st表示中央服务器在第t轮联邦学习中抽取的参与训练的客户端的集合,φt表示中央服务器聚合得到的第t轮全局特征提取器模型,表示客户端k在第t轮上传的本地特征提取器模型。

27、进一步的,所述客户端在接收全局特征提取器模型后,将使用本地保留的全连接层模型与全局特征提取器模型组合得到全局模型w。

28、进一步的,所述中央服务器与所述客户端使用的声音识别模型为深度学习模型,包括但不限于cnn模型、c-bilstm模型、transformer模型。

29、本专利技术优点在于使用联邦学习的方法进行咳嗽声音识别,与传统方法相比,不需要客户端向中央服务器上传咳嗽音频数据,克服了数据上传过程中可能产生的隐私泄露问题。在保证各方数据的私密性与安全性的同时,使用价值权重抽取参与训练的客户端,优化联邦学习训练效率;使用动态正则化方法更新模型,提高模型泛化能力;使用保留本地层的模型上传策略构建个性化本地模型;使用服务器状态参数聚合全局模型,提高模型收敛速度。

本文档来自技高网...

【技术保护点】

1.一种基于联邦学习的咳嗽声识别方法,其特征在于,该方法通过中央服务器连接多个含有咳嗽声数据的客户端,多端统筹并行开展联邦学习训练,该方法具体步骤包括如下:

2.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤2中所述客户端对本地咳嗽声数据进行预处理,包括但不限于直接使用一维音频信号数据作为输入,对一维音频信号数据提取其梅尔频谱图特征或梅尔倒谱系数特征作为输入等。

3.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤2中客户端需对本地咳嗽声数据进行训练数据集与测试数据集划分。

4.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述中央服务器使用基于数据价值权重的抽取策略抽取部分客户端参与联邦学习,公式为:

5.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤5中基于动态正则化损失项的模型更新策略包括:

6.根据权利要求5所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述动态正则化惩罚损失函数为:

7.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述客户端更新的本地模型的目标是:

8.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述客户端在本地训练阶段完成后,将重新设定本地模型的损失梯度权重向量。

9.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述客户端在上传模型至服务器时,将本地模型进行拆分为特征提取器部分φ与全连接层部分θ,并仅上传特征提取器部分φ。

10.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述步骤7中所述使用基于状态参数的全局模型聚合更新方法更新全局特征提取器模型,其公式为:

11.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述客户端在接收全局特征提取器模型后,将使用本地保留的全连接层模型与全局特征提取器模型组合得到全局模型w。

12.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述中央服务器与所述客户端使用的咳嗽声识别模型为深度学习模型,包括但不限于CNN模型、C-BiLSTM模型、Transformer模型。

13.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述客户端使用的咳嗽声数据标签为强标签,包含每段音频的咳嗽声与否,以及音频中每段咳嗽声音的起始与结束时间。

...

【技术特征摘要】

1.一种基于联邦学习的咳嗽声识别方法,其特征在于,该方法通过中央服务器连接多个含有咳嗽声数据的客户端,多端统筹并行开展联邦学习训练,该方法具体步骤包括如下:

2.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤2中所述客户端对本地咳嗽声数据进行预处理,包括但不限于直接使用一维音频信号数据作为输入,对一维音频信号数据提取其梅尔频谱图特征或梅尔倒谱系数特征作为输入等。

3.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤2中客户端需对本地咳嗽声数据进行训练数据集与测试数据集划分。

4.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述中央服务器使用基于数据价值权重的抽取策略抽取部分客户端参与联邦学习,公式为:

5.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于:所述步骤5中基于动态正则化损失项的模型更新策略包括:

6.根据权利要求5所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述动态正则化惩罚损失函数为:

7.根据权利要求1所述的一种基于联邦学习的咳嗽声识别方法,其特征在于,所述客户端更新的本地模型的目标是:

8.根据...

【专利技术属性】
技术研发人员:徐华兴范增和凯宇
申请(专利权)人:郑州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1