手术室警报声的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37424907 阅读:24 留言:0更新日期:2023-04-30 09:46
本发明专利技术公开了一种手术室警报声的识别方法、装置、电子设备及存储介质,本发明专利技术先获取手术室中的待识别声源信号,然后,对待识别声源信号进行特征提取处理,得到声源特征信息;最后,通过构建声音识别模型来对声源特征信息进行声音识别处理,从而得到手术室中待识别声源信号的声音识别结果,如此,即可快速准确的判断出手术室中各个声音中是否夹杂有医疗设备的报警声,以便麻醉医师依据报警声及时采取处理措施;由此,本发明专利技术不依赖于麻醉医师自身来进行警报声的识别,不仅可准确无误的识别出每个医疗设备的警报声,从而避免警报声漏报的问题,同时,还能防止嘈杂环境对麻醉医师注意力和判断力的影响,从而消除因人为因素而对患者产生的安全隐患。产生的安全隐患。产生的安全隐患。

【技术实现步骤摘要】
手术室警报声的识别方法、装置、电子设备及存储介质


[0001]本专利技术属于声音识别
,具体涉及一种手术室警报声的识别方法、装置、电子设备及存储介质。

技术介绍

[0002]麻醉医师的职责在于保证病人在无痛、安全的前提下完成手术,其是麻醉手术过程中病人生命的重要保障,因此,麻醉医师需要关注手术中医疗设备的报警声,从而及时对病人进行处理;目前,麻醉医师大多都是依赖于自己的听觉系统、注意力以及判断力来进行警报的聆听以及识别;但是,在实际手术过程中,手术室声源众多,麻醉医师需要在手术器械、手术设备、医护人员交谈、呼吸机、麻醉机、输液泵等多种声音中及时准确的识别出需要立即处理的警报,并快速判断警报的原因;如此,麻醉医师不可避免的会漏掉一些警报,且长期暴露于嘈杂环境,麻醉医师对警报的识别力、注意力、判断力也会下降,会对围术期患者造成一定的安全隐患;基于此,如何提供一种不依赖于人工听觉系统、注意力以及判断力的手术室警报声的识别方法,已成为一个亟待解决的问题。

技术实现思路

[0003]本专利技术的目的是提供一种手术室警报声的识别方法、装置、电子设备及存储介质,用以解决现有技术依赖于麻醉医师自身来进行警报的聆听以及识别所存在的会漏掉警报,且长期处于嘈杂环境会导致麻醉医师对警报的识别力、注意力和判断力下降的问题。
[0004]为了实现上述目的,本专利技术采用以下技术方案:第一方面,提供了一种手术室警报声的识别方法,包括:获取手术室中的待识别声源信号,其中,所述待识别声源信号中至少包括一种声源信号;对所述待识别声源信号进行特征提取处理,得到所述待识别声源信号的声源特征信息,其中,所述声源特征信息包括待识别声源信号的语谱图、时域特征和/或频域特征;将所述声源特征信息输入至声音识别模型中进行声音识别处理,得到所述待识别声源信号的识别结果,其中,所述识别结果包括医疗设备警报声和/或手术室干扰声;所述声音识别模型包括输入层、第一隐含层、第二隐含层以及输出层,其中,所述输入层包括k个输入神经元,所述第一隐含层包括n个第一隐含神经元,所述第二隐含层包括m个第二隐含神经元,所述输出层包括j个输出神经元,k、m、n和j均为大于或等于1的正整数,且m大于n,n大于或等于128;所述输入层,用于将所述声源特征信息输入至所述第一隐含层中进行特征线性变换,得到声源特征变换信息;所述第二隐含层,用于对所述声源特征变换信息进行声音分类,得到若干声音分类值;所述输出层,用于基于目标激活函数对所述若干声音分类值进行非线性变换,得
到若干声音分类概率值,并根据所述若干声音分类概率值,得出所述待识别声源信号的识别结果。
[0005]基于上述公开的内容,本专利技术先获取手术室中的待识别声源信号,然后,对待识别声源信号进行特征提取处理,得到声源特征信息;最后,通过构建声音识别模型来对声源特征信息进行声音识别处理,从而得到手术室中待识别声源信号的声音识别结果,如此,即可快速准确的判断出手术室中各个声音中是否夹杂有医疗设备的报警声,以便麻醉医师依据报警声及时采取处理措施;由此通过前述设计,本专利技术不依赖于麻醉医师自身来进行警报声的识别,不仅可准确无误的识别出每个医疗设备的警报声,从而避免警报声漏报的问题,同时,还能防止嘈杂环境对麻醉医师注意力和判断力的影响,从而消除因人为因素而对患者产生的安全隐患。
[0006]在一个可能的设计中,所述第一隐含层包括128个第一隐含神经元,所述第二隐含层包括512个第二隐含神经元,所述第一隐含层对应的激活函数以及所述第二隐含层对应的激活函数均为ReLU函数,且所述目标激活函数为sftmax函数。
[0007]在一个可能的设计中,在获取手术室中的待识别声源信号前,所述方法还包括:获取海量手术室样本声源信号,其中,所述海量手术室样本声源信号包括医疗设备警报样本声源信号和手术室干扰样本声源信号,且手术室干扰样本声源信号包括医疗设备调试样本声源信号、血压心率监测样本声源信号、手术器械操作样本声源信号、物体运动样本声源信号和/或交谈样本声源信号;将所述海量手术室样本声源信号划分为多个训练样本声源集,且每个训练样本声源集包括256个手术室样本声源信号;对每个训练样本声源集进行特征提取处理,得到每个训练样本声源集中各个手术室样本声源信号的声源特征信息,并对各个训练样本声源集中的每个手术室样本声源信号对应的声源特征信息进行标签标注,以在标签标注后,得到多个训练数据集;以所述多个训练数据集为输入,每个训练数据集中各个手术室样本声源信号的声音识别结果为输出,训练目标模型,以在训练完成后,得到所述声音识别模型,其中,所述目标模型为未训练的声音识别模型。
[0008]在一个可能的设计中,所述声音识别模型还包括:Dropout层,其中,所述第一隐含层与所述第二隐含层分别对应设置有一Dropout层,且所述第一隐含层对应的Dropout层用于在训练过程中确定各个第一隐含神经元的激活函数值为0的概率,第二隐含层对应的Dropout层用于在训练过程中确定各个第二隐含神经元的激活函数值为0的概率;相应的,以所述多个训练数据集为输入,每个训练数据集中各个手术室样本声源信号的声音识别结果为输出,训练目标模型,包括:a. 依据第一隐含层和所述第二隐含层对应的Dropout层,确定出第一隐含层和第二隐含层的神经元丢弃个数,并依据第一隐含层和第二隐含层的神经元丢弃个数,随机丢弃若干第一隐含神经元和若干第二隐含神经元,以得到预处理目标模型;b. 以所述多个训练数据集中的第i个训练数据集内的第x条手术室样本声源信号对应的声源特征信息为输入,第x条手术室样本声源信号的声音识别结果为输出,训练所述预处理目标模型,并在输出所述第x条手术室样本声源信号的声音识别结果时,通过模型预测值以及真实值计算模型损失函数值,其中,所述模型预测值为所述第x条手术室样本声源
信号的声音识别结果对应的声音分类预测概率值,所述真实值为所述第x条手术室样本声源信号的标签值;c. 判断所述模型损失函数值是否收敛;d. 若否,则根据所述模型损失函数值,调整输入层中任一输入神经元与各个第一隐含神经元之间的权重值、任一第一隐含神经元与各个第二隐含神经元之间的权重值以及任一第二隐含神经元与各个输出神经元之间的权重值,以在调整后,得到调整后的目标模型;将x自加1,直至x等于h时,将i自加1,并重新执行步骤a,直至所述模型损失函数值收敛时为止,以将所述模型损失函数值收敛时对应的调整后的目标模型作为声音识别模型,其中,h为所述第i个训练数据集中手术室样本声源信号的总条数,i和x的初始值为1,且x和i均为正整数。
[0009]基于上述公开的内容,本专利技术为两个隐含层设置有Dropout层,如此,可在训练时,减少两隐含层中隐含神经元的个数,如此,可防止模型出现过拟合的问题;同时,在每次训练时,利用模型预测值与真实值计算出的损失函数值,来反向调整模型参数,可保证模型训练收敛,从而确保声音识别的准确性。
[0010]在一个可能的设计中,通过模型预测值以及真实值计算模型损失函数值,包括:计算所述模型预测值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手术室警报声的识别方法,其特征在于,包括:获取手术室中的待识别声源信号,其中,所述待识别声源信号中至少包括一种声源信号;对所述待识别声源信号进行特征提取处理,得到所述待识别声源信号的声源特征信息,其中,所述声源特征信息包括待识别声源信号的语谱图、时域特征和/或频域特征;将所述声源特征信息输入至声音识别模型中进行声音识别处理,得到所述待识别声源信号的识别结果,其中,所述识别结果包括医疗设备警报声和/或手术室干扰声;所述声音识别模型包括输入层、第一隐含层、第二隐含层以及输出层,其中,所述输入层包括k个输入神经元,所述第一隐含层包括n个第一隐含神经元,所述第二隐含层包括m个第二隐含神经元,所述输出层包括j个输出神经元,k、m、n和j均为大于或等于1的正整数,且m大于n,n大于或等于128;所述输入层,用于将所述声源特征信息输入至所述第一隐含层中进行特征线性变换,得到声源特征变换信息;所述第二隐含层,用于对所述声源特征变换信息进行声音分类,得到若干声音分类值;所述输出层,用于基于目标激活函数对所述若干声音分类值进行非线性变换,得到若干声音分类概率值,并根据所述若干声音分类概率值,得出所述待识别声源信号的识别结果。2.根据权利要求1所述的方法,其特征在于,所述第一隐含层包括128个第一隐含神经元,所述第二隐含层包括512个第二隐含神经元,所述第一隐含层对应的激活函数以及所述第二隐含层对应的激活函数均为ReLU函数,且所述目标激活函数为sftmax函数。3.根据权利要求1所述的方法,其特征在于,在获取手术室中的待识别声源信号前,所述方法还包括:获取海量手术室样本声源信号,其中,所述海量手术室样本声源信号包括医疗设备警报样本声源信号和手术室干扰样本声源信号,且手术室干扰样本声源信号包括医疗设备调试样本声源信号、血压心率监测样本声源信号、手术器械操作样本声源信号、物体运动样本声源信号和/或交谈样本声源信号;将所述海量手术室样本声源信号划分为多个训练样本声源集,且每个训练样本声源集包括256个手术室样本声源信号;对每个训练样本声源集进行特征提取处理,得到每个训练样本声源集中各个手术室样本声源信号的声源特征信息,并对各个训练样本声源集中的每个手术室样本声源信号对应的声源特征信息进行标签标注,以在标签标注后,得到多个训练数据集;以所述多个训练数据集为输入,每个训练数据集中各个手术室样本声源信号的声音识别结果为输出,训练目标模型,以在训练完成后,得到所述声音识别模型,其中,所述目标模型为未训练的声音识别模型。4.根据权利要求3所述的方法,其特征在于,所述声音识别模型还包括:Dropout层,其中,所述第一隐含层与所述第二隐含层分别对应设置有一Dropout层,且所述第一隐含层对应的Dropout层用于在训练过程中确定各个第一隐含神经元的激活函数值为0的概率,第二隐含层对应的Dropout层用于在训练过程中确定各个第二隐含神经元的激活函数值为0的概率;
相应的,以所述多个训练数据集为输入,每个训练数据集中各个手术室样本声源信号的声音识别结果为输出,训练目标模型,包括:a. 依据第一隐含层和所述第二隐含层对应的Dropout层,确定出第一隐含层和第二隐含层的神经元丢弃个数,并依据第一隐含层和第二隐含层的神经元丢弃个数,随机丢弃若干第一隐含神经元和若干第二隐含神经元,以得到预处理目标模型;b. 以所述多个训练数据集中的第i个训练数据集内的第x条手术室样本声源信号对应的声源...

【专利技术属性】
技术研发人员:王晓晓李楠裴敏玥
申请(专利权)人:北京大学第三医院北京大学第三临床医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1