语音数据辅助诊断方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：21755764 阅读：26 留言：0更新日期：2019-08-03 17:59

本发明专利技术公开了一种语音数据辅助诊断方法、装置、计算机设备及存储介质，其中，该语音数据辅助诊断方法包括：获取客户端发送的声音诊断请求，声音诊断请求包括原始语音信息；对原始语音信息进行处理，获取至少两个定长重叠语音帧；对至少两个定长重叠语音帧进行处理，获取频域光谱图，提取频域光谱图的一阶时间导数图像和二阶时间导数图像；对频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理，获取图像诊断结果；将图像诊断结果发送给医师终端，获取医师终端基于图像诊断结果返回的医师诊断结果。该方法可同时获得服务器给出的图像诊断结果和医师给出的医师诊断结果，保证提供诊疗建议的全面性、灵活性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据辅助诊断方法、装置、计算机设备及存储介质
本专利技术涉及音频处理领域，尤其涉及一种语音数据辅助诊断方法、装置、计算机设备及存储介质。
技术介绍
随着社会的发展，医疗行业不仅提供基础的医疗保障，也可以为人们提供远程医疗卫生服务。而出现远程医疗卫生服务，主要包括以下几个原因:(一)专科医生稀少；(二)有时往返偏远地区很困难；(三)遇到市区交通高峰时段可能很难尽快到达医院；(四)日程安排紧张。因此，近年来对远程医疗或移动医疗的研究日益增多。远程医疗框架基本需要以下组件，例如可以从于本实施例那里收集数据的传感器、便携式处理单元和云服务器等。无线通信技术和计算处理能力的快速发展使移动医疗保健能够提供及时、低成本、舒适且无干扰的服务。医疗领域中语音数据辅助诊断是基于人的喉咙功能进行的声学诊断，用以检查发声功能障碍的程度与范围。如何通过远程医疗及时为声音病理患者提供及时准确的声音诊断结果成为亟待解决的问题。
技术实现思路
本专利技术实施例提供一种语音数据辅助诊断方法、装置、计算机设备及存储介质，以解决通过远程医疗及时为声音病理患者提供及时准确的诊断结果的问题。一种语音数据辅助诊断方法，包括：获取客户端发送的声音诊断请求，声音诊断请求包括原始语音信息、目标医师ID和原始电子病历；采用语音去噪工具对原始语音信息进行处理，获取至少两个定长重叠语音帧；采用域变换工具对至少两个定长重叠语音帧进行处理，获取频域光谱图，提取频域光谱图的一阶时间导数图像和二阶时间导数图像；采用卷积神经网络对频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理，获取图像诊断结果；将图像诊断结果发送...

【技术保护点】
1.一种语音数据辅助诊断方法，其特征在于，包括：获取客户端发送的声音诊断请求，所述声音诊断请求包括原始语音信息、目标医师ID和原始电子病历；采用语音去噪工具对所述原始语音信息进行处理，获取至少两个定长重叠语音帧；采用域变换工具对至少两个所述定长重叠语音帧进行处理，获取频域光谱图，提取所述频域光谱图的一阶时间导数图像和二阶时间导数图像；采用卷积神经网络对所述频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理，获取图像诊断结果；将所述图像诊断结果发送给所述目标医师ID对应的医师终端，获取所述医师终端基于所述图像诊断结果返回的医师诊断结果；基于所述图像诊断结果和所述医师诊断结果更新所述原始电子病历，形成更新电子病历，将所述更新电子病历返回给所述客户端。

【技术特征摘要】
1.一种语音数据辅助诊断方法，其特征在于，包括：获取客户端发送的声音诊断请求，所述声音诊断请求包括原始语音信息、目标医师ID和原始电子病历；采用语音去噪工具对所述原始语音信息进行处理，获取至少两个定长重叠语音帧；采用域变换工具对至少两个所述定长重叠语音帧进行处理，获取频域光谱图，提取所述频域光谱图的一阶时间导数图像和二阶时间导数图像；采用卷积神经网络对所述频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理，获取图像诊断结果；将所述图像诊断结果发送给所述目标医师ID对应的医师终端，获取所述医师终端基于所述图像诊断结果返回的医师诊断结果；基于所述图像诊断结果和所述医师诊断结果更新所述原始电子病历，形成更新电子病历，将所述更新电子病历返回给所述客户端。2.如权利要求1所述的语音数据辅助诊断方法，其特征在于，所述采用语音去噪工具对所述原始语音信息进行处理，获取至少两个定长重叠语音帧，包括：采用语音去噪工具处理所述原始语音信息，获取优化语音信息；若所述优化语音信息对应的优化时长大于指定时长，则按所述指定时长对所述优化语音信息进行截断，获取定长语音信息；根据语音切分规则对所述定长语音信息进行切分，获取至少两个所述定长重叠语音帧。3.如权利要求2所述的语音数据辅助诊断方法，其特征在于，所述原始语音信息包括嗓部语音信息和喉咙语音信息；所述采用语音去噪工具处理所述原始语音信息，获取优化语音信息，包括：采用语音去噪工具处理所述嗓部语音信息，获取所述嗓部语音信息对应的声学噪音值；若存在至少一个目标噪音时段对应的声学噪音值高于预设阈值，则获取所述嗓部语音信息在至少一个所述目标噪音时段对应的待替换语音信息，以及所述喉咙语音信息在至少一个所述目标噪音时段对应的目标语音信息；基于所述嗓部语音信息，将至少一个所述目标噪音时段对应的所述待替换语音信息替换为所述目标语音信息，获取所述优化语音信息。4.如权利要求2所述的语音数据辅助诊断方法，其特征在于，所述根据语音切分规则对所述定长语音信息进行切分，获取至少两个所述定长重叠语音帧，包括：基于所述语音切分规则，确定至少两个语音截取时间段，每相邻两个所述语音截取时间段之间存在重叠时间区间，每一所述语音截取时间段包括截取起点和截取终点；基于每一所述语音截取时间段的截取起点和截取终点对所述定长语音信息进行语音截取，获取至少两个所述定长重叠语音帧。5.如权利要求1所述的语音数据辅助诊断方法，其特征在于，所述采用域变换工具对至少两个所述定长重叠语音帧进行处理，获取频域光谱图，包括：采用傅里叶变换工具对每一所述定长重叠语音帧进行变换，获取至少两个所述频域帧；级联至少两个所述频域帧，形成所述原始语音信息对应...

【专利技术属性】
技术研发人员：王健宗，彭俊清，瞿晓阳，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人