语音数据辅助诊断方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21755764 阅读:25 留言:0更新日期:2019-08-03 17:59
本发明专利技术公开了一种语音数据辅助诊断方法、装置、计算机设备及存储介质,其中,该语音数据辅助诊断方法包括:获取客户端发送的声音诊断请求,声音诊断请求包括原始语音信息;对原始语音信息进行处理,获取至少两个定长重叠语音帧;对至少两个定长重叠语音帧进行处理,获取频域光谱图,提取频域光谱图的一阶时间导数图像和二阶时间导数图像;对频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理,获取图像诊断结果;将图像诊断结果发送给医师终端,获取医师终端基于图像诊断结果返回的医师诊断结果。该方法可同时获得服务器给出的图像诊断结果和医师给出的医师诊断结果,保证提供诊疗建议的全面性、灵活性和可靠性。

【技术实现步骤摘要】
语音数据辅助诊断方法、装置、计算机设备及存储介质
本专利技术涉及音频处理领域,尤其涉及一种语音数据辅助诊断方法、装置、计算机设备及存储介质。
技术介绍
随着社会的发展,医疗行业不仅提供基础的医疗保障,也可以为人们提供远程医疗卫生服务。而出现远程医疗卫生服务,主要包括以下几个原因:(一)专科医生稀少;(二)有时往返偏远地区很困难;(三)遇到市区交通高峰时段可能很难尽快到达医院;(四)日程安排紧张。因此,近年来对远程医疗或移动医疗的研究日益增多。远程医疗框架基本需要以下组件,例如可以从于本实施例那里收集数据的传感器、便携式处理单元和云服务器等。无线通信技术和计算处理能力的快速发展使移动医疗保健能够提供及时、低成本、舒适且无干扰的服务。医疗领域中语音数据辅助诊断是基于人的喉咙功能进行的声学诊断,用以检查发声功能障碍的程度与范围。如何通过远程医疗及时为声音病理患者提供及时准确的声音诊断结果成为亟待解决的问题。
技术实现思路
本专利技术实施例提供一种语音数据辅助诊断方法、装置、计算机设备及存储介质,以解决通过远程医疗及时为声音病理患者提供及时准确的诊断结果的问题。一种语音数据辅助诊断方法,包括:获取客户端发送的声音诊断请求,声音诊断请求包括原始语音信息、目标医师ID和原始电子病历;采用语音去噪工具对原始语音信息进行处理,获取至少两个定长重叠语音帧;采用域变换工具对至少两个定长重叠语音帧进行处理,获取频域光谱图,提取频域光谱图的一阶时间导数图像和二阶时间导数图像;采用卷积神经网络对频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理,获取图像诊断结果;将图像诊断结果发送给目标医师ID对应的医师终端,获取医师终端基于图像诊断结果返回的医师诊断结果;基于图像诊断结果和医师诊断结果更新原始电子病历,形成更新电子病历,将更新电子病历返回给客户端。一种语音数据辅助诊断装置,包括:获取诊断请求模块,用于获取客户端发送的声音诊断请求,声音诊断请求包括原始语音信息、目标医师ID和原始电子病历;获取定长重叠语音帧模块,用于采用语音去噪工具对原始语音信息进行处理,获取至少两个定长重叠语音帧;获取频域光谱图模块,用于采用域变换工具对至少两个定长重叠语音帧进行处理,获取频域光谱图,提取频域光谱图的一阶时间导数图像和二阶时间导数图像;获取处理结果模块,用于采用卷积神经网络对频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理,获取图像诊断结果;获取诊断结果模块,用于将图像诊断结果发送给目标医师ID对应的医师终端,获取医师终端基于图像诊断结果返回的医师诊断结果;返回电子病历模块,用于基于图像诊断结果和医师诊断结果更新原始电子病历,形成更新电子病历,将更新电子病历返回给客户端。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音数据辅助诊断方法。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音数据辅助诊断方法。上述语音数据辅助诊断方法、装置、计算机设备及存储介质,通过接收客户端通过远程发送的声音诊断请求,对该请求中携带的原始声音信息采用语音去噪工具和卷积神经网络进行自动化分析,得到图像诊断结果,并将图像诊断结果发送给医师终端,用以接收医师终端结合该图像诊断结果返回的医师诊断结果,最后同时将医师诊断结果和图像诊断结果形成的更新电子病历发送给客户端,避免患者到现场进行声音诊断的不便,同时加快诊断速度;采用采用语音去噪工具和卷积神经网络对原始声音信息进行自动化分析,可提高诊疗效率和诊疗准确性;并且,客户端可同时获得服务器提供的包括图像诊断结果和医师给出的医师诊断结果的更新电子病历,提高该系统给客户端提供诊疗建议的全面性、灵活性和可靠性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。图1是本专利技术一实施例中语音数据辅助诊断方法的应用环境示意图;图2是本专利技术一实施例中语音数据辅助诊断方法的流程图;图3是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图4是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图5是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图6是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图7是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图8是本专利技术一实施例中语音数据辅助诊断方法的另一流程图;图9是本专利技术一实施例中语音数据辅助诊断装置的示意图;图10是本专利技术一实施例中计算机设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的语音数据辅助诊断方法,可应用在如图1的应用环境中,该语音数据辅助诊断方法应用在语音数据辅助诊断系统中,该语音数据辅助诊断系统包括客户端和服务器,其中,客户端通过网络与服务器进行通信。客户端又称为患者端,是指与服务器相对应,为客户端提供本地服务的程序。该客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等计算机设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种语音数据辅助诊断方法,以该方法应用在图1中的服务器为例进行说明,具体包括如下步骤:S10.获取客户端发送的声音诊断请求,声音诊断请求包括原始语音信息、目标医师ID和原始电子病历。其中,声音诊断请求是患者通过客户端向服务器发送的在线诊断发声障碍病理也即声音病理的诊断请求。原始语音信息是患者通过诊断仪器采集的自己的包括嗓音和喉音的音频信息。现有的声音诊断仪器通常包括一个声学麦克风和一个喉咙麦克风。具体地,喉咙麦克风已被公认为对噪声具有鲁棒性,即使在嘈杂的环境中,喉咙麦克风的记录也可以提取出关键的喉部信息,而声学麦克风更适合于整体病理声音诊断。目标医师ID是服务器用以区分不同医师的标识,用以患者通过客户端在线自主选择目标医师ID,或由服务器指定目标医师ID对应的目标医师对患者的原始语音信息进行语音数据辅助诊断。电子病历是记录患者原始信息的记录本,比如,患者的姓名,年龄,患病史,当前身体状况或药物过敏史等信息。原始电子病历是服务器最初给患者建立电子病历,无医师记录患者患病史的病历。进一步地,当医师给客户端对应的病历添加患病原因或治疗方法等信息时,也即原始电子病历被更新,形成更新电子病历。进一步地,服务器可通过病历档案库保存每个患者的更新电子病历,利于后续各个医师对患者的患病情况进行病理诊断时,通过更新电子病历记录的该患者过往的患病史,做出更为准确的病理判断;同时,采用电子病历可实现无纸化办公,节约病理诊断成本。其中,病理档案库是服务器给每个登陆过该语音数据辅助诊断系统的患者建立的本文档来自技高网...

【技术保护点】
1.一种语音数据辅助诊断方法,其特征在于,包括:获取客户端发送的声音诊断请求,所述声音诊断请求包括原始语音信息、目标医师ID和原始电子病历;采用语音去噪工具对所述原始语音信息进行处理,获取至少两个定长重叠语音帧;采用域变换工具对至少两个所述定长重叠语音帧进行处理,获取频域光谱图,提取所述频域光谱图的一阶时间导数图像和二阶时间导数图像;采用卷积神经网络对所述频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理,获取图像诊断结果;将所述图像诊断结果发送给所述目标医师ID对应的医师终端,获取所述医师终端基于所述图像诊断结果返回的医师诊断结果;基于所述图像诊断结果和所述医师诊断结果更新所述原始电子病历,形成更新电子病历,将所述更新电子病历返回给所述客户端。

【技术特征摘要】
1.一种语音数据辅助诊断方法,其特征在于,包括:获取客户端发送的声音诊断请求,所述声音诊断请求包括原始语音信息、目标医师ID和原始电子病历;采用语音去噪工具对所述原始语音信息进行处理,获取至少两个定长重叠语音帧;采用域变换工具对至少两个所述定长重叠语音帧进行处理,获取频域光谱图,提取所述频域光谱图的一阶时间导数图像和二阶时间导数图像;采用卷积神经网络对所述频域光谱图、一阶时间导数图像和二阶时间导数图像进行处理,获取图像诊断结果;将所述图像诊断结果发送给所述目标医师ID对应的医师终端,获取所述医师终端基于所述图像诊断结果返回的医师诊断结果;基于所述图像诊断结果和所述医师诊断结果更新所述原始电子病历,形成更新电子病历,将所述更新电子病历返回给所述客户端。2.如权利要求1所述的语音数据辅助诊断方法,其特征在于,所述采用语音去噪工具对所述原始语音信息进行处理,获取至少两个定长重叠语音帧,包括:采用语音去噪工具处理所述原始语音信息,获取优化语音信息;若所述优化语音信息对应的优化时长大于指定时长,则按所述指定时长对所述优化语音信息进行截断,获取定长语音信息;根据语音切分规则对所述定长语音信息进行切分,获取至少两个所述定长重叠语音帧。3.如权利要求2所述的语音数据辅助诊断方法,其特征在于,所述原始语音信息包括嗓部语音信息和喉咙语音信息;所述采用语音去噪工具处理所述原始语音信息,获取优化语音信息,包括:采用语音去噪工具处理所述嗓部语音信息,获取所述嗓部语音信息对应的声学噪音值;若存在至少一个目标噪音时段对应的声学噪音值高于预设阈值,则获取所述嗓部语音信息在至少一个所述目标噪音时段对应的待替换语音信息,以及所述喉咙语音信息在至少一个所述目标噪音时段对应的目标语音信息;基于所述嗓部语音信息,将至少一个所述目标噪音时段对应的所述待替换语音信息替换为所述目标语音信息,获取所述优化语音信息。4.如权利要求2所述的语音数据辅助诊断方法,其特征在于,所述根据语音切分规则对所述定长语音信息进行切分,获取至少两个所述定长重叠语音帧,包括:基于所述语音切分规则,确定至少两个语音截取时间段,每相邻两个所述语音截取时间段之间存在重叠时间区间,每一所述语音截取时间段包括截取起点和截取终点;基于每一所述语音截取时间段的截取起点和截取终点对所述定长语音信息进行语音截取,获取至少两个所述定长重叠语音帧。5.如权利要求1所述的语音数据辅助诊断方法,其特征在于,所述采用域变换工具对至少两个所述定长重叠语音帧进行处理,获取频域光谱图,包括:采用傅里叶变换工具对每一所述定长重叠语音帧进行变换,获取至少两个所述频域帧;级联至少两个所述频域帧,形成所述原始语音信息对应...

【专利技术属性】
技术研发人员:王健宗彭俊清瞿晓阳
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1