用于呼吸道状态识别的电子设备、音频处理系统及方法技术方案

技术编号:38230098 阅读:11 留言:0更新日期:2023-07-25 17:58
一种用于呼吸道状态识别的电子设备、音频处理系统及方法,所述设备包括:传感器,用于采集用户声音以获取音频数据,所述用户声音为呼吸道相关的声音;处理器,用于将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。通过本申请提供的方案能够便捷且准确地获得呼吸道相关的指标参数。捷且准确地获得呼吸道相关的指标参数。捷且准确地获得呼吸道相关的指标参数。

【技术实现步骤摘要】
用于呼吸道状态识别的电子设备、音频处理系统及方法


[0001]本申请涉及数据处理
,尤其涉及一种用于呼吸道状态识别的电子设备、音频处理系统及方法。

技术介绍

[0002]目前,呼吸道相关的指标参数需要通过胸片拍摄等方式来获得。这种方案的便捷性较差。

技术实现思路

[0003]本申请实施例的技术目的在于提供一种用于呼吸道状态识别的电子设备、音频处理系统及方法,能够有利于便捷且准确地获得呼吸道相关的指标参数。
[0004]第一方面,本申请实施例提供一种电子设备,所述设备包括:传感器,用于采集用户声音以获取音频数据,所述用户声音为呼吸道相关的声音;处理器,用于将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。
[0005]可选的,所述音频数据是响应于采集指令对所述用户声音进行采集得到的。
[0006]可选的,所述处理器还用于执行以下步骤:从所述音频数据中识别出候选音频片段,其中,所述候选音频片段中的音频幅值均大于或等于第一阈值;提取所述候选音频片段的特征信息;将所述候选音频片段的特征信息输入至预先训练的判别模型,得到所述判别模型输出的判别结果,其中,如果所述判别结果为是,则所述候选音频片段有效。
[0007]可选的,所述处理器还用于将有效的候选音频片段输入至所述识别模型,以得到所述多个概率值。
[0008]可选的,所述处理器还用于采用第一训练数据对第一预设模型进行训练,直至满足训练停止条件,得到所述判别模型;其中,所述第一训练数据包括:样本候选音频片段的特征信息以及标签信息,所述标签信息用于指示所述样本候选音频片段是否有效。
[0009]可选的,所述处理器还用于计算所述候选音频片段的特征信息和历史特征信息之间的相似度,所述历史特征信息基于所述用户的历史有效音频片段的特征信息得到;若所述相似度大于或等于相似度阈值,则所述第三处理单元用于将所述候选音频片段的特征信息输入至所述判别模型。
[0010]可选的,所述处理器还用于根据所述第一阈值,从所述音频数据中识别出一个或多个用户音频片段;以及针对每个用户音频片段,若该用户音频片段中音频幅值的最大值大于或等于第二阈值,则确定该用户音频片段为所述候选音频片段;其中,所述用户音频片段的起始时间点和结束时间点的音频幅值为所述第一阈值,且所述起始时间点和结束时间点之间的时间点的音频幅值均大于所述第一阈值。
[0011]可选的,所述处理器还用于按照预设时长对所述音频数据进行划分,得到多个音频单元;以及计算每个音频单元的平均音频幅值;以及根据N个音频单元的平均音频幅值,
确定所述第一阈值,其中,N为正整数,所述N个音频单元为所述多个音频单元中所述平均音频幅值最小的N个音频单元。
[0012]可选的,所述处理器还用于若有效的候选音频片段的数量小于第三阈值,则输出录制提示信息,所述录制提示信息包括:重新录制的指令和/或教程视频。
[0013]第二方面,本申请实施例还提供一种音频处理系统,包括:终端设备,用于采集音频数据,所述音频数据是对用户声音进行采集得到的,所述用户声音为呼吸道相关的声音;云端设备,用于从所述终端设备接收所述音频数据,以及将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。
[0014]可选的,所述音频数据是响应于采集指令对所述用户声音进行采集得到的。
[0015]可选的,所述云端设备用于从所述音频数据中识别候选音频片段,所述候选音频片段中的音频幅值均大于或等于第一阈值;所述云端设备还用于提取所述候选音频片段的特征信息,以及将所述候选音频片段的特征信息输入至预先训练的判别模型,得到所述判别模型输出的判别结果,其中,如果所述判别结果为是,则所述候选音频片段有效。
[0016]可选的,所述云端设备用于将有效的候选音频片段输入至所述识别模型,以得到所述多个概率值。
[0017]可选的,所述云端设备还用于采用第一训练数据对第一预设模型进行训练,直至满足训练停止条件,得到所述判别模型;其中,所述第一训练数据包括:样本候选音频片段的特征信息以及标签信息,所述标签信息用于指示所述样本候选音频片段是否有效。
[0018]可选的,所述云端设备还用于计算所述候选音频片段的特征信息和历史特征信息之间的相似度,所述历史特征信息基于所述用户的历史有效音频片段的特征信息得到;若所述相似度大于或等于相似度阈值,则所述云端设备用于将所述候选音频片段的特征信息输入至所述判别模型。
[0019]可选的,所述云端设备还用于根据所述第一阈值,从所述音频数据中识别出一个或多个用户音频片段,其中,所述用户音频片段的起始时间点和结束时间点的音频幅值为所述第一阈值,且所述起始时间点和结束时间点之间的时间点的音频幅值均大于所述第一阈值;以及针对每个用户音频片段,若该用户音频片段中音频幅值的最大值大于或等于第二阈值,则确定该用户音频片段为所述候选音频片段。
[0020]可选的,所述云端设备还用于按照预设时长对所述音频数据进行划分,得到多个音频单元;以及计算每个音频单元的平均音频幅值;以及根据N个音频单元的平均音频幅值,确定所述第一阈值,其中,N为正整数,所述N个音频单元为所述多个音频单元中所述平均音频幅值最小的N个音频单元。
[0021]可选的,所述云端设备还用于若有效的候选音频片段的数量小于第三阈值,则向所述终端设备发送录制提示信息,所述录制提示信息包括:重新录制的指令和/或教程视频。
[0022]第三方面,本申请实施例提供一种音频处理方法,所述方法包括:获取音频数据,所述音频数据是对用户声音进行采集得到的,所述用户声音为呼吸道相关的声音;将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。
[0023]可选的,所述音频数据是响应于采集指令对所述用户声音进行采集得到的。
[0024]可选的,将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型之前,所述方法还包括:从所述音频数据中识别出候选音频片段,其中,所述候选音频片段中的音频幅值均大于或等于第一阈值;提取所述候选音频片段的特征信息;将所述候选音频片段的特征信息输入至预先训练的判别模型,得到所述判别模型输出的判别结果,其中,如果所述判别结果为是,则所述候选音频片段有效。
[0025]可选的,将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型包括:将有效的候选音频片段输入至所述识别模型,以得到所述多个概率值。
[0026]可选的,获取音频数据之前,所述方法还包括:采用第一训练数据对第一预设模型进行训练,直至满足训练停止条件,得到所述判别模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子设备,其特征在于,所述设备包括:传感器,用于采集用户声音以获取音频数据,所述用户声音为呼吸道相关的声音;处理器,用于将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。2.根据权利要求1所述的电子设备,其特征在于,所述音频数据是响应于采集指令对所述用户声音进行采集得到的。3.根据权利要求1所述的电子设备,其特征在于,所述处理器还用于执行以下步骤:从所述音频数据中识别出候选音频片段,其中,所述候选音频片段中的音频幅值均大于或等于第一阈值;提取所述候选音频片段的特征信息;将所述候选音频片段的特征信息输入至预先训练的判别模型,得到所述判别模型输出的判别结果,其中,如果所述判别结果为是,则所述候选音频片段有效。4.根据权利要求3所述的电子设备,其特征在于,所述处理器还用于将有效的候选音频片段输入至所述识别模型,以得到所述多个概率值。5.根据权利要求3所述的电子设备,其特征在于,所述处理器还用于根据所述第一阈值,从所述音频数据中识别出一个或多个用户音频片段;以及针对每个用户音频片段,若该用户音频片段中音频幅值的最大值大于或等于第二阈值,则确定该用户音频片段为所述候选音频片段;其中,所述用户音频片段的起始时间点和结束时间点的音频幅值为所述第一阈值,且所述起始时间点和结束时间点之间的时间点的音频幅值均大于所述第一阈值。6.根据权利要求3所述的电子设备,其特征在于,所述处理器还用于按照预设时长对所述音频数据进行划分,得到多个音频单元;以及计算每个音频单元的平均音频幅值;以及根据N个音频单元的平均音频幅值,确定所述第一阈值,其中,N为正整数,所述N个音频单元为所述多个音频单元中所述平均音频幅值最小的N个音频单元。7.一种音频处理系统,其特征在于,所述系统包括:终端设备,用于采集音频数据,所述音频数据是对用户声音进行采集得到的,所述用户声音为呼吸道相关的声音;云端设备,用于从所述终端设备接收所述音频数据,以及将所述音频数据的至少一部分和/或所述音频数据的特征信息输入至预先训练的识别模型,以得到所述识别模型输出的多个概率值,所述多个概率值用于表征用户的呼吸道状态。8.根据权利要求7所述的音频处理系统,其特征在于,所述音频数据是响应于采集指令对所述用户声音进行采集得到的。9.根据权利要求7所述的音频处理系统,其特征在于,所述云端设备还用于从所述音频数据中识别候选音频片段,所述候选音频片段中的音频幅值均大于或等于第一阈值;所述云端设备还用于提取所述候选音频片段的特征信息,以及将所述候选音频片段的特征信息输入至预先训练的判别模型,得到所述判别模型输出的判别结果,其中,如果所述判别结果为是,则所述候选音频片段有效。10.根据权利要求9所述的音频处理系统,其特征在于,所述云端设备还用于将有效的
候选音频片段输入至所述识别模型,以得到所述多个概率值。11.根据权利要求9所述的音频处理系统,其特征在于,所述云端设备还用于根据所述第一阈值...

【专利技术属性】
技术研发人员:瞿介明时国朝李庆云周敏李亚男陈思钱春强卜朝阳毛嘉璇杨越
申请(专利权)人:波江生命科学上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1