基于时频特征的呼吸声检测方法、系统、设备及介质技术方案

技术编号:22596219 阅读:82 留言:0更新日期:2019-11-20 11:49
本公开公开了基于时频特征的呼吸声检测方法、系统、设备及介质,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。合利用短时过零率、短时能量、高低频短时能量比等特征参数,检测传输语音中的呼吸声,并对检测到的呼吸声进行后处理,改善听觉效果。

Breath sound detection method, system, equipment and medium based on time-frequency characteristics

The invention discloses a breath sound detection method, system, equipment and medium based on time-frequency characteristics, including: acquiring a voice signal to be detected; the voice signal to be detected is a voice signal sent by a flight crew on an aircraft at a high altitude and transmitted to a ground receiver; the voice signal to be detected is processed by windowing and framing to obtain a number of frame voice signals Feature extraction is carried out for each frame of speech signal to extract short-time zero crossing rate, high and low frequency short-time energy ratio and low if short-time energy ratio; if the short-time zero crossing rate of the current frame of speech signal is greater than the first set threshold, and the high and low frequency short-time energy ratio is greater than the second set threshold, then the current frame of speech signal is judged as respiratory sound, and the respiratory sound is eliminated. Using the characteristic parameters such as short-time zero crossing rate, short-time energy, high and low frequency short-time energy ratio, the breath sound in the transmission voice is detected, and the detected breath sound is post processed to improve the hearing effect.

【技术实现步骤摘要】
基于时频特征的呼吸声检测方法、系统、设备及介质
本公开涉及语音信号处理
,特别是涉及基于时频特征的呼吸声检测方法、系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。随着通信技术的快速发展,用户对话音质量的要求越来越高。在很多特殊的通讯场合,除了正常传输的语音之外,往往会受到一些背景噪声或特殊声音的干扰。例如,当飞行员在高空飞行时,大气压力较地面标准大气压力要高出几倍,飞行员与地面通信时需要进行大量的换气,导致话音信号中会含有大量较强的呼吸声,呼吸声经过语音编解码后会收听感觉非常差,且会对地面接收人员的听力造成损伤。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:对呼吸声的检测不够精准,容易将非呼吸声的语音信号也被误检测出来,影响地面人员对语音信号的捕捉;对呼吸声的检测过程复杂,需要提取复杂的信号特征,检测过程浪费时间,难以保证地面通信员对语音信号捕捉的实时性要求。
技术实现思路
为了解决现有技术的不足,本公开提供了基于时频特征的呼吸声检测方法、系统、设备及介质;综合利用短时过零率、短时能量、高低频短时能量比等特征参数,检测传输语音中的呼吸声,并对检测到的呼吸声进行后处理,改善听觉效果。第一方面,本公开提供了基于时频特征的呼吸声检测方法;基于时频特征的呼吸声检测方法,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。作为一个或多个实施例,所述方法,还包括:如果当前帧语音信号的短时过零率小于第一设定阈值,且低中频短时能量比小于第三设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。第二方面,本公开还提供了基于时频特征的呼吸声检测系统;基于时频特征的呼吸声检测系统,包括:获取模块,其被配置为获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;分帧处理模块,其被配置为对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;特征提取模块,其被配置为对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;呼吸声第一检测模块,其被配置为如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。作为一个或多个实施例,所述系统,还包括:呼吸声第二检测模块,其被配置为如果当前帧语音信号的短时过零率小于第一设定阈值,且低中频短时能量比小于第三设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。与现有技术相比,本公开的有益效果是:本公开综合利用语音帧与带有呼吸声的语音帧之间的短时过零率、短时能量、高低频短时能量比等特征参数之间的差别,检测出语音中的呼吸声,并对呼吸声进行处理,从而对带有呼吸声的语音帧的抑制效果。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为第一个实施例的方法流程图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一,本实施例提供了基于时频特征的呼吸声检测方法;如图1所示,基于时频特征的呼吸声检测方法,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。作为一个或多个实施例,所述方法,还包括:如果当前帧语音信号的短时过零率小于第一设定阈值,且低中频短时能量比小于第三设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。作为一个或多个实施例,呼吸声进行消除采用置零法或削减法。作为一个或多个实施例,对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号,具体包括:按8kHz频率采样,每20ms,也就是160个语音样点构成一帧。应理解的,置零法是指将当前帧全部采样点进行置零操作;将呼吸声帧进行置零,公式如下:应理解的,削减法,即对当前帧幅值进行削减;将呼吸声帧的每个样点的幅值削弱为原来的1/8,约为9dB,公式如下:其中,Sin与Sout分别为输入的语音帧和输出的语音帧的能量。应理解的,短时过零率Zrc的计算过程为:其中,sgn[]是符号函数,即其中,i表示第i帧。应理解的,高低频短时能量比的计算过程为:其中,低频短时能量E0L为,其中,高频短时能量EOH为,应理解的,低中频短时能量比SEMLR的计算过程为:其中,中频短时能量E0M为,低频短时能量E0L为,进一步地,所述第一设定阈值为:60。进一步地,所述第二设定阈值为:0.1。进一步地,所述第三设定阈值为:5。本专利技术的特点主要是针对特殊环境下的语音通信中,呼吸声的存在使得经过语音编解码后的语音收听感觉非常差,会对地面接收人员的听力造成损伤。因此提出了一种基于时频特征的呼吸声检测算法,综合利用短时过零率、短时能量、高低频语音本文档来自技高网
...

【技术保护点】
1.基于时频特征的呼吸声检测方法,其特征是,包括:/n获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;/n对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;/n对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;/n如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。/n

【技术特征摘要】
1.基于时频特征的呼吸声检测方法,其特征是,包括:
获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;
对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;
对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;
如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。


2.如权利要求1所述的方法,其特征是,还包括:
如果当前帧语音信号的短时过零率小于第一设定阈值,且低中频短时能量比小于第三设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。


3.如权利要求1所述的方法,其特征是,呼吸声进行消除采用置零法或削减法。


4.如权利要求1所述的方法,其特征是,对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号,具体包括:按8kHz频率采样,每20ms,也就是160个语音样点构成一帧。


5.如权利要求3所述的方法,其特征是,置零法是指将当前帧全部采样点进行置零操作。


6.如权利要求3所述的方法,其特征是,削减法,即对当前帧幅值进行削减;将呼吸声帧的每个样点的...

【专利技术属性】
技术研发人员:李晔宫晓飞张杰张鹏
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1