The invention discloses a breath sound detection method, system, equipment and medium based on time-frequency characteristics, including: acquiring a voice signal to be detected; the voice signal to be detected is a voice signal sent by a flight crew on an aircraft at a high altitude and transmitted to a ground receiver; the voice signal to be detected is processed by windowing and framing to obtain a number of frame voice signals Feature extraction is carried out for each frame of speech signal to extract short-time zero crossing rate, high and low frequency short-time energy ratio and low if short-time energy ratio; if the short-time zero crossing rate of the current frame of speech signal is greater than the first set threshold, and the high and low frequency short-time energy ratio is greater than the second set threshold, then the current frame of speech signal is judged as respiratory sound, and the respiratory sound is eliminated. Using the characteristic parameters such as short-time zero crossing rate, short-time energy, high and low frequency short-time energy ratio, the breath sound in the transmission voice is detected, and the detected breath sound is post processed to improve the hearing effect.
【技术实现步骤摘要】
基于时频特征的呼吸声检测方法、系统、设备及介质
本公开涉及语音信号处理
,特别是涉及基于时频特征的呼吸声检测方法、系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。随着通信技术的快速发展,用户对话音质量的要求越来越高。在很多特殊的通讯场合,除了正常传输的语音之外,往往会受到一些背景噪声或特殊声音的干扰。例如,当飞行员在高空飞行时,大气压力较地面标准大气压力要高出几倍,飞行员与地面通信时需要进行大量的换气,导致话音信号中会含有大量较强的呼吸声,呼吸声经过语音编解码后会收听感觉非常差,且会对地面接收人员的听力造成损伤。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:对呼吸声的检测不够精准,容易将非呼吸声的语音信号也被误检测出来,影响地面人员对语音信号的捕捉;对呼吸声的检测过程复杂,需要提取复杂的信号特征,检测过程浪费时间,难以保证地面通信员对语音信号捕捉的实时性要求。
技术实现思路
为了解决现有技术的不足,本公开提供了基于时频特征的呼吸声检测方法、系统、设备及介质;综合利用短时过零率、短时能量、高低频短时能量比等特征参数,检测传输语音中的呼吸声,并对检测到的呼吸声进行后处理,改善听觉效果。第一方面,本公开提供了基于时频特征的呼吸声检测方法;基于时频特征的呼吸声检测方法,包括:获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的 ...
【技术保护点】
1.基于时频特征的呼吸声检测方法,其特征是,包括:/n获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;/n对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;/n对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;/n如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。/n
【技术特征摘要】
1.基于时频特征的呼吸声检测方法,其特征是,包括:
获取待检测的语音信号;所述待检测的语音信号是由飞行在高空的飞机上的工作人员发出的,且传输给地面接收员的语音信号;
对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号;
对每一帧语音信号进行特征提取,提取短时过零率、高低频短时能量比和低中频短时能量比;
如果当前帧语音信号的短时过零率大于第一设定阈值,且高低频短时能量比大于第二设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。
2.如权利要求1所述的方法,其特征是,还包括:
如果当前帧语音信号的短时过零率小于第一设定阈值,且低中频短时能量比小于第三设定阈值;则判定当前帧语音信号为呼吸声,对呼吸声进行消除。
3.如权利要求1所述的方法,其特征是,呼吸声进行消除采用置零法或削减法。
4.如权利要求1所述的方法,其特征是,对待检测的语音信号进行加窗分帧处理,得到若干帧语音信号,具体包括:按8kHz频率采样,每20ms,也就是160个语音样点构成一帧。
5.如权利要求3所述的方法,其特征是,置零法是指将当前帧全部采样点进行置零操作。
6.如权利要求3所述的方法,其特征是,削减法,即对当前帧幅值进行削减;将呼吸声帧的每个样点的...
【专利技术属性】
技术研发人员:李晔,宫晓飞,张杰,张鹏,
申请(专利权)人:山东省计算中心国家超级计算济南中心,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。