本申请实施例提供了一种语音信号处理方法,通过将预设长度历史语音信号转换为第一频域信号;基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点;在所述第一频域信号存在所述备选基音频点的情况下,将所述第一频域信号中除所述备选基音频点对应的频点幅值置零,获得第二频域信号;基于所述第二频域信号确定目标浊音信号;根据所述目标浊音信号生成语音补偿信号。从频域层面对信号做分析,依据是浊音信号的准周期性,通过各频点浊音幅值确定浊音信号的频点,滤除不含浊音信号或浊音信号较弱的频点,能够尽可能地过滤掉噪声信号和清音信号,最终得到的浊音信号更接近真实情况,提高了浊音信号估计的准确性,并且计算量比较轻量,解决现有算法中语音信号丢包补偿计算量大的问题。法中语音信号丢包补偿计算量大的问题。法中语音信号丢包补偿计算量大的问题。
【技术实现步骤摘要】
语音信号处理方法、装置、系统及存储介质
[0001]本申请涉及语音信号处理
,尤其涉及一种语音信号处理方法、装置、系统及存储介质。
技术介绍
[0002]对网络语音通话而言,如果发生语音缓冲区中没有待播放的数据,就需要做丢包补偿,即用历史数据生成当前数据,否则,对端就会明显感觉到声音不连续。一般的丢包补偿方案都先通过历史的信号计算出信号的基音周期,然后用历史时刻的浊音信号来当作当前的浊音信号,再叠加清音信号和背景噪声作为语音信号输出。
[0003]由于计算基音周期时的数据信号还包含了清音信号和噪声,这会对结果造成一定的影响;另外相关计算量较大,会增加一定的系统开销。
[0004]另外,补充后数据包合并时期望的是浊音信号、清音信号,舒适背景噪声合并。但是无论如何,合并时所取的历史信号几乎不会只含有浊音,要么是既含有浊音、清音和背景噪音,要么就是只含有背景噪音,导致补偿效果较差。
技术实现思路
[0005]本申请实施例提供了一种语音信号处理方法、装置、系统及存储介质,可以解决现有的系统开销大和语音补偿效果差导致接收端接听准确率低的问题。
[0006]本申请实施例的第一方面提供了一种语音信号处理方法,包括:将预设长度历史语音信号转换为第一频域信号;基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点;在所述第一频域信号存在所述备选基音频点的情况下,将所述第一频域信号中除所述备选基音频点对应的频点幅值置零,获得第二频域信号;基于所述第二频域信号确定目标浊音信号;根据所述目标浊音信号生成语音补偿信号。
[0007]可选地,还包括:通过公式通过公式确定不同基音频率的对应的门限幅值,其中,为平滑因子,为第i个迭代值做FFT后第k个频点的幅值。
[0008]可选地,所述基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点,包括:选取频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点作为备选基音频点。
[0009]可选地,所述选取频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点作为备选基音频点,包括:在选取出的频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点大于或等于三个的情况下,选取频点浊音幅值最大的三个基音频点作为备选基音频点;在选取出的频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点小于三个的情况下,基于其余基音频点的频点浊音幅值由大到小排序,按照排序顺序将其余基音频点补充至所述备选基音频点以满足三个备选基音频点。
[0010]可选地,还包括:在所述第一频域信号不存在所述备选基音频点的情况下,根据所述背景舒适噪音生成语音补偿信号。
[0011]可选的,所述基于所述第二频域信号确定目标浊音信号,包括:将所述第二频域信号转换为备选时域信号;在所述备选时域信号中选取基音周期最长的信号作为目标浊音信号。
[0012]可选的,所述方法还包括:在所述语音补偿信号是根据所述背景舒适噪音生成的情况下,基于相邻语音信息生成整段语音的意思表达文字选项;获取用户基于所述意思表达文字选项的选择结果;将所述选择结果对应的意思表达文字发送至所述语音信息的接收端;和/或,在所述语音补偿信号是根据所述背景舒适噪音生成且发送端的语音信息接收完成的情况下,将包括所述语音补偿信号的语音信息在所述发送端播放。
[0013]本申请实施例第二方面提供了一种语音信号处理装置,包括:转换单元,用于将预设长度历史语音信号转换为第一频域信号;确定单元,用于基于不同基音频率的频点幅值确定第一频域信号中的备选基音频点;获得单元,用于在所述第一频域信号存在所述备选基音频点的情况下,将所述第一频域信号中除所述备选基音频点对应的频点幅值置零,获得第二频域信号;所述确定单元还用于基于所述第二频域信号确定目标浊音信号;生成单元,用于根据所述目标浊音信号生成语音补偿信号。
[0014]本申请实施例第三方面提供了一种电子系统,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述的数字模拟温度安全监控的步骤。
[0015]本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的语音信号处理方法的步骤。
[0016]综上,本申请实施例提供的语音信号处理方法,通过将预设长度历史语音信号转换为第一频域信号;基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点;在所述第一频域信号存在所述备选基音频点的情况下,将所述第一频域信号中除所述备选基音频点对应的频点幅值置零,获得第二频域信号;基于所述第二频域信号确定目标浊音信号;根据所述目标浊音信号生成语音补偿信号。从频域层面对信
号做分析,依据是浊音信号的准周期性,通过各频点浊音幅值确定浊音信号的频点,滤除不含浊音信号或浊音信号较弱的频点,能够尽可能地过滤掉噪声信号和清音信号,最终得到的浊音信号更接近真实情况,提高了浊音信号估计的准确性,并且计算量比较轻量,解决现有算法中语音信号丢包补偿计算量大的问题。
[0017]相应地,本专利技术实施例提供的语音信号处理装置、电子系统和计算机可读存储介质,也同样具有上述技术效果。
附图说明
[0018]图1为本申请实施例提供的一种可能的语音信号处理方法的流程示意图;图2为本申请实施例提供的一种可能的语音信号处理装置的示意性结构框图;图3为本申请实施例提供的一种可能的语音信号处理装置的硬件结构示意图;图4为本申请实施例提供的一种可能的电子系统的示意性结构框图;图5为本申请实施例提供的一种可能的计算机可读存储介质的示意性结构框图。
具体实施方式
[0019]本申请实施例提供了一种语音信号处理方法、装置、系统及存储介质,可以解决现有的系统开销大和语音补偿效果差导致接收端接听准确率低的问题。
[0020]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
[0021]在一些示例中,在第一次发生语音信息丢包的情况下,可以取历史数据(30毫秒外加少量额外数据)做基音周期检测,基音周期检测采用求相关值的方法,然后再做微调,获取基音周期,并保存,并根据历史信号计算算法本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括:将预设长度历史语音信号转换为第一频域信号;基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点;在所述第一频域信号存在所述备选基音频点的情况下,将所述第一频域信号中除所述备选基音频点对应的频点幅值置零,获得第二频域信号;基于所述第二频域信号确定目标浊音信号;根据所述目标浊音信号生成语音补偿信号。2.根据权利要求1所述的方法,其特征在于,还包括:通过公式确定不同基音频率的对应的门限幅值,其中,为平滑因子,为第i个迭代值做FFT后第k个频点的幅值。3.根据权利要求1所述的方法,其特征在于,所述基于不同基音频率的频点浊音幅值和对应的门限幅值确定第一频域信号中的备选基音频点,包括:选取频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点作为备选基音频点。4.根据权利要求3所述的方法,其特征在于,所述选取频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点作为备选基音频点,包括:在选取出的频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点大于或等于三个的情况下,选取频点浊音幅值最大的三个基音频点作为备选基音频点;在选取出的频点浊音幅值和/或整数倍频点浊音幅值大于所述对应的门限幅值的基音频点小于三个的情况下,基于其余基音频点的频点浊音幅值由大到小排序,按照排序顺序将其余基音频点补充至所述备选基音频点以满足三个备选基音频点。5.根据权利要求1所述的方法,其特征在于,还包括:在所述第一频域信号不存在所述备选基音频点的情况下,根据背景舒适噪音生成语...
【专利技术属性】
技术研发人员:张斌,易鑫,
申请(专利权)人:北京汇金春华科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。