一种语音信号相似度检测方法技术

技术编号：14777933 阅读：139 留言：0更新日期：2017-03-09 13:57

本发明专利技术公开了一种语音信号相似度检测方法，包括以下步骤：步骤1、将基准通道中基准语音信号和待测通道中待测语音信号均提取得到N段语音片段，对N段基准语音信号的语音片段和N段待测语音信号的语音片段分别进行排序，并使N段基准语音信号的语音片段与N段待测语音信号的语音片段一一对应；步骤2、逐一计算每段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度；步骤3、待N段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度均计算完成后，采用累积平均值计算方法计算累积相似度平均值。本发明专利技术应用时能提升检测待测通道相对于基准通道的语音相似度的准确率，进而便于在衡量待测通道性能方面进行推广应用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理
，具体是一种语音信号相似度检测方法。
技术介绍
音频是多媒体应用的一种重要媒体，人们能听见的音频信号的频率范围大约在20Hz～20kHz，而其中语音信号大约分布在300Hz～4kHz之内。在音频信号的传输过程中常常会涉及信号传输通道性能的检测，目前人们普遍通过检测待测通道与基准通道两者语音片段相似度来测试待测通道的性能。采用现有方式检测语音片段相似度时，受偶发性噪声干扰的影响，检测的准确率较低，衡量待测通道性能时参考意义不大。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供了一种语音信号相似度检测方法，其能提升检测待测通道相对于基准通道的语音相似度的准确率，进而便于在衡量待测通道性能方面进行推广应用。本专利技术的目的主要通过以下技术方案实现：一种语音信号相似度检测方法，包括以下步骤：步骤1、将基准通道中基准语音信号和待测通道中待测语音信号均提取得到N段语音片段，对N段基准语音信号的语音片段和N段待测语音信号的语音片段分别进行排序，并使N段基准语音信号的语音片段与N段待测语音信号的语音片段一一对应；其中，N为不小于2的整数；步骤2、逐一计算每段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度；步骤3、待N段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度均计算完成后，采用累积平均值计算方法计算累积相似度平均值。本专利技术通过对语音信号连续采集，获取连续片段，取片段相似度的累积算术平均值，以抵消偶发性噪声干扰。进一步的，所述步骤1中提取基准语音信号和待测语音信号两者的语音片段时包括以下步骤：步...
一种语音信号相似度检测方法

【技术保护点】
一种语音信号相似度检测方法，其特征在于，包括以下步骤：步骤1、将基准通道中基准语音信号和待测通道中待测语音信号均提取得到N段语音片段，对N段基准语音信号的语音片段和N段待测语音信号的语音片段分别进行排序，并使N段基准语音信号的语音片段与N段待测语音信号的语音片段一一对应；其中，N为不小于2的整数；步骤2、逐一计算每段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度；步骤3、待N段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度均计算完成后，采用累积平均值计算方法计算累积相似度平均值。

【技术特征摘要】
1.一种语音信号相似度检测方法，其特征在于，包括以下步骤：步骤1、将基准通道中基准语音信号和待测通道中待测语音信号均提取得到N段语音片段，对N段基准语音信号的语音片段和N段待测语音信号的语音片段分别进行排序，并使N段基准语音信号的语音片段与N段待测语音信号的语音片段一一对应；其中，N为不小于2的整数；步骤2、逐一计算每段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度；步骤3、待N段待测语音信号的语音片段及其对应的基准语音信号的语音片段的相似度均计算完成后，采用累积平均值计算方法计算累积相似度平均值。2.根据权利要求1所述的一种语音信号相似度检测方法，其特征在于，所述步骤1中提取基准语音信号和待测语音信号两者的语音片段时包括以下步骤：步骤1.1、分帧，其中，每帧语音信号对应一段语音片段；步骤1.2、加矩形窗形成加窗信号，计算短时平均过零率；步骤1.3、计算短时能量，并调整能量门限；步骤1.4、端点检测，并提取语音片段。3.根据权利要求2所述的一种语音信号相似度检测方法，其特征在于，所述步骤1.2中计算短时平均过零率的公式为：Zn=12Σm=-∞∞|sgn[x(m)]-sgn[x(m-1)]|]]>其中，Zn为短时平均过零率，m为经矩形窗处理后数据的索引，n为原始信号数据索引，x(m)为经过加窗处理后的信号。4.根据权利要求3所述的一种语音信号相似度检测方法，其特征在于，所述步骤1.3中计算短时能量的公式为：En=Σm=nn+Q-1x2(m)]]>其中，En为短时能量，Q为窗函数的长度。5.根据权利要求4所述的一种语音信号相似度检测方法，其特征在于，所述步骤1.3中调整能量门限的公式如下：其中，amp1为能量门限的上限值，amp2为能量门...

【专利技术属性】
技术研发人员：张洪英，张杰良，成立然，郑泽俊，
申请(专利权)人：成都普创通信技术股份有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人