一种病人虚弱语音端点检测方法技术

技术编号：8656500 阅读：181 留言：0更新日期：2013-05-02 00:15

本发明专利技术公开一种病人虚弱语音端点检测方法，包括以下步骤：将语音信号转换为图像，对此图像进行拉伸和放大，将拉伸和放大后的图像转换成二值图像；对语音信号的波形包络所在区域进行开操作，即其中Θ为腐蚀，为膨胀，再取边界β(A)；β(A)＝A-A(AΘB)进一步取波形轮廓，其中取边界β(A)为一个像素点；使用平滑滤波器h(x)对信号进行滤波，得到其中为卷积；对g(x)求两阶导数以检测边缘点；找到音频最高点，搜索最高点两边的店，将前点和后点比较，若前点小于后点，则认为此最高点两边的两个点分别为词或音节的起始和结束点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音通信领域，具体涉及。
技术介绍
未来人机交互最基本、最重要的手段是语音，而语音识别与合成是促使其普及发展的最关键技术。因此对语音识别的关键技术研究变的尤为重要。语音识别主要包括:语言特征提取、模式匹配和语言模型处理，其研究的对象分别是:语言特征序列、识别算法和语法语义分析。其中的关键技术有:端点检测，动态时间规整(DTW)，隐形马尔科夫模型(HMM),人工神经网络(ANN)等。端点检测通常依据的语音特征有短时能量、过零率、LPC距离、频谱熵、倒谱特征、TF参数、分形特征以及几种参数相结合，例如能零积、能零比、频能比、对数能量谱熵、子带谱熵、能频值等，但是这些参数性能过于单一，在低信噪比的条件下很难满足实际的需求。传统的端点检测特征参数LPC距离、倒谱特征、TF参数和分形特征等参数计算量太大，对硬件要求很高，阻碍了人机交互技术在日常生活中的普及适用。
技术实现思路
本专利技术提出，通过对语音信号波形的图像，或语音信号的频谱图像，包括时域的包络图像进行图像处理，运用图像处理中对图像轮廓边缘的检测，进行端点检测。本专利技术的技术方案是:，包括以下步骤:将语音信号转换为图像，对此图像进行拉伸和放大，将拉伸和放大后的图像转换成二值图像；对语音信号的波形包络所在区域进行开操作，即= 十B，其中Θ为腐蚀，为膨胀，再取边界β (A)；β (A) = A-A(AOB)进一步取波形轮廓，其中取边界β (A)为一个像素点；使用平滑滤波器h (x)对信号进行滤波，得到丨办)=fix) /φν)，其中为卷积；对g(x)求两阶导数以检测边缘点；找到音频最高点，搜...

【技术保护点】
一种病人虚弱语音端点检测方法，其特征在于，包括以下步骤：将语音信号转换为图像，对此图像进行拉伸和放大，将拉伸和放大后的图像转换成二值图像；对语音信号的波形包络所在区域进行开操作，即其中Θ为腐蚀，为膨胀，再取边界β(A)；β(A)＝A?A(AΘB)进一步取波形轮廓，其中取边界β(A)为一个像素点；使用平滑滤波器h(x)对信号进行滤波，得到其中为卷积；对g(x)求两阶导数以检测边缘点；找到音频最高点，搜索最高点两边的店，将前点和后点比较，若前点小于后点，则认为此最高点两边的两个点分别为词或音节的起始和结束点。FDA00002696890100011.jpg,FDA00002696890100012.jpg,FDA00002696890100013.jpg,FDA00002696890100014.jpg

【技术特征摘要】
1.一种病人虚弱语音端点检测方法，其特征在于，包括以下步骤: 将语音信号转换为图像，对此图像进行拉伸和放大，将拉伸和放大后的图像转换成二值图像；对语音信号的波形包络所在区域进行开操作，即』。Β = 十/ ，其中Θ为腐蚀，Φ为膨胀，再取边界β (A)； β (A) =A-A(AOB)进一步取波形轮廓...

【专利技术属性】
技术研发人员：尹岩岩，殷业，肖龙，关吉萍，
申请(专利权)人：上海师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人