一种智能语音处理方法技术

技术编号：10070806 阅读：251 留言：0更新日期：2014-05-23 15:23

本发明专利技术一种智能语音处理方法，属于信息处理技术领域，本发明专利技术通过建立对话人声音模型库，实现在多人语音环境下智能识别多个对话人的身份同时分离混合语音得到每个对话人的独立语音，根据用户需求为用户放大要听取的对话人的语音同时消除非用户要求的对话人的语音；与传统助听器不同，该方法可以根据用户个人需求从而自动为用户提供其所需的声音，减少了除噪音外的非目标人声的干扰，体现了该方法的个性化、互动化和智能化。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术，属于信息处理
，本专利技术通过建立对话人声音模型库，实现在多人语音环境下智能识别多个对话人的身份同时分离混合语音得到每个对话人的独立语音，根据用户需求为用户放大要听取的对话人的语音同时消除非用户要求的对话人的语音；与传统助听器不同，该方法可以根据用户个人需求从而自动为用户提供其所需的声音，减少了除噪音外的非目标人声的干扰，体现了该方法的个性化、互动化和智能化。【专利说明】
本专利技术属于信息处理
，具体涉及。
技术介绍
据2013年世界卫生组织(WHO)发布的最新评估数据显示，全球目前共有3.6亿人存在不同程度的听力障碍，占全球总人口的5%。助听产品的使用可以有效地补偿听力障碍患者的听力损失，提高他们的生活和工作质量。然而，当今助听系统相关技术的研究仍然集中在噪声抑制和源声音幅值放大两个方面，很少涉及到基于声音特征的建模和多声源自动分离技术。当实际应用场景非常复杂时，例如:聚会时，多个说话人同时发声，甚至是伴有音乐等背景声音，由于助听系统无法从混合后的声音输入中分离出感兴趣的声音对象，简单的声音强度扩大功能只能增加使用者的听力负担甚至伤害，不会带来有效的声音输入和理解。因此，针对当前助听系统的技术缺陷，设计一款具有特定声音对象识别功能的、更加智能化和个性化的新型助听系统，具有非常重要的意义。
技术实现思路
针对现有技术存在的不足，本专利技术提出，以达到保证用户根据自己的需求获得纯净的声音接收和放大，实现助听系统的智能化、互动化和个性化的目的。，包括以下步骤:步骤1、采集样本语音段构建样本语音库，对样本语音...

【技术保护点】
一种智能语音处理方法，其特征在于，包括以下步骤：步骤1、采集样本语音段构建样本语音库，对样本语音进行特征提取，获得特征参数，并对特征参数进行训练；具体过程如下：步骤1‑1、采集样本语音段，将采集的语音段进行离散化处理，提取语音信号的梅尔频率倒谱系数作为语音信号特征参数，并建立高斯混合模型；模型公式如下：p(XIG)=Σi=1Mpibi(X)---(1)]]>其中，p(XIG)表示样本语音特征参数在模型参数为G的模型中的概率；G表示高斯混合模型参数集，G＝{pi，μi，∑i}，i＝1，2，...，I；I表示高斯混合模型中单一高斯模型个数；pi表示第i个单一高斯模型的权重系数，μi表示第i个单一高斯模型的均值矢量；∑i表示第i个单一高斯模型的协方差矩阵；X表示样本语音特征参数，X＝{x1，x2，...，xT}，T表示特征向量的个数；bi(X)表示第i个单一高斯模型的密度函数，bi(X)＝N(μi，∑i)，N(.)表示标准高斯分布的密度函数；步骤1‑2、利用语音信号特征参数训练高斯混合模型；即采用k均值聚类算法对语音信号特征参数进行聚类，获得高斯混合模型参数集初始值G0＝{pi0...

【技术特征摘要】

【专利技术属性】
技术研发人员：王义，魏阳杰，陈瑶，关楠，
申请(专利权)人：东北大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人