一种语音识别方法及装置制造方法及图纸

技术编号：13372439 阅读：48 留言：0更新日期：2016-07-19 22:14

本发明专利技术实施例提供一种基于口语化的语音识别方法及装置，其中，该方法包括：获取语音文本；根据预设的语音文本识别模型，确定所述语音文本是否为口语文本；若所述语音文本为口语文本，则对所述语音文本进行归一化和标准化处理，生成规范化的语音文本；对所述规范化的语音文本，进行语义解析。本发明专利技术实施例提供的基于口语化的语音识别方法及装置，解决了现有技术无法对口语文本进行识别的问题，提高了用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
201610202416

【技术保护点】
一种语音识别方法，其特征在于，包括：获取用户的语音数据，并根据所述语音数据获取对应的语音文本；根据预设的语音文本识别模型，确定所述语音文本是否为口语文本；若所述语音文本为口语文本，则对所述语音文本进行归一化和标准化处理，生成规范化的语音文本；对所述规范化的语音文本，进行语义解析。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
获取用户的语音数据，并根据所述语音数据获取对应的语音文本；
根据预设的语音文本识别模型，确定所述语音文本是否为口语文本；
若所述语音文本为口语文本，则对所述语音文本进行归一化和标准化处
理，生成规范化的语音文本；
对所述规范化的语音文本，进行语义解析。
2.根据权利要求1所述的方法，其特征在于，所述语音文本识别模型包
括：口语文本集、规范文本集和第一映射关系；
其中，所述第一映射关系用于存储所述口语文本集和所述规范文本集中
每个特征量对应的语音文本为口语文本的概率，所述特征量包括特征词和/
或句式结构。
3.根据权利要求2所述的方法，其特征在于，所根据预设的语音文本识
别模型，确定所述语音文本是否为口语文本，包括：
获取所述语音文本的特征量；
根据所述第一映射关系，确定每个所述特征量对应的所述概率，并根据
所述概率计算所述语音文本为口语文本的复合概率；
根据所述复合概率，确定所述语音文本是否为口语文本。
4.根据权利要求3所述的方法，其特征在于，所述根据所述概率计算所
述语音文本为口语文本的复合概率，包括：
根据公式：
P(A|t1,t2,t3……tn)＝(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
计算所述语音文本的复合概率；
其中，P(A|t1,t2,t3……tn)为语音文本为口语文本的复合概率，t1,t2,…tn为
对应语音文本的n个特征量，P1,P2,…PN为分别以t1,t2,…tn为参考时，对应所述
语音文本为口语文本的概率。
5.根据权利要求4所述的方法，其特征在于，所述根据所述复合概率，
确定所述语音文本是否为口语文本，包括：
将所述复合概率与预设的阈值进行对比，若所述复合概率大于所述阈值，
则确定所述语音文本为口语文本；
若所述复合概率小于或等于所述阈值，则确定所述语音文本为规范文本。
6.根据权利要求1-5任一项所述的方法，其特征在于，所述若所述语音
文本为口语文本，则对所述语音文本进行归一化和标准化处理，生成规范化
的语音文本，包括：
去除所述语音文本中口语化的语气词，并通过归一化处理，将所述语音
文本中口语化的特征词转化为规范化的特征词；
对所述语音文本的句式结构进行标准化处理，生成规范化的语音文本。
7.一种基于口语化的语音识别装置，其特征在于，包括：
获取模块，用于获取用户的语音数据，并根据所述语音数据获取对应的
语音文本；
确定模块，用于根据预设的语音文本识别模型，确定所述语音文本是否
为口语文...

【专利技术属性】
技术研发人员：王峰，陈仲帅，殷腾龙，
申请(专利权)人：海信集团有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人