【技术实现步骤摘要】
201610202416
【技术保护点】
一种语音识别方法,其特征在于,包括:获取用户的语音数据,并根据所述语音数据获取对应的语音文本;根据预设的语音文本识别模型,确定所述语音文本是否为口语文本;若所述语音文本为口语文本,则对所述语音文本进行归一化和标准化处理,生成规范化的语音文本;对所述规范化的语音文本,进行语义解析。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取用户的语音数据,并根据所述语音数据获取对应的语音文本;
根据预设的语音文本识别模型,确定所述语音文本是否为口语文本;
若所述语音文本为口语文本,则对所述语音文本进行归一化和标准化处
理,生成规范化的语音文本;
对所述规范化的语音文本,进行语义解析。
2.根据权利要求1所述的方法,其特征在于,所述语音文本识别模型包
括:口语文本集、规范文本集和第一映射关系;
其中,所述第一映射关系用于存储所述口语文本集和所述规范文本集中
每个特征量对应的语音文本为口语文本的概率,所述特征量包括特征词和/
或句式结构。
3.根据权利要求2所述的方法,其特征在于,所根据预设的语音文本识
别模型,确定所述语音文本是否为口语文本,包括:
获取所述语音文本的特征量;
根据所述第一映射关系,确定每个所述特征量对应的所述概率,并根据
所述概率计算所述语音文本为口语文本的复合概率;
根据所述复合概率,确定所述语音文本是否为口语文本。
4.根据权利要求3所述的方法,其特征在于,所述根据所述概率计算所
述语音文本为口语文本的复合概率,包括:
根据公式:
P(A|t1,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
计算所述语音文本的复合概率;
其中,P(A|t1,t2,t3……tn)为语音文本为口语文本的复合概率,t1,t2,…tn为
对应语音文本的n个特征量,P1,P2,…PN为分别以t1,t2,…tn为参考时,对应所述
语音文本为口语文本的概率。
5.根据权利要求4所述的方法,其特征在于,所述根据所述复合概率,
确定所述语音文本是否为口语文本,包括:
将所述复合概率与预设的阈值进行对比,若所述复合概率大于所述阈值,
则确定所述语音文本为口语文本;
若所述复合概率小于或等于所述阈值,则确定所述语音文本为规范文本。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述若所述语音
文本为口语文本,则对所述语音文本进行归一化和标准化处理,生成规范化
的语音文本,包括:
去除所述语音文本中口语化的语气词,并通过归一化处理,将所述语音
文本中口语化的特征词转化为规范化的特征词;
对所述语音文本的句式结构进行标准化处理,生成规范化的语音文本。
7.一种基于口语化的语音识别装置,其特征在于,包括:
获取模块,用于获取用户的语音数据,并根据所述语音数据获取对应的
语音文本;
确定模块,用于根据预设的语音文本识别模型,确定所述语音文本是否
为口语文...
【专利技术属性】
技术研发人员:王峰,陈仲帅,殷腾龙,
申请(专利权)人:海信集团有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。