语音识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：29258368 阅读：12 留言：0更新日期：2021-07-13 17:31

本发明专利技术提供一种语音识别方法、装置、电子设备和存储介质，其中方法包括：确定用户的待识别语音；基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。本发明专利技术提供的语音识别方法、装置、电子设备和存储介质，基于当前用户的地域信息和/或历史输入信息动态扩充解码网络中的预设状态转移路径，从而基于扩充后的预设状态转移路径对该用户的待识别语音进行语音识别解码，利用该用户的个性化信息，提升了个性化语音识别的准确性，且动态扩充预设状态转移路径的方式，增强了实用性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备和存储介质
本专利技术涉及语音处理
，尤其涉及一种语音识别方法、装置、电子设备和存储介质。
技术介绍
随着人工智能技术的迅速发展，语音识别技术在智能家居、智能机器人等交互领域得到了广泛应用。由于语音识别使用用户的不断增多，用户之间发音习惯的差异性亦趋明显，导致通用的语音识别方法无法对所有用户均取得较好的识别效果。现有的语音识别方法，为了实现针对各用户的个性化语音识别，从而提高语音识别准确性，通常会基于某一用户大量的历史语音数据构建针对该用户的个性化语音识别系统。然而，该方式的优化效果有限，且部署维护难度大，实用性较差。
技术实现思路
本专利技术提供一种语音识别方法、装置、电子设备和存储介质，用以解决现有技术中语音识别优化效果欠佳、实用性不足的缺陷。本专利技术提供一种语音识别方法，包括：确定用户的待识别语音；基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。根据本专利技术提供一种的语音识别方法，所述基于预设状态转移路径，对所述待识别语音进行语音识别解码，包括：确定所述待识别语音对应的音素序列；基于上一解码位置对应的预设状态转移路径，对当前解码位置处的音素序列进行解码，得到当前解码位置处的解码结果。根据本专利技术提供的一种语音识别方法，所述预设状态转移路径是基于如下步骤扩充的：确定与所述用户的地域信息...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n确定用户的待识别语音；/n基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
确定用户的待识别语音；
基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。

2.根据权利要求1所述的语音识别方法，所述基于预设状态转移路径，对所述待识别语音进行语音识别解码，包括：
确定所述待识别语音对应的音素序列；
基于上一解码位置对应的预设状态转移路径，对当前解码位置处的音素序列进行解码，得到当前解码位置处的解码结果。

3.根据权利要求1所述的语音识别方法，所述预设状态转移路径是基于如下步骤扩充的：
确定与所述用户的地域信息相关联的地域名词；
基于各地域名词扩充解码网络中地名对应的预设状态转移路径。

4.根据权利要求2所述的语音识别方法，所述预设状态转移路径是基于如下步骤扩充的：
基于所述用户的历史输入信息，确定当前解码位置处的音素序列对应的相似热词；
基于所述相似热词，扩展上一解码位置对应的预设状态转移路径。

5.根据权利要求4所述的语音识别方法，所述基于所述用户的历史输入信息，确定当前解码位置处的音素序列对应的相似热词，包括：
基于当前解码位置处的音素序列以及预先构建的发音相似矩阵，确定当前解码位置处的音素序列对应的相似音素序列；
基于所述用户的各个热词，确定与当前解码位置处的音素序列和/或所述相似音素序列对应的相似热词；所述热词是基于所述...

【专利技术属性】
技术研发人员：方昕，刘俊华，潘志兵，周传福，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人