The invention discloses a method for improving speech recognition accuracy in noisy environments, the method comprises the following steps: the first step: get the recognition results from the recognition of cloud platform; the second step: the recognition results quickly translated into Pinyin; the third step: query the database configuration table, pinyin translation for business writing; the fourth step that will return to the application of text translation. The invention has the beneficial effect that the invention provides a method for effectively improving the speech recognition rate in noisy environment, which can greatly improve the recognition rate under the noisy environment with very little cost. Through the implementation of the customized conversion of the Pinyin approximate tone, the recognition rate of command words in noisy environment is significantly improved, and the workload of the maintenance of the code and the data dictionary is greatly reduced.
【技术实现步骤摘要】
一种提高嘈杂环境下语音识别率的方法
本专利技术属于语音识别
,主要是一种提高嘈杂环境下语音识别率的方法。
技术介绍
目前语音识别技术日渐成熟并应用在各个领域。如手机上的各种语音搜索应用、语音发短信、对话聊天软件、语音导航软件等等。这些应用都是借助语音识别技术将语音转换为文字,大大降低了人们使用软件时输入的工作量。当前语音识别技术在提高人们使用便利性的同时,也存在一些问题。如在办公室内、家里和其它安静的场合,识别率都非常高;但在比较嘈杂的公共场合环境,识别率就直线跳水,非常低了。识别率变低的原因就是环境噪音和使用者的声音进行了叠加,对识别软件造成了干扰。如在公共场合某些支持语音搜索的自助设备,当客户说需要的酒店区域的时候,由于噪音的叠加,真实需要的区域“三墩”也许会被它理解为“山东”、“山洞”、甚至“汕头”。针对这个问题,许多语音识别系统也有一些优化方案,如可以上传本地的热词表到云端识别系统,让“三墩”这个地名优先被匹配;或者应用软件自己做区分,将识别到的“山东”,“汕头”强制转化为“三墩”。热词表的方案,其实解决的是同音词的问题。比如说“三墩”这个音,由于该地名比较生僻,如果不加该热词,可能会被识别为“三吨”或者“三顿”。这些词发音完全一致,加上热词“三墩”,就是告诉识别云平台,遇到这个音要优先选择热词“三顿”。所以该方案只能较好得解决同音词的问题,如果识别声音源本身受到了干扰,发生了变形,则还是会被识别为其它常见近似语音,如“山东”。应用软件自己强制转换的方案,在一定程度上是可行的,只要在代码里或者数据字典里做好识别词组的翻译即可。如在某包含“三墩 ...
【技术保护点】
一种提高嘈杂环境下语音识别率的方法,其特征在于:该方法包括如下步骤:第一步:从识别云平台取得识别结果;第二步:将识别结果快速翻译为拼音;第三步:查询数据库配置表,将拼音翻译为业务需要的文字;第四步:将翻译后的文字返回给应用程序。
【技术特征摘要】
1.一种提高嘈杂环境下语音识别率的方法,其特征在于:该方法包括如下步骤:第一步:从识别云平台取得识别结果;第二步:将识别结果快速翻译为拼音;第三步:查询数据库配置表,将拼音翻译为业务需要的文字;第四步:将翻译后的文字返回给应用程序。2.根据权利要求1所述的提高嘈杂环境下语音识别率的方法,其特征在于:在第二步中:(1)、根据汉字的GBK编码为索引做一个汉字和拼音的映射表,根据汉字的GBK编码直接定位到汉字的拼音;(2)、一个汉字的GBK编码由2个字节组成,分为首字节和末字节,首字节从0xB0到0xF7,末字节从0xA1到0xFE;设计一个汉字拼音映射二维数组pytable,第一行存储“首字节是0xB0的汉字组”的拼音,第二行存储“首字节是0xB1的汉字组”的拼音,以此类推,最后一行存储“首字节是0xF7的汉字组”的拼音;每一组里再按“末字节”编码的顺序存储;(3)、将汉字串快速翻译为拼...
【专利技术属性】
技术研发人员:范晨,
申请(专利权)人:杭州仁盈科技股份有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。