集外词处理方法、电子设备和存储介质技术

技术编号：35781476 阅读：20 留言：0更新日期：2022-12-01 14:27

本发明专利技术公开一种集外词处理方法，本申请实施例提供了一种集外词处理的方法、装置及设备，方法包括：响应获取的集外词，将获取的集外词建立为第一建模单元序列，将集内词建立为第二建模单元序列，查找与所述第一建模单元序列语音相似度最高的第二建模单元序列，建立所述第一建模单元序列与第二建模单元序列的跳转关系。计算所述第一音素序列与所述集内词音素序列之间的编辑距离，将编辑距离最短的第二音素序列确定为相似度最高的音素序列，从而将集外词映射至集内词上。本申请实施例能够减少重新收集集外词相关的训练语料以及重新训练声学模型耗费的巨大时间成本，提高了集外词在相关场景中的转换率。关场景中的转换率。关场景中的转换率。

全部详细技术资料下载

【技术实现步骤摘要】
集外词处理方法、电子设备和存储介质

[0001]本专利技术属于语音识别领域，尤其涉及集外词处理方法的电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展，语音识别技术取得了巨大的进步，并开始进入家电、通信、汽车、医疗等各个领域。目前在语音识别领域里，工业界里还是使用声学模型加语言模型的架构较多，虽然模型都是基于大规模语料训练的，并且大多数语料也已经收录进了语言模型中，但是语言模型不可能穷尽任何语料，因此难免还是会存在没见过实际场景中的语料，存在声学中没有遇见到的建模单元序列，这类不存在于声学建模单元序列的词语称为集外词。对于人名，地名或者公司组织等集外词名词，语言模型很难迅速得到识别，因此模型的鲁棒性很差。由于这一类的词汇在声学语料中是很难完全概括，所以识别率会比较差。
[0003]在交叉语种的场合下，例如在国内英文场景中，语音中会经常涉及到国内的很多地名，人名，公司组织名，但是语料里根本没有这类的发音，因此导致这一类的词汇很难识别出来。因此需要一种专门识别地名、人名，公司组织名的特定方法或者装置，来迅速将这类特定集外词转换为集内词，从而达到相关场景中的集外词的识别率。

技术实现思路

[0004]本申请实施例的目的在于提供一种集外词处理方法、装置及设备，以提高相关场景中的集外词的识别率，具体技术方案如下：
[0005]第一方面，本专利技术提供集外词转换成集内词的方法，包括，响应于获取的集外词，建立所述集外词为第一单元序列，其中集内词也会有相应的建模单元序列，建立集内词为第...

【技术保护点】

【技术特征摘要】
1.一种集外词处理方法，包括：响应于获取的集外词，查找与所述集外词语音相似度最高的集内词；将所述集外词映射至所述集内词上。2.根据权利要求1所述的方法，其特征在于，所述响应于获取的集外词，查找与所述集外词语音相似度最高的集内词包括：响应于获取的集外词，将所述集外词转换成第一建模单元序列，其中，每一个集内词均具有对应的建模单元序列；查找与所述第一建模单元序列语音相似度最高的第二建模单元序列。3.根据权利要求2所述的方法，其特征在于，将所述集外词映射至所述集内词上包括：建立所述第一建模单元序列与所述第二建模单元序列的跳转关系。4.根据权利要求2所述的方法，其特征在于，所述查找与所述第一建模单元序列语音相似度最高的第二建模单元序列包括：将所述第一建模单元序列和发音词典中集内词的建模单元序列均输入至字素到音素映射模型以得到与所述第一建模单元序列对应的第一音素序列和与所述集内词的建模单元序列对应的集内词音素序列；计算所述第一音素序列与任一集内词音素序列的相似度以查找与所述第一音素序列语音相似度最高的第二音素序列，其中，所述第二音素序列对应第二建模单元。5.根据权利要求4所...

【专利技术属性】
技术研发人员：唐健，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人