语音识别文本的纠错方法和装置制造方法及图纸

技术编号：11191608 阅读：158 留言：0更新日期：2015-03-25 20:14

本发明专利技术实施例公开了一种语音识别文本的纠错方法和装置。所述语音识别文本的纠错方法包括：根据语音识别的结果文本的多层次K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本，确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵，根据确定的模糊音编辑距离矩阵获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界，根据所述至少一个候选纠错文本分别对应的模糊音编辑距离选取纠错文本，并根据所述纠错文本所对应的候选纠错边界对所述结果文本进行纠错。本发明专利技术实施例提供的语音识别文本的纠错方法和装置实现了对语音识别结果文本的准确纠错。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别文本的纠错方法和装置
本专利技术实施例涉及语音识别
，尤其涉及一种语音识别文本的纠错方法和装置。
技术介绍
随着语音识别技术的日臻成熟，语音识别的应用领域也越来越广泛。相对于其他的文本输入方式，语音识别所实现的语音输入方式更为符合人们的日常习惯，也使得输入过程更为高效。可以预计，语音识别技术将广泛应用于工业生产、通信、医疗、家政服务等多个领域。在语音识别技术的实际应用中，由于周围噪音、方言等因素的影响，语音识别的识别结果往往与用户的输入不一致。尤其在日常口语场景下，语音识别的识别错误更为普遍。而现有技术中缺乏对识别错误的纠错手段，因而影响了语音识别技术的进一步推广。
技术实现思路
有鉴于此，本专利技术实施例提出一种语音识别文本的纠错方法和装置，以对语音识别的结果文本进行准确的纠错。第一方面，本专利技术实施例提供了一种语音识别文本的纠错方法，所述方法包括：根据语音识别的结果文本的多层次K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本；确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵；根据确定的模糊音编辑距离矩阵获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界；根据所述至少一个候选纠错文本分别对应的模糊音编辑距离选取纠错文本，并根据所述纠错文本所对应的候选纠错边界对所述结果文本进行纠错。第二方面，本专利技术实施例还提供了一种语音识别文本的纠错装置，所述装置包括： ...
语音识别文本的纠错方法和装置

【技术保护点】
一种语音识别文本的纠错方法，其特征在于，包括：根据语音识别的结果文本的多层次K‑Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本；确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵；根据确定的模糊音编辑距离矩阵获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界；根据所述至少一个候选纠错文本分别对应的模糊音编辑距离选取纠错文本，并根据所述纠错文本所对应的候选纠错边界对所述结果文本进行纠错。

【技术特征摘要】
1. 一种语音识别文本的纠错方法，其特征在于，包括：根据语音识别的结果文本的多层次K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本. 确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵；根据确定的模糊音编辑距离矩阵获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界；根据所述至少一个候选纠错文本分别对应的模糊音编辑距离选取纠错文本，并根据所述纠错文本所对应的候选纠错边界对所述结果文本进行纠错。2. 根据权利要求1所述的方法，其特征在于，根据语音识别的结果文本的多层次 K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本包括：根据汉字层次、拼音音节层次、全拼或简拼层次或者声母韵母层次的K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个非模板候选纠错文本。3. 根据权利要求2所述的方法，其特征在于，确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵包括：对于拉取到的每个非模板候选纠错文本，将初始化的模糊音编辑距离矩阵中替换操作对应元素的取值，设置为所述元素所对应的当前非模板候选纠错文本中的字符与所述元素所对应的结果文本中的字符之间的模糊音相似度；根据动态规划算法确定所述模糊音编辑距离矩阵中的非替换操作对应元素的取值，得到当前非模板候选纠错文本与所述结果文本之间的模糊音编辑距离矩阵。4. 根据权利要求2所述的方法，其特征在于，获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界包括：对于确定的每个模糊音编辑距离矩阵，通过路径回溯获取当前模糊音编辑距离矩阵的模糊音编辑距离及对应的候选纠错边界；将当前模糊音编辑距离矩阵的模糊音编辑距离及对应的候选纠错边界，作为当前模糊音编辑距离矩阵对应的非模板候选纠错文本与所述结果文本之间的模糊音编辑距离及候选纠错边界。5. 根据权利要求1所述的方法，其特征在于，根据语音识别的结果文本的多层次 K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本包括：根据汉字层次、拼音音节层次、全拼或简拼层次或者声母韵母层次的K-Gram索引，拉取用于对所述结果文本进行纠错的至少一个候选纠错文本；识别每个候选纠错文本中包含的专有名词，并使用通配符替换所述专有名词，W得到至少一个模板候选纠错文本。6. 根据权利要求5所述的方法，其特征在于，确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵包括：对于拉取到的每个模板候选纠错文本，将初始化的模糊音编辑距离矩阵中替换操作对应元素的取值，设置为所述元素所对应的当前模板候选纠错文本中的字符与所述元素所对应的结果文本中的字符之间的模糊音相似度；根据动态规划算法确定所述模糊音编辑距离矩阵中的非替换操作对应元素的取值，得到当前模板候选纠错文本与所述结果文本之间的模糊音编辑距离矩阵。7. 根据权利要求5所述的方法，其特征在于，获取所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离及候选纠错边界包括：对于确定的每个模糊音编辑距离矩阵，通过路径回溯获取当前模糊音编辑距离矩阵的模糊音编辑距离及对应的候选纠错边界；确定当前模糊音编辑距离矩阵的模糊音编辑距离，与当前模糊音编辑距离矩阵对应的模板候选纠错文本中的通配符所对应的编辑距离之间的差值；将所述差值作为当前模糊音编辑距离矩阵对应的模板候选纠错文本与所述结果文本之间的模糊音编辑距离。8. 根据权利要求1所述的方法，其特征在于，在拉取用于对所述结果文本进行纠错的至少一个候选纠错文本之后，确定所述至少一个候选纠错文本分别与所述结果文本之间的模糊音编辑距离矩阵之前，还包括：根据用户的所在地点或者经常经过地点，对所述至少一个候选纠错文本进行筛选，W 筛选出与用户相关的至少一个地名性候选纠错文本。9. 根据权利要求1所述的方法，其特征在于，根据所述至少一个候选纠错文本分别对应的模糊音编辑距离选取纠错文本包括：若所述至少一个候选纠错文本的个数大于一个，则选择所述至少一个候选纠错文本中模糊音编辑距离最小的一个作为纠错文本；若所述至少一个候选纠错文本的个数为一个，则依据预先设定的模糊音编辑距离阔值和该候选纠错文本的模糊音编辑距离的大小关系，判断是否将所述候选纠错文本作为纠错文本。10. -种语音识...

【专利技术属性】
技术研发人员：时迎超，周晓，张海雷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人