语音识别文本的纠错方法与装置制造方法及图纸

技术编号:15642641 阅读:291 留言:0更新日期:2017-06-16 16:12
本申请提供一种语音识别文本的纠错方法与装置,用于解决现有技术下语音识别文本的纠错方法复杂、资源消耗大、不适合在语音识别设备中使用的问题。本申请的技术方案不同于传统的对语音识别文本先分词,再进行纠错评估的纠错方式,而是采用直接纠错再评估的方法,大幅降低了对外部资源数据的依赖性,减轻了系统计算负担,而且也更有针对性地提高了用户语音控制指令的识别率。

【技术实现步骤摘要】
语音识别文本的纠错方法与装置
本申请涉及语音识别领域,具体为一种语音识别文本的纠错方法与装置。
技术介绍
随着语音识别技术的发展,很多企业开始提供第三方语音识别服务,在此基础上,越来越多的电子设备开始支持智能语音控制。然而在实际应用中,由于受周围噪音、个人发音差异等因素的影响,语音识别的文本结果往往与用户语音输入不一致,这势必会影响此后的文本分词、语义分析、语法分析等一系列自然语言处理任务。因此,如果能够智能地对语音识别后的文本进行分析,有针对性的查找、定位出错词并进行纠正,必将有效提高语音识别的准确率。近年来,国内外学者提出了一系列语音识别后的文本校验与纠错方法,包括:基于N-Gram模型、基于混淆矩阵、基于自定义语法规则等方法。然而这些方法大都面向通用自然语言的语音识别文本,方法涉及的场景及方法自身较复杂,并且对计算、存储和系统资源的消耗也很大,不适合在资源有限的语音识别设备中使用。同时语音控制设备中的应用也具有一定的特殊性,如:用户可以自定义设备名、语音控制指令一般较短、口语表述具有多样性、语音识别文本更容易出现缺字、多字现象等等。因此,现有语音识别文本的纠错方法并不完全适用于语音控制设备中的应用。申请内容本申请的目的是提供一种语音识别文本的纠错方法与装置,用于解决现有技术下语音识别文本的纠错方法复杂、资源消耗大、不适合在语音识别设备中使用的问题,实现外部依赖资源的减少、系统负担的降低和语音控制指令识别准确率的提高。根据本申请的一个方面,提供了一种语音识别文本的纠错方法,该方法包括:获取语音识别文本;根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录;输出所述语音识别文本对应的纠错记录。进一步地,根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录,包括:根据所述候选纠错文本在所述语音识别文本中进行匹配,以确定所述语音识别文本中,是否存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本;在所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本时,根据所述匹配文本生成语音识别文本对应的纠错记录。进一步地,根据所述候选纠错文本在所述语音识别文本中进行匹配,包括:采用基于编辑距离模型的模式匹配算法,并根据所述候选纠错文本在所述语音识别文本中进行匹配。进一步地,采用基于编辑距离模型的模式匹配算法,并根据所述候选纠错文本在所述语音识别文本中进行匹配,包括:计算所述候选纠错文本与所述语音识别文本中的匹配文本之间的编辑距离;根据所述编辑距离与所述候选纠错文本的长度,获取所述候选纠错文本与所述匹配文本之间的匹配置信度;确定所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本。进一步地,计算所述候选纠错文本与所述语音识别文本中的匹配文本之间的编辑距离之前,还包括:对所述候选纠错文本与所述语音识别文本进行预处理,其中,所述预处理包括在所述候选纠错文本与所述语音识别文本中添加分隔符。进一步地,根据所述匹配文本生成语音识别文本对应的纠错记录,包括:根据所述匹配文本获取纠错边界,其中,所述纠错边界包括纠错起始位置和匹配文本长度;生成语音识别文本对应的纠错记录,其中,所述纠错记录至少包括候选纠错文本、纠错边界和匹配置信度。进一步地,输出所述语音识别文本对应的纠错记录,包括:采用筛选和/或组合排序的方式对所述语音识别文本对应的多条纠错记录进行优化后输出。进一步地,采用筛选的方式对所述语音识别文本对应的多条纠错记录进行优化,包括:当候选纠错文本与语音识别文本中匹配文本的匹配置信度超过阈值时,从纠错记录中删除纠错边界相交的其它纠错记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度。进一步地,采用组合排序的方式对所述语音识别文本对应的多条纠错记录进行优化,包括:根据纠错边界不相交的多条纠错记录生成合成记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度;利用预设方法对组合记录组进行排序,其中,所述组合记录组包含所述纠错记录和由所述纠错记录生成的合成记录。进一步地,利用预设方法对组合记录组进行排序,其中,所述预设方法包括如下一种或多种任意的组合:根据组合记录组中纠错记录的纠错评估分数计算平均纠错评估分数,按所述平均纠错评估分数从高到低排列;统计组合记录组中的纠错记录数,按所述纠错记录数从多到少排列;统计组合记录组中语音识别文本的匹配文本的总长度,按所述匹配文本的总长度从短到长排列。进一步地,所述纠错评估分数的获取方法,包括:根据纠错记录对应的匹配置信度和/或相似度得分和/或统计语言模型得分获取纠错评估分数。根据本申请的另一方面,还提供了一种语音识别文本的纠错装置,所述装置包括:读取模块,用于获取语音识别文本;匹配模块,用于根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录;输出模块,用于输出所述语音识别文本对应的纠错记录。进一步地,所述匹配模块,用于:根据所述候选纠错文本在所述语音识别文本中进行匹配,以确定所述语音识别文本中,是否存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本;在所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本时,根据所述匹配文本生成语音识别文本对应的纠错记录。进一步地,所述匹配模块,用于:采用基于编辑距离模型的模式匹配算法,并根据所述候选纠错文本在所述语音识别文本中进行匹配。进一步地,所述匹配模块,用于:计算所述候选纠错文本与所述语音识别文本中的匹配文本之间的编辑距离;根据所述编辑距离与所述候选纠错文本的长度,获取所述候选纠错文本与所述匹配文本之间的匹配置信度;确定所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本。进一步地,所述匹配模块,还用于:对所述候选纠错文本与所述语音识别文本进行预处理,其中,所述预处理包括在所述候选纠错文本与所述语音识别文本中添加分隔符。进一步地,所述匹配模块,用于:根据所述匹配文本获取纠错边界,其中,所述纠错边界包括纠错起始位置和匹配文本长度;生成语音识别文本对应的纠错记录,其中,所述纠错记录至少包括候选纠错文本、纠错边界和匹配置信度。进一步地,所述输出模块,用于:采用筛选和/或组合排序的方式对所述语音识别文本对应的多条纠错记录进行优化后输出。进一步地,所述输出模块,用于:当候选纠错文本与语音识别文本中匹配文本的匹配置信度超过阈值时,从纠错记录中删除纠错边界相交的其它纠错记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度。进一步地,所述输出模块,用于:根据纠错边界不相交的多条纠错记录生成合成记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度;利用预设方法对组合记录组进行排序,其中,所述组合记录组包含所述纠错记录和由所述纠错记录生成的合成记录。进一步地,所述输出模块,用于:根据组合记录组中纠错记录的纠错评估分数计算平均纠错评估分数,按所述平均纠错评估分数从高到低排列;统计组合记录组中的纠错记录数,按所述纠错记录数从多到少排列;统计组合记录组中语音识别文本的匹配文本的总长度,按所述匹配文本的总长度从短到长排列。进一步地,所述输出模块,用于:根据纠错记录对应的匹配置信度和/或相似度得分和/或统计语言模型得分获取纠错评估分数。附图说明通过阅读参照以下附图所作的对非限制本文档来自技高网...
语音识别文本的纠错方法与装置

【技术保护点】
一种语音识别文本的纠错方法,其中,包括:获取语音识别文本;根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录;输出所述语音识别文本对应的纠错记录。

【技术特征摘要】
1.一种语音识别文本的纠错方法,其中,包括:获取语音识别文本;根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录;输出所述语音识别文本对应的纠错记录。2.根据权利要求1所述的方法,其中,根据预设的候选纠错文本生成所述语音识别文本对应的纠错记录,包括:根据所述候选纠错文本在所述语音识别文本中进行匹配,以确定所述语音识别文本中,是否存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本;在所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本时,根据所述匹配文本生成语音识别文本对应的纠错记录。3.根据权利要求2所述的方法,其中,根据所述候选纠错文本在所述语音识别文本中进行匹配,包括:采用基于编辑距离模型的模式匹配算法,并根据所述候选纠错文本在所述语音识别文本中进行匹配。4.根据权利要求3所述的方法,其中,采用基于编辑距离模型的模式匹配算法,并根据所述候选纠错文本在所述语音识别文本中进行匹配,包括:计算所述候选纠错文本与所述语音识别文本中的匹配文本之间的编辑距离;根据所述编辑距离与所述候选纠错文本的长度,获取所述候选纠错文本与所述匹配文本之间的匹配置信度;确定所述语音识别文本中存在与所述候选纠错文本的匹配置信度超过阈值的匹配文本。5.根据权利要求4所述的方法,其中,计算所述候选纠错文本与所述语音识别文本中的匹配文本之间的编辑距离之前,还包括:对所述候选纠错文本与所述语音识别文本进行预处理,其中,所述预处理包括在所述候选纠错文本与所述语音识别文本中添加分隔符。6.根据权利要求2所述的方法,其中,根据所述匹配文本生成语音识别文本对应的纠错记录,包括:根据所述匹配文本获取纠错边界,其中,所述纠错边界包括纠错起始位置和匹配文本长度;生成语音识别文本对应的纠错记录,其中,所述纠错记录至少包括候选纠错文本、纠错边界和匹配置信度。7.根据权利要求1所述的方法,其中,输出所述语音识别文本对应的纠错记录,包括:采用筛选和/或组合排序的方式对所述语音识别文本对应的多条纠错记录进行优化后输出。8.根据权利要求7所述的方法,其中,采用筛选的方式对所述语音识别文本对应的多条纠错记录进行优化,包括:当候选纠错文本与语音识别文本中匹配文本的匹配置信度超过阈值时,从纠错记录中删除纠错边界相交的其它纠错记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度。9.根据权利要求7所述的方法,其中,采用组合排序的方式对所述语音识别文本对应的多条纠错记录进行优化,包括:根据纠错边界不相交的多条纠错记录生成合成记录,其中,所述纠错边界包括纠错起始位置和匹配文本长度;利用预设方法对组合记录组进行排序,其中,所述组合记录组包含所述纠错记录和由所述纠错记录生成的合成记录。10.根据权利要求7所述的方法,其中,利用预设方法对组合记录组进行排序,其中,所述预设方法包括如下一种或多种任意的组合:根据组合记录组中纠错记录的纠错评估分数计算平均纠错评估分数,按所述平均纠错评估分数从高到低排列;统计组合记录组中的纠错记录数,按所述纠错记录数从多到少排列;统计组合记录组中语音识别文本的匹配文本的总长度,按所述匹配文本...

【专利技术属性】
技术研发人员:秦泓杰
申请(专利权)人:上海创米科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1