语音识别方法、装置和介质制造方法及图纸

技术编号：24097325 阅读：112 留言：0更新日期：2020-05-09 11:03

本发明专利技术实施例提供了一种语音识别方法和装置、一种用于语音识别的装置，其中的方法具体包括：接收待识别语音数据，并确定与所述待识别语音数据相关的第一关键词；依据知识图谱，确定与所述第一关键词相关的第二关键词；对所述待识别语音数据进行解码，根据所述第一关键词和所述第二关键词，对所述待识别语音数据对应的解码路径的得分进行调整，并根据所述解码路径的调整后得分，确定所述待识别语音数据对应的语音识别结果。本发明专利技术实施例能够提升与应用场景相关的关键词对应的语音识别准确率。

Speech recognition methods, devices and media

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置和介质
本专利技术涉及通信
，特别是涉及一种语音识别方法和装置、一种机器可读介质。
技术介绍
语音识别技术能够将语音转换成为对应的字符或编码，广泛应用于智能家居、实时语音转写、机器同传等领域。其中，机器同传受限于语音识别技术及机器翻译技术，而机器翻译的质量又有赖于语音识别文本的质量；因此，为了提高机器同传的准确率，需要提高语音识别系统的质量。在一些机器同传的应用场景，经常会遇到人名、地名、产品名、或者专有名词的识别和翻译问题，而这些词往往对现场效果起到重要作用。目前的语音识别模型通常采用通用的声学模型及语言模型，优先识别出常用词及语料中出现概率较大的词。而针对一些特定应用场景，为了提高语音识别的准确率，往往需要针对该特定应用场景定制模型。定制模型的训练需要预先得到大量该应用场景的相关语料，但对于一些会议等场景，由于事先无法获得与会人员发言的具体内容，使得定制无法进行，进而使得特定应用场景下语音识别的准确率较低。
技术实现思路
鉴于上述问题，提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音识别方法、语音识别装置及用于语音识别的装置，本专利技术实施例能够提升与应用场景相关的关键词对应的语音识别准确率。为了解决上述问题，本专利技术公开了一种语音识别方法，包括：接收待识别语音数据，并确定与所述待识别语音数据相关的第一关键词；依据知识图谱，确定与所述第一关键词相关的第二关键词；对所述待识别语音数据进行解码，根据所述...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n接收待识别语音数据，并确定与所述待识别语音数据相关的第一关键词；/n依据知识图谱，确定与所述第一关键词相关的第二关键词；/n对所述待识别语音数据进行解码，根据所述第一关键词和所述第二关键词，对所述待识别语音数据对应的解码路径的得分进行调整，并根据所述解码路径的调整后得分，确定所述待识别语音数据对应的语音识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
接收待识别语音数据，并确定与所述待识别语音数据相关的第一关键词；
依据知识图谱，确定与所述第一关键词相关的第二关键词；
对所述待识别语音数据进行解码，根据所述第一关键词和所述第二关键词，对所述待识别语音数据对应的解码路径的得分进行调整，并根据所述解码路径的调整后得分，确定所述待识别语音数据对应的语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述确定与所述待识别语音数据相关的第一关键词，包括：
获取与所述待识别语音数据相关的文本材料，并从所述文本材料中提取第一关键词；或者
对演讲者对应的图像进行人脸识别，以得到所述演讲者对应的第一关键词。

3.根据权利要求2所述的方法，其特征在于，所述文本材料为对演示文稿对应的图像进行光学字符识别得到。

4.根据权利要求1至3中任一所述的方法，其特征在于，所述确定与所述第一关键词相关的第二关键词，包括：
依据所述第一关键词在所述知识图谱中的位置，确定与所述第一关键词相关的第二关键词。

5.根据权利要求4所述的方法，其特征在于，所述确定与所述第一关键词相关的第二关键词，包括：
若所述第一关键词对应所述知识图谱中的第一节点、且第一节点为起始节点，则依据所述知识图谱的所有节点得到第二关键词；或者
若所述第一关键词对应所述知识图谱中的第二节点、且第二节点为非起始节点，则依据所述第二节点和所述第二节点下属的节点得到第二关键词。

6.根据权利要求2所述的方法，其特征在于，所述从所述文本材料中提取第一关键词，包括：
对所述文本材料进行命名实体识别，以得到所述文本材料中的实体词。...

【专利技术属性】
技术研发人员：陈小敏，张晶晶，陈伟，赵超，王小川，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人