语音中的领域词的识别方法、系统、设备和介质技术方案

技术编号：34128576 阅读：10 留言：0更新日期：2022-07-14 14:50

本发明专利技术公开了一种语音中的领域词的识别方法、系统、设备及介质。该方法包括：将原始语音数据转换为原始文本数据；对原始文本数据进行预处理，生成候选新词数据；计算候选新词数据的自由度信息，确定第一领域词概率；根据原始语音数据对应的声学特征和原始文本数据对应的向量特征生成融合特征向量，并将融合特征向量输入序列预测模型中，输出第二领域词概率；根据第一领域词概率和第二领域词概率，确定原始语音数据所对应的领域词的概率值。本发明专利技术根据计算自由度信息而得到的第一领域词概率和利用序列预测模型计算得到的第二领域词概率共同确定领域词的概率值，改善了领域词识别的准确性，提高了预测的精度。提高了预测的精度。提高了预测的精度。

全部详细技术资料下载

【技术实现步骤摘要】
语音中的领域词的识别方法、系统、设备和介质

[0001]本专利技术涉及语音识别
，尤其涉及一种语音中的领域词的识别方法、系统、设备和介质。

技术介绍

[0002]近年来，伴随着语音识别技术的不断发展，语音识别技术被运用在越来越多的场景中。然而，语音识别的场景中，因原始的语料库不足，导致缺乏很多领域词，造成词汇无法识别的情况。
[0003]现有技术中，通常将语音事先转写成文本形式再进行领域词判断。但是在语音转文字的过程中，会出现因翻译错误，造成后续的领域词判断产生误差积累的现象。
[0004]因此，随着应用场景的增多，用户对语音识别系统在不同领域上的领域词识别准确率的要求越来越高。

技术实现思路

[0005]本专利技术要解决的技术问题是为了克服现有技术中领域词的识别准确率低的缺陷，提供一种语音中的领域词的识别方法、系统、设备和介质。
[0006]本专利技术是通过下述技术方案来解决上述技术问题：
[0007]第一方面，本专利技术提供一种语音中的领域词的识别方法，所述识别方法包括：
[0008]将原始语音数据转换为原始文本数据；
[0009]对所述原始文本数据进行预处理，生成候选新词数据；
[0010]计算所述候选新词数据的自由度信息，确定第一领域词概率；
[0011]根据所述原始语音数据对应的声学特征和所述原始文本数据对应的向量特征生成融合特征向量，并将所述融合特征向量输入序列预测模型中，输出第二领域词概率；
[0012]基于所...

【技术保护点】

【技术特征摘要】
1.一种语音中的领域词的识别方法，其特征在于，所述识别方法包括：将原始语音数据转换为原始文本数据；对所述原始文本数据进行预处理，生成候选新词数据；计算所述候选新词数据的自由度信息，确定第一领域词概率；根据所述原始语音数据对应的声学特征和所述原始文本数据对应的向量特征生成融合特征向量，并将所述融合特征向量输入序列预测模型中，输出第二领域词概率；基于所述第一领域词概率和所述第二领域词概率，确定所述原始语音数据所对应的领域词的概率值；其中，所述序列预测模型是根据待训练的样本语音数据和标注后的样本语音数据基于循环神经网络训练而得到的，所述标柱后的样本语音数据的每一帧具有领域词标签或者非领域词标签。2.如权利要求1所述的语音中的领域词的识别方法，其特征在于，所述计算所述候选新词数据的自由度信息，确定第一领域词概率的步骤，包括：确定所述候选新词数据的自由度衡量指标；计算所述候选新词数据的凝聚度指标；基于所述自由度衡量指标和所述凝聚度指标，计算出所述第一领域词概率。3.如权利要求1所述的语音中的领域词的识别方法，其特征在于，所述对所述原始文本数据进行预处理，生成候选新词数据的步骤，包括：对所述原始文本数据进行分词处理，生成若干个原始词汇；将所述原始词汇中的预设词频的词汇和语气词汇进行清洗，生成所述候选新词数据。4.如权利要求1所述的语音中的领域词的识别方法，其特征在于，所述基于所述第一领域词概率和所述第二领域词概率，确定所述原始语音数据所对应的领域词的概率值的步骤，包括：根据所述第一领域词概率和所述第二领域词概率的加权结果或者求和结果，计算得到所述领域词的概率值。5.一种语音中的领域词的识别系统，其特征在于，所述识别系统包括：转换模块，用于将原始语音数据转换为原始文本数据；预处理模块，用于对所述原始文本数据进行预处理，生成候选新词数据；计算模块，用于计算所述候选新词数据的自由度信息，...

【专利技术属性】
技术研发人员：陈文浩，罗超，邹宇，郝竹林，张启祥，
申请(专利权)人：携程旅游信息技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人