音频挑选的方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号：30138512 阅读：14 留言：0更新日期：2021-09-23 14:54

本申请公开了一种音频挑选方法、装置、电子设备和可读存储介质，属于人工智能领域。音频挑选方法，包括：获取部分音频，利用预设的第一模型识别所述音频，生成音频转写结果，根据所述音频转写结果生成第二模型，根据所述音频转写结果对应于所述第一模型与第二模型的概率不同，对所述音频进行挑选。从而解决了现有技术在挑选音频时，挑选到识别较好的音频，降低了标注的有益效果和收益的问题。低了标注的有益效果和收益的问题。低了标注的有益效果和收益的问题。

全部详细技术资料下载

【技术实现步骤摘要】
音频挑选的方法、装置、电子设备和可读存储介质

[0001]本专利技术涉及人工智能
，特别是涉及一种音频挑选的方法、装置、电子设备和可读存储介质。

技术介绍

[0002]目前，在语音识别过程中，通过预设的模型对音频进行识别，当预设的语音对音频的识别效果较差时，通常把这些音频选取出来，在这些音频上施加提高识别率的标注。
[0003]现有技术中，采用随机选取的方式来挑选这些音频。
[0004]然而，现有技术在挑选音频的过程中，由于采用随机选取的方式，挑选得到的音频会包括识别较好的音频，这将大大降低了标注的有益效果和收益，为此，采用什么方式挑选音频，成了要解决的问题。

技术实现思路

[0005]鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种音频挑选方法、装置、电子设备和可读存储介质。
[0006]依据本专利技术的第一方面，提供了音频挑选方法，该方法包括：
[0007]获取部分音频；
[0008]利用预设的第一模型识别所述音频，生成音频转写结果，将所述音频转写结果生成第二模型，其中，所述转写用于将所述音频转变为文本格式；
[0009]根据所述音频转写结果应于所述第一模型与所述第二模型的概率不同，对所述音频进行挑选。
[0010]依据本专利技术的第二方面，提供了一种音频挑选装置，该装置包括：
[0011]获取模块，用于获取部分音频；
[0012]转写模块，用于利用预设的第一模型识别所述音频，生成音...

【技术保护点】

【技术特征摘要】
1.一种音频挑选方法，其特征在于，所述方法包括：获取部分音频；利用预设的第一模型识别所述音频，生成音频转写结果，根据所述音频转写结果生成第二模型，其中，所述转写用于将所述音频转变为文本格式；根据所述音频转写结果对应于所述第一模型与所述第二模型的概率不同，对所述音频进行挑选。2.根据权利要求1所述的方法，其特征在于，利用预设的第一模型识别所述音频生成音频转写结果，根据所述音频转写结果生成第二模型，包括：所述预设的第一模型为ASR模型，由声学模型和第一语言模型构成；所述第二模型由音频转写的文本所组成。3.根据权利要求2所述的方法，其特征在于，所述第二模型由音频转写的文本所组成，包括：所述第二模型为由转写结果组成的第二语言模型。4.根据权利要求1所述的方法，其特征在于，所述根据所述音频转写结果对应于所述第一模型与所述第二模型的概率不同，对所述音频进行挑选，包括：所述概率为困惑度计算结果，其中，所述困惑度为：用来度量一个概率分布或概率模型预测样本的好坏程度。5.根据权利要求4所述的方法，其特征在于，所述概率为困惑度计算结果，包括:挑选出对于所述预设模型第一困惑度结果...

【专利技术属性】
技术研发人员：罗研朝，武卫东，
申请(专利权)人：北京天行汇通信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人