音频查找方法及相关装置、电子设备、存储介质制造方法及图纸

技术编号:31162048 阅读:20 留言:0更新日期:2021-12-04 10:31
本申请公开了一种音频查找方法及相关装置、电子设备、存储介质,其中,音频查找方法包括:获取文本界面中的目标词语;其中,文本界面显示有若干语句,若干语句分别设有元素标签,元素标签包括语句标识,相同语句标识表征语句来源于相同音频数据;获取目标词语所在的目标语句和目标词语在目标语句的位置信息,并将目标语句的语句标识作为目标标识;获取目标标识对应的若干组音频信息;其中,每组音频信息包括由音频片段识别到的识别词语和音频片段的第一时间信息;基于位置信息、目标语句和若干组音频信息,得到目标词语的目标音频。上述方案,能够在实现缩小回听范围的前提下,提高音频查找的稳定性的和准确性。频查找的稳定性的和准确性。频查找的稳定性的和准确性。

【技术实现步骤摘要】
音频查找方法及相关装置、电子设备、存储介质


[0001]本申请涉及音频处理
,特别是涉及一种音频查找方法及相关装置、电子设备、存储介质。

技术介绍

[0002]近年来,语音识别技术已经在诸如工作会议、日常聊天等众多场景得到越来越广泛的应用。通常而言,在语音识别之后,为了提高识别语句的准确性,需要文本处理人员根据原有音频回听来校准识别语句。
[0003]目前,为了减小回听范围,通过将识别语句拆分为多个识别词语,再利用元素标签分别包裹多个识别词语,并在元素标签内存储识别词语对应音频的开始时间和结束时间,从而在需要校准某个识别词语时,通过该识别词语的元素标签即可获取到该识别词语的对应音频。然而,由于将识别语句拆分为多个识别词语,将导致文本界面存在大量元素标签,势必影响界面展示的稳定性,导致出现界面卡顿、甚至卡死等情况。有鉴于此,如何在实现缩小回听范围的前提下,提高音频查找的稳定性和准确性成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种音频查找方法及相关装置、电子设备、存储介质,能够在实现缩小回听范围的前提下,提高音频查找的稳定性的和准确性。
[0005]为了解决上述技术问题,本申请第一方面提供了一种音频查找方法,包括:获取文本界面中的目标词语;其中,文本界面显示有若干语句,若干语句分别设有元素标签,元素标签包括语句标识,相同语句标识表征语句来源于相同音频数据;获取目标词语所在的目标语句和目标词语在目标语句的位置信息,并将目标语句的语句标识作为目标标识;获取目标标识对应的若干组音频信息;其中,每组音频信息包括由音频片段识别到的识别词语和音频片段的第一时间信息;基于位置信息、目标语句和若干组音频信息,得到目标词语的目标音频。
[0006]为了解决上述技术问题,本申请第二方面提供了一种音频查找装置,包括:目标词语获取模块、目标词语分析模块、音频信息获取模块和目标音频获取模块,目标词语获取模块,用于获取文本界面中的目标词语;其中,文本界面显示有若干语句,若干语句分别设有元素标签,元素标签包括语句标识,相同语句标识表征语句来源于相同音频数据;目标词语分析模块,用于获取目标词语所在的目标语句和目标词语在目标语句的位置信息,并将目标语句的语句标识作为目标标识;音频信息获取模块,用于获取目标标识对应的若干组音频信息;其中,每组音频信息包括由音频片段识别到的识别词语和音频片段的第一时间信息;目标音频获取模块,用于基于位置信息、目标语句和若干组音频信息,得到目标词语的目标音频。
[0007]为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方
面中的音频查找方法。
[0008]为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的音频查找方法。
[0009]上述方案,获取文本界面中的目标词语,且文本界面显示有若干语句,若干语句分别设有元素标签,元素标签包括语句标识,相同语句标识表征语句来源于相同音频数据,在此基础上,再获取目标词语所在的目标语句和目标词语在目标语句的位置信息,并将目标语句的语句标识作为目标标识,以及获取目标标识对应的若干组音频信息,且每组音频信息包括由音频片段识别到的识别词语和音频片段的第一时间信息,再基于位置信息、目标语句和若干组音频信息,得到目标词语的目标音频,故最终能够查找到目标词语的目标音频,从而可以实现缩小回听范围,且由于文本界面所显示的语句设有元素标签,相较于在词语维度设置元素标签,故能够大大减少元素标签数量,有利于尽可能地降低文本界面发生卡顿、甚至卡死的概率,进而可以提升音频查找的稳定性,此外,通过获取到与目标词语所在目标语句具有相同语句标识的若干组音频信息以及目标词语在所在目标语句中位置信息,且每组音频信息包括由音频片段识别到的识别词语和音频片段的时间信息,能够辅助定位到目标词语在音频数据中对应的时间信息,有利于提升音频查找的准确性。故此,能够在实现缩小回听范围的前提下,提高音频查找的稳定性的和准确性。
附图说明
[0010]图1是本申请音频查找方法一实施例的流程示意图;
[0011]图2是图1中步骤S14一实施例的流程示意图;
[0012]图3是本申请音频查找一实施例的过程示意图;
[0013]图4是本申请音频查找装置一实施例的框架示意图;
[0014]图5是本申请电子设备一实施例的框架示意图;
[0015]图6是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0016]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0017]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0018]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0019]请参阅图1,图1是本申请音频查找方法一实施例的流程示意图。
[0020]具体而言,可以包括如下步骤:
[0021]步骤S11:获取文本界面中的目标词语。
[0022]本公开实施例中,文本界面显示有若干语句,若干语句分别设有元素标签,元素标签包括语句标识,相同语句标识表征语句来源于相同音频数据。
[0023]在一个实施场景中,文本界面所显示的若干语句中,可以包含由音频数据识别得
到的识别语句,也可以包含在识别语句基础上校正后的校正语句。例如,音频数据“今天天气晴朗,风和日丽”和音频数据“适宜郊游外出”,经语音识别之后可以得到识别语句“今天天气清朗,风和日丽”和识别语句“适宜交友外出”,则文本界面所显示的若干语句可以包括:识别语句“今天天气清朗,风和日丽”、识别语句“适宜交友外出”,或者,文本界面所显示的若干语句也可以包括其中至少一者经校正后的校正语句,如,文本界面所显示的若干语句也可以包括:校正语句“今天天气晴朗,风和日丽”、识别语句“适宜交友外出”,在此不做限定。其他情况可以以此类推,在此不再一一举例。
[0024]在一个实施场景中,如前所述,每一语句均分别设有元素标签,且元素标签中包含语句标识,相同语句标识表征语句来源于相同音频数据。例如,在文本界面所显示的若干语句中包含前述识别语句“今天天气清朗,风和日丽”和识别语句“适宜交友外出”的情况下,由于两者分别经由不同音频数据识别得到,故两者所分别设置的元素标签中语句标识不同。具体地,语句标识可以采用数字进行表示。例如,“适宜交友外出”的元素标签可以设置为<ins da本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频查找方法,其特征在于,包括:获取文本界面中的目标词语;其中,所述文本界面显示有若干语句,所述若干语句分别设有元素标签,所述元素标签包括语句标识,相同所述语句标识表征所述语句来源于相同音频数据;获取所述目标词语所在的目标语句和所述目标词语在所述目标语句的位置信息,并将所述目标语句的语句标识作为目标标识;获取所述目标标识对应的若干组音频信息;其中,每组所述音频信息包括由音频片段识别到的识别词语和所述音频片段的第一时间信息;基于所述位置信息、所述目标语句和所述若干组音频信息,得到所述目标词语的目标音频。2.根据权利要求1所述的方法,其特征在于,所述基于所述位置信息、所述目标语句和所述若干组音频信息,得到所述目标词语的目标音频,包括:拼接若干组所述音频信息,得到组合语句;基于所述目标语句与所述组合语句之间的对比结果以及所述位置信息,确定第二时间信息;基于所述第二时间信息,获取所述目标音频。3.根据权利要求2所述的方法,其特征在于,所述第一时间信息包括第一开始时间和第一结束时间;所述拼接若干组所述音频信息,得到组合语句,包括:对于每组所述音频信息,将表示所述第一开始时间的预设字符、所述识别词语和表示所述第一结束时间的预设字符进行组合,得到所述音频信息的组合词语;其中,所述预设字符两两均不相同;将所述若干组音频信息的组合词语进行拼接,得到所述组合语句。4.根据权利要求2所述的方法,其特征在于,所述对比结果包括依序排列的若干组对比信息,且每组对比信息包括编辑操作和差异文本;其中,按照所述若干组对比信息的排列顺序,选取一组所述对比信息作为当前信息,并基于所述当前信息中所述差异文本对所述组合语句执行所述当前信息中所述编辑操作,直至所述若干组对比信息均被选取为止所得到的语句为所述目标语句。5.根据权利要求4所述的方法,其特征在于,所述第二时间信息包括第二开始时间,且所述位置信息包括表征开始位置的第一数值;所述基于所述目标语句与所述组合语句之间的对比结果以及所述位置信息,确定第二时间信息,包括:将所述编辑操作满足预设条件的对比信息,作为候选信息;在各个所述候选信息中选取第一基准信息;其中,所述第一基准信息以及所述第一基准信息之前各个所述候选信息中所述差异文本的长度之和不低于所述第一数值;在位于所述第一基准信息之前的对比信息中选取第一目标信息,并将所述第一目标信息中所述预设字符所表示的时间作为所述第二开始时间;其中,所述第一目标信息中所述编辑操作为删除操作。6.根据权利要求4所述的方法...

【专利技术属性】
技术研发人员:程旭周腾飞王玮何润
申请(专利权)人:安徽听见科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1