音频采集和对比方法、系统及车辆技术方案

技术编号:32639191 阅读:45 留言:0更新日期:2022-03-12 18:14
本发明专利技术公开的一种音频采集和对比方法、系统及车辆,包括以下步骤:采集音频信息;将音频信息转写为文本信息;将转写后的文本信息与目标音频文本信息进行对比;若对比的结果大于预设相似度阈值,则存储所采集的音频信息,否则删除所采集的音频信息。本发明专利技术支持对音频内容自动进行音频质量评估,符合质量要求的则存储,不符合质量要求的自动删除,有效提升了采集短音频的效率及采集音频的质量,减少了人员投入。投入。投入。

【技术实现步骤摘要】
音频采集和对比方法、系统及车辆


[0001]本专利技术涉及语音交互
,具体涉及一种音频采集和对比方法、系统及车辆。

技术介绍

[0002]音频数据是语音产品优化的基础,因此车载语音产品对特定的音频数据有很大的采集需求,如语音唤醒词(一般为短音频)就需要采集大量、重复的音频数据。
[0003]行业普遍采用方案:在车内布置专业音频采集设备来进行音频的采集,通过人员现场指导、校核录音内容,对符合要求的音频存档,不符合要求的音频删除。这种方案需要花费时间较长、音频设备的采购成本较高。
[0004]因此,有必要开发一种音频采集和对比方法、系统及车辆。

技术实现思路

[0005]本专利技术的目的是提供一种音频采集和对比方法、系统及车辆,能提升采集短音频的效率及采集音频的质量。
[0006]本专利技术所述的一种音频采集和对比方法,包括以下步骤:采集音频信息;将音频信息转写为文本信息;将转写后的文本信息与目标音频文本信息进行对比;若对比的结果大于预设相似度阈值,则存储所采集的音频信息,否则删除所采集的音频信息。
[0007]可选地,通过录音的方式采集音频信息。
[0008]可选地,设置录音倒计时的初始值;响应于录音功能被触发时,接收用户的语音录音,持续录音至倒计时完成。
[0009]可选地,响应于倒计时结束时,显示录音已结束;若倒计时结束,但录音未完成时,响应于检测到继续该条录音的功能屏幕按钮或者物理按键被触发时,则继续该条录音的录制,并将继续采集的音频信息和之前所采集的音频信号融合成一条音频信息。
[0010]可选地,通过点击屏幕按钮或者物理按键开启录音,或通过语音控制开启录音,或通过视线交互方式开启录音。
[0011]可选地,通过时间单位倒计时,或通过图形变化进行倒计时。
[0012]可选地,采集音频信息的方式包括现场发声并录音采集,远程发声并录音采集,以及将已有录音进行播放并采集中的一种或多种。
[0013]可选地,采集的音频信息为单人发声,或为多人发声。
[0014]第二方面,本专利技术所述的一种音频采集和对比系统,包括存储器和控制器,所述存储器内存储有计算机可读程序,所述计算机可读程序被控制器调用时能执行如本专利技术所述的音频采集和对比方法的步骤。
[0015]第三方面,本专利技术所述的一种车辆,采用如本专利技术所述的音频采集和对比系统。
[0016]本专利技术具有以下优点:本专利技术实现了音频采集并对音频质量进行自动比对的功能。本装置支持对音频内容自动进行音频质量评估,对不符合采集内容的音频能够自动删除,能够有效提升采集短音频的效率及采集音频的质量,减少了人员投入。
附图说明
[0017]图1为本实施例的流程图;图2为本实施例中音频采集装置的原理框图;图3为音频采集可视化界面的示意图。
具体实施方式
[0018]下面结合附图对本专利技术作进一步说明。
[0019]如图1所示,本实施例中,一种音频采集和对比方法,包括以下步骤:采集音频信息;将音频信息转写为文本信息;将转写后的文本信息与目标音频文本信息进行对比;若对比的结果大于预设相似度阈值,则存储所采集的音频信息,否则删除所采集的音频信息。
[0020]本实施例中,通过录音的方式采集音频信息。通过设置录音倒计时的初始值;响应于录音功能被触发时,接收用户的语音录音,持续录音至倒计时完成。
[0021]本实施例中,对于开启录音的方式,包括但是不限于点击屏幕按钮或者物理按键开启录音,亦或通过语音控制开启录音,亦或通过视线交互等方式开启录音。只要实现开启录音功能即可。
[0022]本实施例中,对于倒计时功能,包括但不限于通过时间单位倒计时,通过图形变化(包含但是不限于沙漏变化,条形图变化,圆圈缩小,圆圈旋转等等)倒计时,或通过其他可视化方式倒计时等。只要实现了倒计时功能,即可视为倒计时结束录音。对于倒计时,用户可以自行设定录音总时长,从而实现倒计时的功能,设定的方式包含但是不限于通过输入数字时长,通过图形变化表示时长等。
[0023]在录音过程中,用户可以通过可视化界面,点击屏幕按钮或者物理按键中途暂停音频录入,暂停音频录入过程中对应的倒计时应该也暂停,不再进行倒计时功能,倒计时功能暂停后用户可以点击继续录音按钮,继续进行录音操作,倒计时功能继续工作。如果倒计时结束,显示录音已结束,用户存在录音未完成的情况,用户可以点击继续该条录音的功能屏幕按钮或者物理按键继续进行该条录音的采集,从而继续该条录音的录制,继续音频采集的结果是和原来录音形成同一条录音。
[0024]本实施例中,采集音频不仅包含现场发声并录音采集,也包含远程发声并录音采集,也包含将已有录音进行播放并采集。音频不仅仅包含单人发声,也包含多人发声;如果采用真人现场发声的情况,音频采集可使用到语音结合唇动的多模融合技术,该情况依然视为采集音频这一步骤。
[0025]本实施例中,存储音频包含所有支持的录音格式。这一步可以通过可视化界面,点击屏幕按钮或者物理按键重新进行录音采集并存储。此处的存储不仅包含本地存储,也包
含云端存储。
[0026]本实施例中,将音频进行文本转写,获得文本,具体为:将音频进行文本转写,获得文本的方式不仅包含本地将音频进行文本转写,也包含将音频通过云端或者第三方接口进行文本转写然后同步文本到本地。
[0027]本实施例中,将转写后的文本信息与目标音频文本信息进行对比;该步骤对比标准为人工可以控制,除目标为100%以外,也可以设定范围,比如小于X%,比如处于X%至Y%中间,比如大于Y%等。该步骤可以通过点击屏幕按钮或者物理按键的方式实时修改目标音频文本。该步骤如果文本对比结果满足目标要求,则自动存储该音频文件。如果文本对比结果不满足目标要求,且用户设置了不满足目标要求则自动删除录音,则将该条录音删除。如果文本对比结果不满足目标要求,且用户没有设置不满足目标要求则自动删除录音,则用户可以自行手动保存该条录音,在该步骤中,用户可以播放录音结果。对于存储后的音频文件,用户可以进行重命名,删除等操作。
[0028]如图2所示,本实施例中,音频采集装置由麦克风、降噪单元、处理单元、存储单元和显示单元组成,其中,麦克风与降噪单元连接,降噪单元与存储单元连接,存储单元与显示单元连接,用于实现音频录音、降噪处理、音频存储等功能。
[0029]本实施例中,还设置有音频采集可视化界面,将音频采集流程可视化,提供音频采集内容编辑、录音计时、录音文件存储管理、录音质量评估结果展现,文件处理等内容,参见图3。
[0030]本实施例中,一种音频采集和对比系统,包括存储器和控制器,所述存储器内存储有计算机可读程序,所述计算机可读程序被控制器调用时能执行如本实施例中所述的音频采集和对比方法的步骤。
[0031]本实施例中,一种车辆,采用如本实施例中所述的音频采集和对比系统。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频采集和对比方法,其特征在于,包括以下步骤:采集音频信息;将音频信息转写为文本信息;将转写后的文本信息与目标音频文本信息进行对比;若对比的结果大于预设相似度阈值,则存储所采集的音频信息,否则删除所采集的音频信息。2.根据权利要求1所述的音频采集和对比方法,其特征在于:通过录音的方式采集音频信息。3.根据权利要求2所述的音频采集和对比方法,其特征在于:设置录音倒计时的初始值;响应于录音功能被触发时,接收用户的语音录音,持续录音至倒计时完成。4.根据权利要求3所述的音频采集和对比方法,其特征在于:响应于倒计时结束时,显示录音已结束;若倒计时结束,但录音未完成时,响应于检测到继续该条录音的功能屏幕按钮或者物理按键被触发时,则继续该条录音的录制,并将继续采集的音频信息和之前所采集的音频信号融合成一条音频信息。5.根据权利要求2至4任一所述...

【专利技术属性】
技术研发人员:何济南
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1