语音检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:26175274 阅读:21 留言:0更新日期:2020-10-31 14:07
本申请涉及一种语音检测方法、装置、计算机设备和存储介质。所述方法包括:获取音频数据,对音频数据进行波形特征提取,得到音频数据的波形宽度特征序列;获取波形宽度特征序列对应的滑动重叠窗口,根据滑动重叠窗口的波形宽度特征进行匹配检测;当通过滑动重叠窗口检测得到音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;在音频数据中,根据各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为音频数据中的语音复制片段。采用本方法能够提高语音复制片段的检测效率。

【技术实现步骤摘要】
语音检测方法、装置、计算机设备和存储介质
本申请涉及音频处理
,特别是涉及一种语音检测方法、装置、计算机设备和存储介质。
技术介绍
随着数字音频技术的发展,人们对音频数据的修改操作变得越来越容易,对音频片段进行复制粘贴是修改音频最简单的方式之一。一些不法分子使用此方法恶意篡改音频,伪造录音证据,给办案人员进行音频取证增加了难度,严重妨碍司法公正。因此,在此类情况中,对音频数据进行复制检测就显得尤为重要。传统的语音复制检测方法为了确保检测的准确性,在没有复制片段先验信息的条件下,需要对全部语音采样数据进行无遗漏的复制片段匹配检测,计算量巨大,特别是对于较长的音频,这种检测的方法非常耗时,导致检测效率低下。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高检测效率的语音检测方法、装置、计算机设备和存储介质。一种语音检测方法,所述方法包括:获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测;当通过所述滑动重叠窗口检测得到所述音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;在所述音频数据中,根据所述各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段。在其中一个实施例中,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列,包括:根据所述音频数据各个采样点的值及其连续性,将所述音频数据划分得到各个子波形,所述各个子波形按其中采样点的个数定义波形宽度,按其中采样点的值定义波形方向,所述波形方向包括正向波形和负向波形;统计所述各个子波形对应的采样点数,得到所述各个子波形对应的波形宽度特征;根据所述各个子波形的波形方向和所述各个子波形对应的波形宽度特征得到所述波形宽度特征序列,所述波形宽度特征序列包括正向波形宽度特征序列、负向波形宽度特征序列和双向波形宽度特征序列。在其中一个实施例中,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列,包括:根据采样点的值大于正向波形预设阈值的各个采样点,从所述音频数据中提取得到多个正向波形,统计各个正向波形对应的采样点数,得到正向波形宽度特征序列;根据采样点的值小于正向波形预设阈值的各个采样点,从所述音频数据中提取得到多个负向波形,统计各个负向波形对应的采样点数,得到负向波形宽度特征序列;统计各个正向波形对应的采样点数和各个负向波形对应的采样点数,得到双向波形宽度特征序列。在其中一个实施例中,所述获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测,包括:获取波形宽度特征复制序列;所述波形宽度特征复制序列和所述波形宽度特征序列为相同序列;将所述波形宽度特征序列和波形宽度特征复制序列首尾相接,开始相向滑动,将所述波形宽度特征序列和波形宽度特征复制序列在滑动过程中重叠区域作为所述滑动重叠窗口;在当前滑动重叠窗口中,计算所述波形宽度特征序列对应的第一子特征序列和所述波形宽度特征复制序列对应的第二子特征序列的差值,得到当前滑动重叠窗口对应的波形宽度特征差值序列;获取所述波形宽度特征差值序列中符合预设差值的片段位置对应的第一子特征序列片段和第二子特征序列片段,将第一子特征序列片段和第二子特征序列片段作为相同波形宽度特征序列片段。在其中一个实施例中,将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段,包括:在同一组音频数据片段中,当当前音频片段的各个待匹配采样点的值与其他音频片段的各个待匹配采样点的值对应相等时,确定所述当前音频片段和所述其他音频片段为一组语音复制片段,将各组语音复制片段作为所述音频数据中的语音复制片段。在其中一个实施例中,所述将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段,包括:在同一组音频数据片段中,当当前音频片段的各个待匹配采样点的值与其他音频片段的各个待匹配采样点的值呈比例关系时,确定所述当前音频片段和所述其他音频片段为一组语音复制片段,将各组语音复制片段作为所述音频数据中的语音复制片段。在其中一个实施例中,所述确定所述当前音频片段和所述其他音频片段为一组语音复制片段之后,所述方法还包括:在所述音频数据中,获取所述当前音频片段的相邻采样点和所述其他音频片段的相邻采样点;将所述当前音频片段的相邻采样点和所述其他音频片段的相邻采样点对应匹配;当匹配成功时,将所述当前音频片段与所述当前音频片段的相邻采样点合并得到扩展后的当前音频片段,将所述其他音频片段与所述其他音频片段的相邻采样点合并得到扩展后的其他音频片段;将所述扩展后的当前音频片段和所述扩展后的其他音频片段作为一组语音复制片段。一种语音检测装置,所述装置包括:特征提取模块,用于获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;特征匹配模块,用于获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测;当通过所述滑动重叠窗口检测得到所述音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;音频片段提取模块,用于在所述音频数据中,根据所述各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;音频片段匹配模块,用于将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测;当通过所述滑动重叠窗口检测得到所述音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;在所述音频数据中,根据所述各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波本文档来自技高网...

【技术保护点】
1.一种语音检测方法,其特征在于,所述方法包括:/n获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;/n获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测;/n当通过所述滑动重叠窗口检测得到所述音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;/n在所述音频数据中,根据所述各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;/n将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段。/n

【技术特征摘要】
1.一种语音检测方法,其特征在于,所述方法包括:
获取音频数据,对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列;
获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测;
当通过所述滑动重叠窗口检测得到所述音频数据的波形宽度特征序列中存在至少一组相同波形宽度特征序列片段时,确定各组相同波形宽度特征序列片段的位置信息;
在所述音频数据中,根据所述各组相同波形宽度特征序列片段的位置信息确定对应的各组音频数据片段;
将各组音频数据片段分别进行校验,将校验成功的音频数据片段作为所述音频数据中的语音复制片段。


2.根据权利要求1所述的方法,其特征在于,所述对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列,包括:
根据所述音频数据各个采样点的值及其连续性,将所述音频数据划分得到各个子波形,所述各个子波形按其中采样点的个数定义波形宽度,按其中采样点的值定义波形方向,所述波形方向包括正向波形和负向波形;
统计所述各个子波形对应的采样点数,得到所述各个子波形对应的波形宽度特征;
根据所述各个子波形的波形方向和所述各个子波形对应的波形宽度特征得到所述波形宽度特征序列,所述波形宽度特征序列包括正向波形宽度特征序列、负向波形宽度特征序列和双向波形宽度特征序列。


3.根据权利要求2所述的方法,其特征在于,所述对所述音频数据进行波形特征提取,得到所述音频数据的波形宽度特征序列,包括:
根据采样点的值大于正向波形预设阈值的各个采样点,从所述音频数据中提取得到多个正向波形,统计各个正向波形对应的采样点数,得到正向波形宽度特征序列;
根据采样点的值小于负向波形预设阈值的各个采样点,从所述音频数据中提取得到多个负向波形,统计各个负向波形对应的采样点数,得到负向波形宽度特征序列;
统计各个正向波形对应的采样点数和各个负向波形对应的采样点数,得到双向波形宽度特征序列。


4.根据权利要求1所述的方法,其特征在于,所述获取所述波形宽度特征序列对应的滑动重叠窗口,根据所述滑动重叠窗口的波形宽度特征进行匹配检测,包括:
获取波形宽度特征复制序列;所述波形宽度特征复制序列和所述波形宽度特征序列为相同序列;
将所述波形宽度特征序列和波形宽度特征复制序列首尾相接,开始相向滑动,将所述波形宽度特征序列和波形宽度特征复制序列在滑动过程中重叠区域作为所述滑动重叠窗口;
在当前滑动重叠窗口中,计算所述波形宽度特征序列对应的第一子特征序列和所述波形宽度特征复制序列对应的第二子特征序列的差值,得到当前滑动重叠窗口对应的波形宽度特征差值序列;
获取所述波形宽度特征差值序列中符合预设差值的片段位置对应的第一子特征序列片段和第二子特征序列片段,将第一子特征...

【专利技术属性】
技术研发人员:丁俊豪彭子娇
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1