音频数据传输方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32436406 阅读:7 留言:0更新日期:2022-02-26 07:54
本申请公开了一种音频数据传输方法、装置、电子设备及存储介质,上述音频数据传输方法包括:获取待发送的N路音频数据;从N路音频数据中选取M路音频数据;分别提取M路音频数据的音频特征信息;根据音频特征信息获取与M路音频数据对应的心理声学感知系数EP(i);以及根据心理声学感知系数控制对应的音频数据的多发传输,使得EP(j)>EP(k)时,red'(j)>red'(k)。本方法可实现基于音频数据的心理声学感知系数控制对应的音频数据的多发传输,对心理声学感知系数较大的音频数据采用较大的多发倍数进行传输,对心理声学感知系数较小的音频数据采用较小的多发倍数进行传输,从而保证了音频数据的有效传输,提高了音频数据的传输质量。量。量。

【技术实现步骤摘要】
音频数据传输方法、装置、电子设备及存储介质


[0001]本申请涉及网络传输
,更具体地,涉及一种音频数据传输方法、装置、电子设备及存储介质。

技术介绍

[0002]在多人交互的语音通信系统中,多人通话质量主要受网络丢包影响,由于传输网络的不稳定性导致传输过程出现丢包现象,造成接收端声音的卡顿和不连贯,严重降低了收听者的体验。采用重复多发,即将音频数据包复制多份并在不同时间间隔下发送至接收端,可以有效避免网络丢包导致接收端收不到相应音频数据包的问题。
[0003]传统的多人通话中,音频数据包的下行多发是基于客户端的实际丢包率来实现,即对所有的音频数据包都采用相同的多发策略,多发策略在解决网络丢包的同时需要多倍的网络带宽作为代价,但是在一些网络带宽受限的情况下,多发引起所需带宽的数倍增加,进而导致丢包更加严重。

技术实现思路

[0004]鉴于上述问题,本申请提出了一种音频数据传输方法、装置、电子设备及存储介质,能够实现基于音频数据的心理声学感知系数控制对应的音频数据的多发传输,对心理声学感知系数较大的音频数据采用较大的多发倍数进行传输,对心理声学感知系数较小的音频数据采用较小的多发倍数进行传输,从而保证了音频数据的有效传输,提高了音频数据的传输质量。
[0005]第一方面,本申请实施例提供了一种音频数据传输方法,音频数据传输方法包括:获取待发送的N路音频数据,N为大于或等于1的正整数;从N路音频数据中选取M路音频数据,其中,M为正整数,且1≤M≤N;分别提取M路音频数据的音频特征信息;根据音频特征信息获取与M路音频数据对应的心理声学感知系数EP(i),其中i表示音频数据序号,且1≤i≤M;以及根据心理声学感知系数EP(i)控制对应的音频数据的多发传输,使得EP(j)>EP(k)时,red

(j)>red

(k),其中,1≤j≤M,1≤k≤M,且j≠k,red

(j)与red

(k)分别表示第j,k路音频数据的多发倍数。
[0006]第二方面,本申请实施例提供了一种音频数据传输装置,音频数据传输装置包括:第一获取模块,用于获取待发送的N路音频数据,N为大于或等于1的正整数;选取模块,用于从N路音频数据中选取M路音频数据,其中,M为正整数,且1≤M≤N;提取模块,用于分别提取M路音频数据的音频特征信息;第二获取模块,用于根据音频特征信息获取与M路音频数据对应的心理声学感知系数EP(i),其中i表示音频数据序号,且1≤i≤M;以及心理声学感知控制模块,用于根据心理声学感知系数EP(i)控制对应的音频数据的多发传输,使得EP(j)>EP(k)时,red

(j)>red

(k),其中,1≤j≤M,1≤k≤M,且j≠k,red

(j)与red

(k)分别表示第j,k路音频数据的多发倍数。
[0007]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存
储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面提供的音频数据传输方法。
[0008]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读取存储介质中存储有程序代码,程序代码可被处理器调用执行上述第一方面提供的音频数据传输方法。
[0009]本申请提供的方案,通过获取待发送的N路音频数据,然后从N路音频数据中选取M路音频数据,然后分别提取M路音频数据的音频特征信息,并根据音频特征信息获取与M路音频数据对应的心理声学感知系数,然后根据心理声学感知系数控制对应的音频数据的多发传输,因此,实现了基于音频数据的心理声学感知系数控制对应的音频数据的多发传输,对心理声学感知系数较大的音频数据采用较大的多发倍数进行传输,对心理声学感知系数较小的音频数据采用较小的多发倍数进行传输,从而保证了音频数据的有效传输,提高了音频数据的传输质量。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1示出了一种适用于本申请实施例的应用场景示意图;
[0012]图2示出了本申请一个实施例提供的音频数据传输方法的一种流程示意图;
[0013]图3示出了本申请实施例提供的一种声学等响曲线图示意图;
[0014]图4示出了本申请实施例提供的一种基于心理声学感知加权系数公式计算得到的感知加权系数示意图;
[0015]图5示出了本申请另一个实施例提供的音频数据传输方法的一种流程示意图;
[0016]图6示出了本申请再一个实施例提供的音频数据传输方法的一种流程示意图;
[0017]图7示出了本申请又另一个实施例提供的音频数据传输方法的一种流程示意图;
[0018]图8示出了本申请实施例提供的音频数据传输装置的一种结构示意图;
[0019]图9示出了本申请实施例提供的一种电子设备的结构框图;
[0020]图10示出了本申请实施例的用于保存或者携带现实根据本申请实施例的音频数据传输方法的程序代码的存储单元。
具体实施方式
[0021]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0022]术语定义:
[0023]多发:在传输网络不稳定导致丢包时,将原始数据包复制多份并在不同时间间隔下进行发送。
[0024]心理声学:是研究声音和它引起的听觉之间关系的一门边缘学科,既是声学的一个分支,也是心理物理学的一个分支。
[0025]心理声学感知系数:表征声音被人耳听觉感知的能力,心理声学感知系数越大,声音就越容易被人耳听觉感知,心理声学感知系数越小,声音就越难被人耳听觉感知。
[0026]丢包率:指测试中所丢失数据包数量占所发送数据组的比率,丢包率与数据包长度以及数据包发送频率相关。
[0027]梅尔频率倒谱系数:根据人类听觉系统提出的,模拟人耳对不同频率语音的感知。
[0028]在多人通话时,服务器在将获取到的音频数据通过网络转发至客户端时,由于传输网络的不稳定性导致传输过程出现丢包现象,进而导致客户端接收音频数据出现卡顿和不连贯,采取重复多发的方法可有效解决网络丢包问题。
[0029]传统的多人语音通信系统中,对所有的音频数据包都采用相同的多发倍数进行多发传输,而音频数据包的多发倍数是基于客户端的实际丢包率来决定的,丢包率越高则多发倍数越高,且多发倍数越高则消耗的带宽越大,因此,在一些网络宽带受限的情况下,多发引起所需带宽的倍数增加,进而导致丢包更加严本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据传输方法,其特征在于,所述方法包括:获取待发送的N路音频数据,所述N为大于或等于1的正整数;从所述N路音频数据中选取M路音频数据,其中,所述M为正整数,且1≤M≤N;分别提取所述M路音频数据的音频特征信息;根据所述音频特征信息获取与所述M路音频数据对应的心理声学感知系数EP(i),其中i表示音频数据序号,且1≤i≤M;以及根据所述心理声学感知系数EP(i)控制对应的音频数据的多发传输,使得EP(j)>EP(k)时,red

(j)>red

(k),其中,1≤j≤M,1≤k≤M,且j≠k,red

(j)与red

(k)分别表示第j,k路音频数据的多发倍数。2.根据权利要求1所述的方法,其特征在于,所述根据所述音频特征信息获取与所述M路音频数据对应的心理声学感知系数EP(i)包括:根据以下公式分别计算所述M路音频数据的心理声学感知系数:其中,i表示音频数据序号,且1≤i≤M,EP(i)为第i路音频数据的心理声学感知系数,k为频点序号,K为总频点数,p(i,k)为第i路音频数据的功率绝对值,cof(k)为频点k的心理声学感知加权系数。3.根据权利要求2所述的方法,其特征在于,所述根据所述心理声学感知系数EP(i)控制对应的音频数据的多发传输包括:根据所述心理声学感知系数以及第一多发倍数公式确定每路所述音频数据的多发倍数,所述第一多发倍数公式为:red'(i)=f(EP(i))*red_org(i),red'(i)为第i路音频数据的多发倍数,f(EP(i))∈[0,1],且f(EP(i))单调递增,red_org(i)为第i路音频数据基于丢包率计算的多发倍数。4.根据利要求1所述的方法,其特征在于,所述方法还包括:根据所述音频特征信息获取与所述M路音频数据对应的梅尔频率倒谱系数M(i);根据所述梅尔频率倒谱系数M(i)控制对应的音频数据的多发传输,使得M(j)>M(k)时,red

(j)>red

(k)。5.根据权利要求4所述的方法,其特征在于,所述根据所述音频特征信息获取与所述M路音频数据对应的梅尔频率倒谱系数M(i)包括:根据以下公式分别计算所述M路音频数据的梅尔频率倒谱系数:其中,i为音频数据序号,l为滤波器序号,L为滤波器数量,T为滤波采样点数,F
i
(l)为第i路音频数据的第l个滤波器的滤波输出,M(i)为第i路音频数据的梅尔频率倒谱系数。6.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1