音频数据传输方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32436406 阅读：14 留言：0更新日期：2022-02-26 07:54

本申请公开了一种音频数据传输方法、装置、电子设备及存储介质，上述音频数据传输方法包括：获取待发送的N路音频数据；从N路音频数据中选取M路音频数据；分别提取M路音频数据的音频特征信息；根据音频特征信息获取与M路音频数据对应的心理声学感知系数EP(i)；以及根据心理声学感知系数控制对应的音频数据的多发传输，使得EP(j)>EP(k)时，red'(j)>red'(k)。本方法可实现基于音频数据的心理声学感知系数控制对应的音频数据的多发传输，对心理声学感知系数较大的音频数据采用较大的多发倍数进行传输，对心理声学感知系数较小的音频数据采用较小的多发倍数进行传输，从而保证了音频数据的有效传输，提高了音频数据的传输质量。量。量。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据传输方法、装置、电子设备及存储介质

[0001]本申请涉及网络传输
，更具体地，涉及一种音频数据传输方法、装置、电子设备及存储介质。

技术介绍

[0002]在多人交互的语音通信系统中，多人通话质量主要受网络丢包影响，由于传输网络的不稳定性导致传输过程出现丢包现象，造成接收端声音的卡顿和不连贯，严重降低了收听者的体验。采用重复多发，即将音频数据包复制多份并在不同时间间隔下发送至接收端，可以有效避免网络丢包导致接收端收不到相应音频数据包的问题。
[0003]传统的多人通话中，音频数据包的下行多发是基于客户端的实际丢包率来实现，即对所有的音频数据包都采用相同的多发策略，多发策略在解决网络丢包的同时需要多倍的网络带宽作为代价，但是在一些网络带宽受限的情况下，多发引起所需带宽的数倍增加，进而导致丢包更加严重。

技术实现思路

[0004]鉴于上述问题，本申请提出了一种音频数据传输方法、装置、电子设备及存储介质，能够实现基于音频数据的心理声学感知系数控制对应的音频数据的多发传输，对心理声学感知系数较大的音频数据采用较大的多发倍数进行传输，对心理声学感知系数较小的音频数据采用较小的多发倍数进行传输，从而保证了音频数据的有效传输，提高了音频数据的传输质量。
[0005]第一方面，本申请实施例提供了一种音频数据传输方法，音频数据传输方法包括：获取待发送的N路音频数据，N为大于或等于1的正整数；从N路音频数据中选取M路音频数据，其中，M为正整数，且1≤M≤N；分别提取M路音频数据的音频特征信息...

【技术保护点】

【技术特征摘要】
1.一种音频数据传输方法，其特征在于，所述方法包括：获取待发送的N路音频数据，所述N为大于或等于1的正整数；从所述N路音频数据中选取M路音频数据，其中，所述M为正整数，且1≤M≤N；分别提取所述M路音频数据的音频特征信息；根据所述音频特征信息获取与所述M路音频数据对应的心理声学感知系数EP(i)，其中i表示音频数据序号，且1≤i≤M；以及根据所述心理声学感知系数EP(i)控制对应的音频数据的多发传输，使得EP(j)>EP(k)时，red
’
(j)>red
’
(k)，其中，1≤j≤M，1≤k≤M，且j≠k，red
’
(j)与red
’
(k)分别表示第j，k路音频数据的多发倍数。2.根据权利要求1所述的方法，其特征在于，所述根据所述音频特征信息获取与所述M路音频数据对应的心理声学感知系数EP(i)包括：根据以下公式分别计算所述M路音频数据的心理声学感知系数：其中，i表示音频数据序号，且1≤i≤M，EP(i)为第i路音频数据的心理声学感知系数，k为频点序号，K为总频点数，p(i，k)为第i路音频数据的功率绝对值，cof(k)为频点k的心理声学感知加权系数。3.根据权利要求2所述的方法，其特征在于，所述根据所述心理声学感知系数EP(i)控制对应的音频数据的多发传输包括：根据所述心理声学感知系数以及第一多发倍数公式确定每路所述音频数据的多发倍数，所述第一多发倍数公式为：red'(i)＝f(EP(i))*red_org(i)，red'(i)为第i路音频数据的多发倍数，f(EP(i))∈[0，1]，且f(EP(i))单调递增，red_org(i)为第i路音频数据基于丢包率计算的多发倍数。4.根据利要求1所述的方法，其特征在于，所述方法还包括：根据所述音频特征信息获取与所述M路音频数据对应的梅尔频率倒谱系数M(i)；根据所述梅尔频率倒谱系数M(i)控制对应的音频数据的多发传输，使得M(j)>M(k)时，red
’
(j)>red
’
(k)。5.根据权利要求4所述的方法，其特征在于，所述根据所述音频特征信息获取与所述M路音频数据对应的梅尔频率倒谱系数M(i)包括：根据以下公式分别计算所述M路音频数据的梅尔频率倒谱系数：其中，i为音频数据序号，l为滤波器序号，L为滤波器数量，T为滤波采样点数，F
i
(l)为第i路音频数据的第l个滤波器的滤波输出，M(i)为第i路音频数据的梅尔频率倒谱系数。6.根据权利要求4所述的方法，...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人