语音消息处理方法、装置、设备及介质制造方法及图纸

技术编号:28490145 阅读:11 留言:0更新日期:2021-05-19 22:10
本申请公开了一种语音消息处理方法、装置、设备及介质,该方法包括:接收至少两个的消息发送者发送的至少两条语音消息;将该语音消息进行归类处理,得到与该消息发送者相对应的语音消息串;对该语音消息串进行降噪处理,得到与该语音消息串所包含的语音消息对应的降噪参数。本申请实施例的接收终端通过对不同消息发者的语音消息归类后,以语音消息串为处理对象做降噪处理,进而使得在按照时间顺序对多条语音消息准备连续播放时,能够读取降噪处理得到的降噪参数,直接对待播放的多条语音消息进行降噪处理,避免了针对每条语音消息初始化降噪算法,导致降噪效果不佳,噪声忽大忽小的问题,实现了语音消息的统一处理,提高了用户体验。体验。体验。

【技术实现步骤摘要】
语音消息处理方法、装置、设备及介质


[0001]本申请一般涉及计算机
,尤其涉及语音消息处理方法、装置、设备及介质。

技术介绍

[0002]在互联网的各种社交软件中,语音消息作为最基本的沟通方式,是使用最普遍的信息载体。每个终端设备在录制生成语音消息时,由于所处的声学环境不同,使得产生的语音消息的噪声及音量不同。
[0003]终端设备在接收到不同用户发送的语音消息后,响应用户操作指令,或者按照时间顺序对语音消息进行语音增强处理,然后将处理完的语音消息进行播放。
[0004]对于来自不同消息发送者的语音消息,由于其所处的声学环境不同,使得在同一终端设备上进行语音增强处理后的语音消息播放过程中,不同消息发送者之间的语音消息切换时,出现背景噪声忽大忽小,导致用户体验不佳。

技术实现思路

[0005]鉴于现有技术中的上述缺陷或不足,期望提供一种语音消息处理方法、装置、设备及介质,通过根据消息发送者的对语音消息进行归类,以对归类后的语音消息串进行降噪处理,得到与语音消息串所包含的语音消息对应的降噪参数,以使得连续播放降噪处理后的语音消息前,能够读取预先得到的降噪参数,对语音消息进行有效的降噪处理,避免了背景噪声忽大忽小的问题。
[0006]第一方面,本申请实施例提供了一种语音消息处理方法,该方法包括:
[0007]接收至少两个消息发送者发送的至少两条语音消息;
[0008]将该语音消息进行归类处理,得到与该消息发送者相对应的语音消息串;
[0009]对该语音消息串进行降噪处理,得到与该语音消息串所包含的语音消息对应的降噪参数。
[0010]第二方面,本申请实施例提供了一种语音消息处理装置,该装置包括:
[0011]接收模块,用于接收至少两个消息发送者发送的至少两条语音消息;
[0012]归类模块,用于将该语音消息进行归类处理,得到与该消息发送者相对应的语音消息串;
[0013]降噪模块,用于对该语音消息串进行降噪处理,得到与该语音消息串所包含的语音消息对应的降噪参数。
[0014]第三方面,本申请实施例提供一种处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如上述第一方面所述的方法。
[0015]第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于实现如上第一方面所述的方法。
[0016]本申请实施例提供的语音消息处理方法、装置、设备及介质,终端设备在接收到不同的消息发送者发送的语音消息后,对语音消息进行归类,得到与消息发送者的对应的语音消息串,进而对语音消息串中的语音消息进行降噪处理,得到与语音消息串所包含的语音消息对应的降噪参数,从而使得终端设备在准备连续播放语音消息时,能够读取预先得到的待播放语音消息的降噪参数,对待播放语音消息直接进行降噪处理,避免了针对每条语音消息初始化降噪算法,导致降噪效果不佳,噪声忽大忽小的问题,实现了语音消息的统一处理,提高了用户体验。
附图说明
[0017]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0018]图1所示为本申请实施例的语音消息处理方法的流程示意图;
[0019]图2所示为本申请实施例的语音消息归类方法的流程示意图;
[0020]图3所示为本申请实施例的语音消息拼接的原理示意图;
[0021]图4所示为本申请实施例的语音消息降噪处理方法的流程示意图;
[0022]图5所示为本申请实施例的语音消息音量调节方法的流程示意图;
[0023]图6所示为本申请再一实施例的语音消息处理方法的流程示意图;
[0024]图7所示为本申请实施例的语音消息处理装置的结构示意图;
[0025]图8为本申请实施例的处理设备的计算机处理设备的结构示意图。
具体实施方式
[0026]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关公开,而非对该公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与公开相关的部分。
[0027]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0028]基于IP的语音传输(Voice over Internet Protocol,VoIP)是一种基于IP网络的语音通话技术,即具有数据处理能力的硬件终端设备在发送语音消息时,通过语音的压缩算法把语音数据进行编码压缩处理后,按照网络传输协议标准进行打包,经过IP网络把语音数据包发送到目的IP地址的接收终端。接收终端再把语音数据包解析并压缩处理后,得到原始的语音消息,最后通过调用底层的声卡进行播放。
[0029]本申请中的语音消息可以为录制的持续一定时间的语音数据,一条语音消息可以持续1s或更长的时间。用户在通讯过程中,可以连续发送一条或多条语音消息;或者,两条语音消息之间间隔相当的时间段,如半个小时,或者两个小时等。
[0030]该终端设备可以为智能手机、平板电脑或者计算机等具有语音消息处理、发送及接收功能的硬件。该终端设备中运行有处理器,该处理器可以实现语音消息的录制、发送及接收,并可以对录制或接收到的语音消息进行处理。
[0031]例如,在微信或QQ等即时通讯的场景下,多个用户的集群式的聊天群中,每个用户可以作为消息发送者,间断或持续发送语音消息。如对于多人的聊天群,每个用户与聊天群
中的另一方,或者与聊天群中的其他所有用户进行沟通和交流,如语音聊天。即每个用户的终端设备可以作为语音消息的发送终端,也可以作为语音消息的接收终端。不同用户的终端设备将产生的语音消息,基于IP网络进行传输,使得该聊天群里所有的终端设备能够接收到其他不同终端设备发送的语音消息,进而经过解码处理,进行播放。
[0032]可以理解,该即时通讯软件对应的服务器中存储有每个聊天群中每个用户的账号信息,如每个聊天群的群成员列表。
[0033]还可以理解,在终端设备接收到语音消息,通常响应用户的播放指令,按照顺序进行播放至少两条语音消息时,依次提取待播放的某条语音消息的语音压缩码流,经过解压得到对应的PCM语音数据。然后调用语音增强算法,如降噪算法(NS)和音量调节算法(AGC),对每条语音消息进行降噪处理和音量调节处理。对一条语音消息语音增强处理完毕后,关闭NS及AGC,在处理下一条语音消息时,重新开启。最后将处理后的PCM语音数据存储播放缓存,则设备底层声卡读取后发出声音。
[0034]可以理解,在上述即时通讯场景下的语音消息,大部分持续时间较短,而语音增强算法,如降噪算法和音量调节算法,执行过程通常需要有一段算法收敛时间,如1~2秒。并且,在语音消息播放过程中,每条语音消息做独立的语音增强处理,使得每次语音增强处理都本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音消息处理方法,其特征在于,所述方法包括:接收至少两个消息发送者发送的至少两条语音消息;将所述语音消息进行归类处理,得到与所述消息发送者相对应的语音消息串;对所述语音消息串进行降噪处理,得到与所述语音消息串所包含的语音消息对应的降噪参数,并存储。2.根据权利要1所述的语音消息处理方法,其特征在于,得到的所述降噪参数为与所述语音消息串所包含的语音消息一一对应。3.根据权利要求2所述的语音消息处理方法,其特征在于,所述降噪参数是根据与之对应的语音消息所包含的第一个数据帧计算得到的。4.根据权利要求2或3所述的语音消息处理方法,其特征在于,存储与所述语音消息一一对应的降噪参数包括:根据每条所述语音消息的消息标识存储对应的所述降噪参数。5.根据权利要求1-3任一项所述的语音消息处理方法,其特征在于,所述将所述语音消息进行归类处理包括:按照归类标识将所述语音消息进行归类,得到与每个归类标识对应的语音消息集合;对每个语音消息集合所包含的语音消息进行脉冲调制解码处理,得到与每条语音消息相对应的多个点信号;对经过脉冲调制解码处理后的每个语音消息集合中的语音进行拼接处理,得到与每个归类标识相对应的语音消息串。6.根据权利要求5所述的语音消息处理方法,其特征在于,所述归类标识为用户标识,则所述将所述语音消息进行归类处理包括:按照用户标识将所述语音消息进行归类处理,得到与每个用户标识对应的语音消息集合。7.根据权利要求5所述的语音消息处理方法,其特征在于,所述归类标识为场景标识,则将所述语音消息进行归类处理包括:按照场景标识将所述语音消息进行归类处理,得到与每个场景标识对应的语音消息集合。8.根据权利要求5所述的语音消息处理方法,其特征在于,所述对经过脉冲调制解码处理后的每个语音消息集合进行拼接处理包括:分别对第M条语音消息的结尾部分的N个点信号,第M+1条语音消息的开始部分的N个点信号进行加窗处理,N及M的取值为自然数;将所述加窗处理后的结果进行算术加处理;对算术加处理的结果进行限制处理后,得到与每个归类标识相对应的语音消息串。9.根据权利要求1-3、6-8任一项所述的语音消息处理方法,其特征在于,每条语音消息包括多个数据帧,则所述对所述语音消...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1