System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种银行柜台对讲降噪方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种银行柜台对讲降噪方法、装置、电子设备及存储介质制造方法及图纸

技术编号:44253855 阅读:4 留言:0更新日期:2025-02-11 13:51
本发明专利技术实施例公开了一种银行柜台对讲降噪方法、装置、电子设备及存储介质。该方法包括:获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。采用本发明专利技术实施例的技术方案,通过基于音视协同的语音降噪算法去过滤环境噪音以及其他客户声音,提高柜员办理业务的效率,增加用户的客户旅程体验。

【技术实现步骤摘要】

本专利技术实施例涉及数据处理,尤其涉及一种银行柜台对讲降噪方法、装置、电子设备及存储介质


技术介绍

1、银行柜台是银行客户办理业务的具体地点,在银行的发展历史中一直承担着重要的角色。尽管现在的超级柜台等新型运营服务的出现,替代了一部分传统柜台的功能,但是对于一些特殊的业务,比如大额转账、银行卡挂失、贷款等重要业务还是需要在传统柜台上进行办理。

2、目前线下网点的银行柜台由于柜台与柜台之间、柜台与等候客户之间的距离普遍比较小,客户通过传统麦克风与柜员进行交流的时候,柜员收到的声音一般都是夹杂着非目标客户声音等环境噪音的混合音频,这样会影响柜员与客户沟通的效率,进而影响柜员办理业务的效率,降低客户体验。线下网点通常会在柜台上设置隔断或者增加独立会客室来解决上述问题,但是成本比较高,而且网点众多,可实施性比较差。

3、因此,如何对柜员与客户间的沟通进行降噪是本领域技术人员亟待解决的技术问题。


技术实现思路

1、本专利技术实施例提供一种银行柜台对讲降噪方法、装置、电子设备及存储介质,以实现过滤环境噪音以及其他客户声音,提高柜员办理业务的效率,增加用户的客户旅程体验。

2、第一方面,本专利技术实施例提供了一种银行柜台对讲降噪方法,包括:

3、获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;

4、将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;

5、确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。

6、第二方面,本专利技术实施例还提供了一种银行柜台对讲降噪装置,包括:

7、音视频信息获取模块,用于获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;

8、音视频特征交叉融合模块,用于将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;

9、音视频特征跨上下文注意力融合模块,用于确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。

10、第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:

11、一个或多个处理器;

12、存储装置,用于存储一个或多个程序;

13、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的银行柜台对讲降噪方法。

14、第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的银行柜台对讲降噪方法。

15、第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本专利技术任意实施例所述的银行柜台对讲降噪方法。

16、本专利技术实施例提供了一种银行柜台对讲降噪方法、装置、电子设备和存储介质,通过获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。采用本专利技术实施例的技术方案,通过基于音视协同的语音降噪算法去过滤环境噪音以及其他客户声音,提高柜员办理业务的效率,增加用户的客户旅程体验。

本文档来自技高网...

【技术保护点】

1.一种银行柜台对讲降噪方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述将提取的音频时序特征以及视频时序特征进行交叉注意力特征融合,得到试听动作特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述音频线性特征以及视频线性特征进行交叉注意力特征融合,得到融合后的目标音频线性特征以及目标视频线性特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述确定包含上下文信息的目标音频特征,并将所述目标音频特征与试听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频,包括:

6.根据权利要求5所述的方法,其特征在于,所述依据所述音频掩膜以及音频中间特征,得到目标音频,包括:

7.一种银行柜台对讲降噪装置,其特征在于,所述装置包括:

8.一种电子设备,其特征在于,包括:

9.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一所述的银行柜台对讲降噪方法。

10.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的银行柜台对讲降噪方法。

...

【技术特征摘要】

1.一种银行柜台对讲降噪方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述将提取的音频时序特征以及视频时序特征进行交叉注意力特征融合,得到试听动作特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述音频线性特征以及视频线性特征进行交叉注意力特征融合,得到融合后的目标音频线性特征以及目标视频线性特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述确定包含上下文信息的目标音频特征,...

【专利技术属性】
技术研发人员:周誉
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1