语音增强方法、装置和系统制造方法及图纸

技术编号：33527847 阅读：25 留言：0更新日期：2022-05-19 01:53

一种语音增强方法、装置和系统，该方法包括：获取目标接待人员接待目标客户的过程的录音音频，其中所述录音音频是由佩戴在所述目标接待人员身上的拾音设备拾取的；获取与所述录音音频同一时段的监控视频，从所述监控视频中确定出所述目标接待人员和其他人员；根据所述目标接待人员从所述其他人员中确定出所述目标客户；确定所述目标客户在所述时段内相对于所述目标接待人员的方位信息，并根据所述方位信息确定降噪参数；根据所述降噪参数对所述录音音频进行降噪处理。本申请将拾音设备放置在接待过程中涉及的两个对象中的一个对象身上，结合监控视频锁定该对象再定位另一对象，最终获得两者之间的相对方位用于降噪，能够得到高质量的降噪效果。质量的降噪效果。质量的降噪效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音增强方法、装置和系统

[0001]本申请涉及语音增强
，更具体地涉及一种语音增强方法、装置和系统。

技术介绍

[0002]客户去4S店购车时，4S店工作人员往往会安排一对一接待。为了检验门店销售在接待过程中的专业性和服务态度，以及更好地了解客户的购车意向、关注点等，4S店接待质检应运而生。所谓门店质检，也即销售在接待客户过程中进行录音，然后通过转写和语义抽取，判断销售接待的专业性和服务态度等，如是否有说礼貌用语、车辆参数和门店活动等是否介绍完整和正确。另外，通过对客户的分析，了解其购车意向、购车关注点等等，生成电子工单，方便后续对客户的跟踪回访和购车的争取。然而，4S店内环境非常嘈杂，导致录音转写效果非常差，从而降低了质检的准确率。
[0003]当前质检系统一般对录制音频进行常规的降噪处理对录音进行增强处理。但是4S店环境非常嘈杂，同时看车和接待的较多，录音中往往会包含较多的他人人声干扰。另外，接待过程中，销售跟客户的位置不固定，这会导致录音音量存在较大幅度的变化。传统的语音增强算法对4S店场景效果较差。在其他业务场景中，有基于人脸识别对说话人进行定位，然后通过麦克风阵列拾取所定位方向的语音，达到降噪的效果。然而，4S店空间很大，人员多而且走动频繁，固定摄像头受到视线遮挡的影响，无法实时有效的获取到特定人员(如某位接待的销售顾问)的图像信息。

技术实现思路

[0004]为了解决上述问题中的至少一个而提出了本申请。根据本申请一方面，提供了一种语音增强方法，所述方法包括：获取目标接待人员...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法，其特征在于，所述方法包括：获取目标接待人员接待目标客户的过程的录音音频，其中所述录音音频是由佩戴在所述目标接待人员身上的拾音设备拾取的；获取与所述录音音频同一时段的监控视频，从所述监控视频中确定出所述目标接待人员和其他人员；根据所述目标接待人员从所述其他人员中确定出所述目标客户；确定所述目标客户在所述时段内相对于所述目标接待人员的方位信息，并根据所述方位信息确定降噪参数；根据所述降噪参数对所述录音音频进行降噪处理。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述目标接待人员接待所述目标客户的过程中所述目标接待人员的位置信息；所述从所述监控视频中确定出所述目标接待人员和其他人员，包括：获取所述监控视频中包括的各个人员在所述时段的位置信息；将所述目标接待人员的位置信息与所述各个人员在所述时段的位置信息相比较，以从所述各个人员中确定出所述目标接待人员，所述目标接待人员以外的人员为其他人员。3.根据权利要求2所述的方法，其特征在于，所述将所述目标接待人员的位置信息与所述各个人员在所述时段的位置信息相比较，以从所述各个人员中确定出所述目标接待人员，包括：基于所述目标接待人员的位置信息获取所述目标接待人员在接待所述目标客户的过程中的移动轨迹；基于所述各个人员在所述时段的位置信息获取所述各个人员在所述时段的移动轨迹；将所述目标接待人员在接待所述目标客户的过程中的移动轨迹与所述各个人员在所述时段的移动轨迹相匹配，以从所述各个人员中确定出所述目标接待人员。4.根据权利要求1所述的方法，其特征在于，所述录音音频包括所述目标接待人员的标识信息，所述从所述监控视频中确定出所述目标接待人员和其他人员，包括：从预存特征库中获取与所述标识信息对应的特征，基于所述特征从所述监控视频中确定出所述目标接待人员，所述目标接待人员以外的人员为其他人员。5.根据权利要求1所述的方法，其特征在于，所述根据所述目标接待人员从所述其他人员中确定出所述目标客户，包括：获取所述监控视频中所述目标接待人员的周边人员与所述目标接待人员之间的动态距离信息，并根据所述动态距离信息从所述其他人员中确定出所述目标客户。6.根据权利要求5所述的方法，其特征在于，所述获取所述监控视频中所述目标接待人员的周边人员与所述目标接待人员之间的动态距离信息，并根据所述动态距离信息从所述其他人员中确定出所述目标客户，包括：获取所述监控视频中所述目标接待人员的周边人员与所述目标接待人员之间的距离的动态变化情况；将与所述目标接待人员之间的距离的动态变化最小的人员确定为所述目标客户。7.根据权利要求1所述的方法，其特征在于，所述确定所述目标客户在所述时段内相对于所述目标接待人员的方...

【专利技术属性】
技术研发人员：李深安，许国朋，傅志皇，王兴宝，雷琴辉，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人