基于人声分离的客服服务质检方法、系统、设备及介质技术方案

技术编号:27835908 阅读:26 留言:0更新日期:2021-03-30 12:01
本发明专利技术涉及一种基于人声分离的客服服务质检方法、系统、设备及介质,该方法包括:采集客服与客户的通话录音;采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;若所述匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。本发明专利技术能够对通话录音进行人声分离,仅保留需要质检的客服的声音,排除了不需要质检的客户的声音,并给出了客服的匹配度以便进一步确认客服的身份,大大降低了质检人员的工作负担。的工作负担。的工作负担。

【技术实现步骤摘要】
基于人声分离的客服服务质检方法、系统、设备及介质


[0001]本专利技术涉及声音识别领域,具体涉及一种基于人声分离的客服服务质检方法、系统、设备及介质。

技术介绍

[0002]在通话场景中,至少有两人参与对话,在一些业务场景中,有将不同说话人区分并且识别其说话内容,并进一步进行话术分析的需求,但受技术限制,待识别和分离的语音有时会保存在同一个通道中或者在一个嘈杂环境中会同时收到多个人的语音,给进一步从混杂了多个说话人的语音中识别目标说话人的语音并进行话术分析造成困难,也就是所谓的“鸡尾酒会问题”。
[0003]目前在售楼处及其他电话销售场景,为保证客服话术的精准和专业,需要对客服的通话录音进行人工质检,在人工质检过程中,由于可能存在录音文件标记的客服与实际情况不对应的情况,需要质检人员辨认通话录音对应的客服,并且,由于通话录音除包含了需要质检的客服的声音之外,还包含了不需要质检的客户的声音,给质检人员带来了额外的工作负担。

技术实现思路

[0004]本专利技术提供一种基于人声分离的客服服务质检方法、系统、设备及介质,能够解决上述的技术问题。
[0005]本专利技术解决上述技术问题的技术方案如下:
[0006]一种基于人声分离的客服服务质检方法,包括:
[0007]采集客服与客户的通话录音;
[0008]采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;
[0009]若所述匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。
[0010]进一步,所述采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度,具体包括:
[0011]采用预先训练的声纹特征模型提取全体客服的原始音频中的声音特征;
[0012]将所述声音特征和所述通话录音输入预先训练的降噪网络模型,分离得到所述通话录音中客服的第一音频文件以及最大匹配度。
[0013]上述进一步方案的有益效果是,通过采集声音特征与通话录音一并输入降噪网络模型,能够实现对通话录音中客服声音的自动提取,并给出识别出的最大匹配度及对应的客服。
[0014]进一步,所述根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检,具体包括:
[0015]将所述第一音频文件转写成文字并发送至显示设备进行展示,以便质检人员根据所述显示设备展示的文字对所述最大匹配度对应的客服的服务进行质检。
[0016]上述进一步方案的有益效果是,通过将音频转换成文字以便于直观、方便地对客服的服务进行质检。
[0017]进一步,该方法还包括:
[0018]若所述最大匹配度低于预设阈值,则对所述第一音频文件进行人工标注,确定所述第一音频文件对应的客服。
[0019]上述进一步方案的有益效果是,对于匹配度低的音频文件,通过人工标注的方式来确定其对应的客服。
[0020]进一步,该方法还包括:
[0021]若所述最大匹配度低于预设阈值,则将所述最大匹配度对应的客服作为推荐结果;
[0022]对所述推荐结果是否准确进行人工确认;
[0023]若所述推荐结果准确,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检,否则更改所述推荐结果。
[0024]上述进一步方案的有益效果是,主动推荐低于预设阈值的匹配度中的最高值对应的客服,降低了质检人员的工作量。
[0025]本专利技术还提供一种基于人声分离的客服服务质检系统,包括:
[0026]音频采集模块,用于采集客服与客户的通话录音;
[0027]人声分离模块,用于采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;
[0028]质检模块,用于若所述匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。
[0029]进一步,所述人声分离模块,具体包括:
[0030]特征采集单元,用于采用预先训练的声纹特征模型提取全体客服的原始音频中的声音特征;
[0031]人声分离单元,用于将所述声音特征和所述通话录音输入预先训练的降噪网络模型,分离得到所述通话录音中客服的第一音频文件以及最大匹配度。
[0032]进一步,所述质检模块,具体用于:
[0033]将所述第一音频文件转写成文字并发送至显示设备进行展示,以便质检人员根据所述显示设备展示的文字对所述最大匹配度对应的客服的服务进行质检。
[0034]本专利技术还提供一种终端设备,包括:
[0035]处理器;以及
[0036]存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行上述的方法。
[0037]本专利技术还提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行上述的方法。
[0038]本专利技术的有益效果是:能够对通话录音进行人声分离,仅保留需要质检的客服的声音,排除了不需要质检的客户的声音,并给出了客服的匹配度以便进一步确认客服的身
份,大大降低了质检人员的工作负担。
附图说明
[0039]图1为本专利技术实施例提供的一种基于人声分离的客服服务质检方法的流程图;
[0040]图2为本专利技术实施例提供的人声分离的技术原理示意图;
[0041]图3为本专利技术实施例提供的一种基于人声分离的客服服务质检系统的结构框图;
[0042]图4为本专利技术实施例提供的一种客服服务质检的工作流程图。
具体实施方式
[0043]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0044]图1为本专利技术实施例提供的一种基于人声分离的客服服务质检方法的流程图,如图1所示,该方法包括:
[0045]11、采集客服与客户的通话录音;
[0046]该步骤中,通话录音的采集可采用现有的录音软件实现,本专利技术对此不作限制。
[0047]12、采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;
[0048]具体的,由于通话录音中同时包含了客服和客户的声音,这里需要对通话录音进行人声分离,得到仅包含客服声音的音频文件。
[0049]人声分离是一种对于特定说话人的语音进行提取和分离的技术,它不仅可以将对话过程中,不同说话人的语音进行区分,甚至可以将对话中重叠在一起的不同人声分离开来。是在语音输入为单通道情况下,对于鸡尾酒会问题的一种技术解决方案。该步骤中的降噪网络模型。
[0050]如图2所示,说话人分离的技术方案分为注册阶段和分离阶段两个模块。在注册阶段,需要对目标说话人的语音进行特征提取;在分离阶段,需要对原本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人声分离的客服服务质检方法,其特征在于,包括:采集客服与客户的通话录音;采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;若所述最大匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。2.根据权利要求1所述的一种基于人声分离的客服服务质检方法,其特征在于,所述采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度,具体包括:采用预先训练的声纹特征模型提取全体客服的原始音频中的声音特征;将所述声音特征和所述通话录音输入预先训练的降噪网络模型,分离得到所述通话录音中客服的第一音频文件以及最大匹配度。3.根据权利要求1所述的一种基于人声分离的客服服务质检方法,其特征在于,所述根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检,具体包括:将所述第一音频文件转写成文字并发送至显示设备进行展示,以便质检人员根据所述显示设备展示的文字对所述最大匹配度对应的客服的服务进行质检。4.根据权利要求1

3任一项所述的一种基于人声分离的客服服务质检方法,其特征在于,还包括:若所述最大匹配度低于预设阈值,则对所述第一音频文件进行人工标注,确定所述第一音频文件对应的客服。5.根据权利要求4所述的一种基于人声分离的客服服务质检方法,其特征在于,还包括:若所述最大匹配度低于预设阈值,则将所述最大匹配度对应的客服作为推荐结果;对所述推荐结果是否准确进行人工确认;若所述推荐结果准确,则根...

【专利技术属性】
技术研发人员:刘露婕王鸣
申请(专利权)人:厦门云知芯智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1