一种智能话术推荐方法、系统、设备及存储介质技术方案

技术编号:36905559 阅读:17 留言:0更新日期:2023-03-18 09:24
本发明专利技术实施例公开了一种智能话术推荐方法、系统、设备及存储介质,首先采集客户服务电话中的对话语音并进行信号预处理,得到预处理后的对话语音文件;然后利用预处理后的对话语音文件进行语音韵律识别,根据韵律识别结果,映射得到第一词序文本;对第一词序文本进行第二向量化处理,得到对应的第一向量特征矩阵;对第一向量特征矩阵进行意图实体识别,得到意图识别结果,根据意图识别结果,从第一词序文本中提取出意图实体,并利用意图实体,得到第二词序文本;利用第二词序文本,在语料库中进行语义相似度匹配,得到推荐话术。本发明专利技术实施例实现了针对带有方言的语音的语音准确识别,有效提高了话术推荐的推荐准确率。有效提高了话术推荐的推荐准确率。有效提高了话术推荐的推荐准确率。

【技术实现步骤摘要】
一种智能话术推荐方法、系统、设备及存储介质


[0001]本专利技术实施例涉及语音处理
,具体涉及一种智能话术推荐方法、系统、设备及存储介质。

技术介绍

[0002]随着云计算和大数据技术发展,电信产业的客户服务呼叫中心需要对来电咨询人的对话语音进行识别并转录为文本,根据转录文本为客服工作人员推荐相关的答复话术,从而提高客户服务工作人员的工作效率。
[0003]现有技术方案是基于普通话的主流语音识别,对于不同地域的方言语音识别错误率高,并且由于地域方言韵律差异性而导致信号频率分布不均匀,使得方言语音的语义分析歧义较大,导致基于语义的话术推荐的推荐错误率高。

技术实现思路

[0004]为此,本专利技术实施例提供一种智能话术推荐方法、系统、设备及存储介质,以解决现有技术针对带有方言的语音的语音识别错误率高和话术推荐错误率高的问题。
[0005]为了实现上述目的,本专利技术实施例提供如下技术方案:
[0006]根据本专利技术实施例的第一方面,提供了一种智能话术推荐方法,所述方法包括:
[0007]对客户服务电话中的语音进行声音采集,得到对话语音信号,对所述对话语音信号进行信号预处理,得到预处理后的对话语音文件;
[0008]利用所述预处理后的对话语音文件进行第一向量化处理,得到对应的频谱特征矩阵;
[0009]将所述频谱特征矩阵输入至预先训练好的韵律模型,得到模型计算结果,利用所述模型计算结果,得到所述频谱特征矩阵的韵律识别结果,并根据所述韵律识别结果,对所述频谱特征矩阵进行文本映射处理,得到第一词序文本;
[0010]基于所述第一词序文本中的词特征,对所述第一词序文本进行第二向量化处理,得到对应的第一向量特征矩阵;
[0011]对所述第一向量特征矩阵进行意图实体识别,得到意图识别结果,根据所述意图识别结果,从所述第一词序文本中提取出意图实体,并利用所述意图实体,得到第二词序文本;
[0012]利用所述第二词序文本,在语料库中进行语义相似度匹配,得到推荐话术。
[0013]进一步地,对客户服务电话中的语音进行声音采集,得到对话语音信号,对所述对话语音信号进行信号预处理,得到预处理后的对话语音文件,包括:
[0014]利用麦克风采集所述客户服务电话中的对话语音,得到所述对话语音信号;
[0015]对所述对话语音信号进行第一波束形成处理,得到第一预处理信号;
[0016]对所述第一预处理信号进行第二波束形成处理,得到第二预处理信号;
[0017]利用所述第二预处理信号进行频谱信号控制处理,得到所述对话语音文件。
[0018]进一步地,利用所述预处理后的对话语音文件进行第一向量化处理,得到对应的频谱特征矩阵,包括:
[0019]基于时序对所述对话语音文件进行切分,得到切分后的对话语音文件;
[0020]针对每段所述切分后的对话语音文件进行特征提取,得到所述切分后的对话语音文件对应的语音频谱特征,所述语音频谱特征包括频谱权重参数t
n
、信号延时参数y
n
和方言音强参数τ
n
,其中,n为大于或等于0且小于切分总段数的正整数;
[0021]利用所述频谱权重参数t
n
、所述信号延时参数y
n
和所述方言音强参数τ
n
,计算得到频谱特征矩阵A,所述频谱特征矩阵A的计算公式为:
[0022]A={A(n)}
[0023]A(n)=∑y
n
×
s(t
n

n
)
[0024]其中,A(n)表示所述频谱特征矩阵A中的第n个元素;s为多元非线性拟合参数。
[0025]进一步地,将所述频谱特征矩阵输入至预先训练好的韵律模型,得到模型计算结果,利用所述模型计算结果,得到所述频谱特征矩阵的韵律识别结果,包括:
[0026]将所述频谱特征矩阵A输入至韵律识别模型,计算得到韵律模型计算结果X,所述韵律模型计算结果X的计算公式为:
[0027][0028]其中,m由所述频谱特征矩阵A的长度决定;j为预设的加权参数;x为预设参数;ω、θ和v分别为音高参数、音强参数和音长参数,分别通过提取历史语音数据的音高、音强和音长并计算平均值得到;
[0029]分别利用预设的普通话模板语音文件和预设的方言话模板语音文件,得到普通话模板阈值X'和方言话模板阈值X”;
[0030]利用所述韵律模型计算结果X和所述普通话模板阈值X',计算得到第一差值绝对值C1,所述第一差值绝对值C1的计算公式为:
[0031]C1=||X|

|X

||
[0032]利用所述韵律模型计算结果X和所述方言话模板阈值X”,计算得到第二差值绝对值C2,所述第二差值绝对值C2的计算公式为:
[0033]C2=||X|

|X

||
[0034]判断所述第一差值绝对值C1是否大于所述第二差值绝对值C2;
[0035]若所述第一差值绝对值C1大于所述第二差值绝对值C2,则所述频谱特征矩阵A的韵律识别结果为方言话;
[0036]若所述第一差值绝对值C1小于或等于所述第二差值绝对值C2,则所述频谱特征矩阵A的韵律识别结果为普通话。
[0037]进一步地,基于所述第一词序文本中的词特征,对所述第一词序文本进行第二向量化处理,得到对应的第一向量特征矩阵,包括:
[0038]对所述第一词序文本进行向量化编码,得到词序文本向量;
[0039]利用所述词序文本向量和对应的预设特征加权参数,计算得到第一向量特征矩阵Q,所述第一向量特征矩阵Q的计算公式为:
[0040]Q={Q
t
}
[0041]Q
t
=f(x
t
+K
t
)
[0042]其中,Q
t
为特征词向量,表示所述第一向量特征矩阵Q的第t个的元素;x
t
表示所述词序文本向量中的第t个词向量;K
t
为所述第t个词向量对应的预设特征加权参数,所述预设特征加权参数包括词性特征参数、词根特征参数和词缀特征参数。
[0043]进一步地,对所述第一向量特征矩阵进行意图实体识别,得到意图识别结果,根据所述意图识别结果,从所述第一词序文本中提取出意图实体,并利用所述意图实体,得到第二词序文本,包括:
[0044]针对所述第一向量特征矩阵Q中的各个所述特征词向量Q
t
,计算得到对应的意图实体概率P,所述意图实体概率P的计算公式为:
[0045][0046]其中,z和a分别表示预设词法权重参数和预设语法权重参数;Q
t
‑1表示所述第一向量特征矩阵Q的第t

1个的元素;m由所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能话术推荐方法,其特征在于,所述方法包括:对客户服务电话中的语音进行声音采集,得到对话语音信号,对所述对话语音信号进行信号预处理,得到预处理后的对话语音文件;利用所述预处理后的对话语音文件进行第一向量化处理,得到对应的频谱特征矩阵;将所述频谱特征矩阵输入至预先训练好的韵律模型,得到模型计算结果,利用所述模型计算结果,得到所述频谱特征矩阵的韵律识别结果,并根据所述韵律识别结果,对所述频谱特征矩阵进行文本映射处理,得到第一词序文本;基于所述第一词序文本中的词特征,对所述第一词序文本进行第二向量化处理,得到对应的第一向量特征矩阵;对所述第一向量特征矩阵进行意图实体识别,得到意图识别结果,根据所述意图识别结果,从所述第一词序文本中提取出意图实体,并利用所述意图实体,得到第二词序文本;利用所述第二词序文本,在语料库中进行语义相似度匹配,得到推荐话术。2.如权利要求1所述的一种智能话术推荐方法,其特征在于,对客户服务电话中的语音进行声音采集,得到对话语音信号,对所述对话语音信号进行信号预处理,得到预处理后的对话语音文件,包括:利用麦克风采集所述客户服务电话中的对话语音,得到所述对话语音信号;对所述对话语音信号进行第一波束形成处理,得到第一预处理信号;对所述第一预处理信号进行第二波束形成处理,得到第二预处理信号;利用所述第二预处理信号进行频谱信号控制处理,得到所述对话语音文件。3.如权利要求2所述的一种智能话术推荐方法,其特征在于,利用所述预处理后的对话语音文件进行第一向量化处理,得到对应的频谱特征矩阵,包括:基于时序对所述对话语音文件进行切分,得到切分后的对话语音文件;针对每段所述切分后的对话语音文件进行特征提取,得到所述切分后的对话语音文件对应的语音频谱特征,所述语音频谱特征包括频谱权重参数t
n
、信号延时参数y
n
和方言音强参数τ
n
,其中,n为大于或等于0且小于切分总段数的正整数;利用所述频谱权重参数t
n
、所述信号延时参数y
n
和所述方言音强参数τ
n
,计算得到频谱特征矩阵A,所述频谱特征矩阵A的计算公式为:A={A(n)}A(n)=∑y
n
×
s(t
n

n
)其中,A(n)表示所述频谱特征矩阵A中的第n个元素;s为多元非线性拟合参数。4.如权利要求3所述的一种智能话术推荐方法,其特征在于,将所述频谱特征矩阵输入至预先训练好的韵律模型,得到模型计算结果,利用所述模型计算结果,得到所述频谱特征矩阵的韵律识别结果,包括:将所述频谱特征矩阵A输入至韵律识别模型,计算得到韵律模型计算结果X,所述韵律模型计算结果X的计算公式为:其中,m由所述频谱特征矩阵A的长度决定;j为预设的加权参数;x为预设参数;ω、θ和v
分别为音高参数、音强参数和音长参数,分别通过提取历史语音数据的音高、音强和音长并计算平均值得到;分别利用预设的普通话模板语音文件和预设的方言话模板语音文件,得到普通话模板阈值X'和方言话模板阈值X

;利用所述韵律模型计算结果X和所述普通话模板阈值X',计算得到第一差值绝对值C1,所述第一差值绝对值C1的计算公式为:C1=||X|

|X

||利用所述韵律模型计算结果X和所述方言话模板阈值X

,计算得到第二差值绝对值C2,所述第二差值绝对值C2的计算公式为:C2=||X|

|X

||判断所述第一差值绝对值C1是否大于所述第二差值绝对值C2;若所述第一差值绝对值C1大于所述第二差值绝对值C2,则所述频谱特征矩阵A的韵律识别结果为方言话;若所述第一差值绝对值C1小于或等于所述第二差值绝对值C2,则所述频谱特征矩阵A的韵律识别结果为普通话。5.如权利要求4所述的一种智能话术推荐方法,其特征在于,基于所述第一词序文本中的词特征,对所述第一词序文本进行第二向量化处理,得到对应的第一向量特征矩阵,包括:对所述第一词序文本进行向量化编码,得到词序文本向量;利用所述词序文本向量和对应的预设特征加权参数,计算得到第一向量特征矩阵Q,所述第一向量特征矩阵Q的计算公...

【专利技术属性】
技术研发人员:姜晓丹安军刚张晶王双邓雄张成凯樊辉
申请(专利权)人:北京伽睿智能科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1