System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及金融科技领域,具体涉及一种智能客服的语音处理方法、装置、设备和介质。
技术介绍
1、对于金融行业而言,伴随着行业朝移动化、细分化、多元化发展,发展智能客服是大势所趋,智能客服赋能传统客服,可以解决传统人工客服模式受人力资源和数据处理能力影响而面临的困境,使用户及时得到满意的答复,可以提升自身服务质量和用户的满意度,更可以减少人工服务,降低企业的运营成本。智能客服让过去单一繁复的业务变得简洁明了,可以应用到电话销售、电话咨询、电话回访等多元化场景中,涉及售前、售中、售后全环节,同时还能收集和分析问题,为智能营销提供相应的大数据分析。
2、目前智能客服发出的语音与人工客服的语音差距较大,存在自然流畅度较低的问题,主要是语调、重音以及节律等不够真实和自然,这可能会导致用户不适应或者降低语音可懂度等情况,进而导致用户对金融服务的体验好感度下降。因此,尽管对于金融产品的智能客服技术已经在实践中取得了不错的表现,但仍需要进一步的改善。
技术实现思路
1、本申请实施例提供一种智能客服的语音处理方法、装置、设备和介质,能够提升金融智能客服发出的语音更加真实和自然,进而提升客服服务效果及水平。
2、第一方面,本申请实施例提供一种智能客服的语音处理方法,所述方法包括以下步骤:
3、获取待转换成语音的文本序列;
4、将所述文本序列输入到字符嵌入层,得到所述文本序列中各个字符对应的字符嵌入向量;
5、将各个所述字符对应的字符嵌入向量输入
6、根据各个所述字符对应的词性,得到各个所述字符对应的字符词性对;
7、依次遍历所述文本序列中各个字符,将当前遍历字符对应的字符词性对以及上下文字符对应的字符词性对输入到条件权重层,得到当前遍历字符对应的条件权重;
8、将各个所述字符对应的所述字符嵌入向量和所述条件权重输入到加权激活层,得到各个所述字符对应的韵律特征;
9、根据各个所述字符对应的韵律特征对所述文本序列进行语音合成,生成与所述文本序列对应的语音。
10、在一些实施例中,所述将当前遍历字符对应的字符词性对以及上下文字符对应的字符词性对输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
11、根据预设的滑窗掩码机制确定当前遍历字符的前一个字符和后一个字符;
12、将当前遍历字符对应的字符词性对、前一个字符对应的字符词性对、后一个字符对应的字符词性对分别输入到条件权重层,得到当前遍历字符对应的条件权重。
13、在一些实施例中,所述条件权重层包括输入层和输出层,所述将当前遍历字符对应的字符词性对、前一个字符对应的字符词性对、后一个字符对应的字符词性对分别输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
14、将当前遍历字符对应的字符词性对、前一个字符对应的字符词性对、后一个字符对应的字符词性对分别输入到所述输入层,得到当前遍历字符对应的权重向量、前一个字符对应的权重向量、后一个字符对应的权重向量;
15、将当前遍历字符对应的权重向量、前一个字符对应的权重向量、后一个字符对应的权重向量共同输入到所述输出层,得到当前遍历字符对应的条件权重。
16、在一些实施例中,所述输入层通过以下步骤生成所述权重向量:
17、对输入的字符词性对中的字符进行第一全连接处理,得到字符特征向量;
18、对输入的字符词性对中的词性进行第二全连接处理,得到词性特征向量;
19、计算输入的字符词性对中的字符和词性的张量积,对字符和词性的张量积进行第三全连接处理,得到交互特征向量;
20、根据所述字符特征向量、所述词性特征向量和所述交互特征向量生成所述权重向量。
21、在一些实施例中,所述将各个所述字符对应的所述字符嵌入向量和所述条件权重输入到加权激活层,得到各个所述字符对应的韵律特征,包括:
22、对于所述文本序列中的每个所述字符,将所述字符对应的所述字符嵌入向量和所述条件权重输入到所述加权激活层,使得所述加权激活层输出所述字符对应各种韵律标签的概率,其中,不同韵律标签表示的停顿的持续时长不同;
23、根据所述字符对应各种所述韵律标签的概率,确定所述字符对应的韵律特征。
24、在一些实施例中,所述词性预测层通过以下公式生成各个所述字符对应的词性:
25、
26、其中,表示词性,softmax(·)表示归一化激活函数,fc(·)表示全连接层,conv2d表示conv2d卷积层,ffn2(·)表示2层前馈神经网络,et表示字符嵌入向量。
27、在一些实施例中,所述根据各个所述字符对应的韵律特征对所述文本序列进行语音合成,生成与所述文本序列对应的语音,包括:
28、将所述文本序列输入到声学模型,得到所述文本序列中各个所述字符对应的声学特征;
29、根据所述文本序列中各个所述字符对应的声学特征和韵律特征得到预测的梅尔频谱;
30、基于所述梅尔频谱确定所述文本序列对应的音频。
31、第二方面,本申请实施例提供一种智能客服的语音处理装置,所述装置包括:
32、文本序列获取模块,用于获取待转换成语音的文本序列;
33、向量获取模块,用于将所述文本序列输入到字符嵌入层,得到所述文本序列中各个字符对应的字符嵌入向量;
34、词性预测模块,用于将各个所述字符对应的字符嵌入向量输入到词性预测层,得到各个所述字符对应的词性;
35、字符词性对生成模块,用于根据各个所述字符对应的词性,得到各个所述字符对应的字符词性对;
36、权重预测模块,用于依次遍历所述文本序列中各个字符,将当前遍历字符对应的字符词性对以及上下文字符对应的字符词性对输入到条件权重层,得到当前遍历字符对应的条件权重;
37、韵律预测模块,用于将各个所述字符对应的所述字符嵌入向量和所述条件权重输入到加权激活层,得到各个所述字符对应的韵律特征;
38、语音合成模块,用于根据各个所述字符对应的韵律特征对所述文本序列进行语音合成,生成与所述文本序列对应的语音。
39、第三方面,本申请实施例提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序或指令,所述处理器执行所述计算机程序或指令时实现本申请实施例第一方面提供的方法。
40、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序或指令,所述计算机程序或指令被处理器执行时实现本申请实施例第一方面提供的方法。
41、本申请实施例提供的方案,将待转换成语音的文本序列输入到字符嵌入层,以得到所述文本序列中各个字符对应的字符嵌入向量;再根据各个所述字符对应的词性得到各个所述字符对应的字符词性对本文档来自技高网...
【技术保护点】
1.一种智能客服的语音处理方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述将当前遍历字符对应的字符词性对以及上下文字符对应的字符词性对输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
3.根据权利要求2所述的方法,其特征在于,所述条件权重层包括输入层和输出层,所述将当前遍历字符对应的字符词性对、前一个字符对应的字符词性对、后一个字符对应的字符词性对分别输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
4.根据权利要求3所述的方法,其特征在于,所述输入层通过以下步骤生成所述权重向量:
5.根据权利要求1所述的方法,其特征在于,所述将各个所述字符对应的所述字符嵌入向量和所述条件权重输入到加权激活层,得到各个所述字符对应的韵律特征,包括:
6.根据权利要求1所述的方法,其特征在于,所述词性预测层通过以下公式生成各个所述字符对应的词性:
7.根据权利要求1所述的方法,其特征在于,所述根据各个所述字符对应的韵律特征对所述文本序列进行语音合成,生成与所述文本序列对应
8.一种智能客服的语音处理装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序或指令,所述处理器执行所述计算机程序或指令时实现权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序或指令,所述计算机程序或指令被处理器执行时实现如权利要求1至7中任一项所述的方法。
...【技术特征摘要】
1.一种智能客服的语音处理方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述将当前遍历字符对应的字符词性对以及上下文字符对应的字符词性对输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
3.根据权利要求2所述的方法,其特征在于,所述条件权重层包括输入层和输出层,所述将当前遍历字符对应的字符词性对、前一个字符对应的字符词性对、后一个字符对应的字符词性对分别输入到条件权重层,得到当前遍历字符对应的条件权重,包括:
4.根据权利要求3所述的方法,其特征在于,所述输入层通过以下步骤生成所述权重向量:
5.根据权利要求1所述的方法,其特征在于,所述将各个所述字符对应的所述字符嵌入向量和所述条件权重输入到加权激活层,得到各个所...
【专利技术属性】
技术研发人员:郭洋,王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。