基于深度学习的客服回复推荐方法技术

技术编号：15910804 阅读：42 留言：0更新日期：2017-08-01 22:30

本发明专利技术公开了一种基于深度学习的客服回复推荐方法，通过直接从客服的对话记录中学习对话模型，来进行客服回复推荐；该方法通过端到端的训练方式进行模型构建，相比传统基于规则和人工特征的方法构建速度快；该方法提升了客服回复推荐系统中回复内容的覆盖范围；同时本发明专利技术可应用于各种垂直领域的客服服务中，包括但不限于：电商、医药、法律等。

Customer service response recommendation method based on depth learning

The invention discloses a reply recommendation method of deep learning service based on learning through direct dialogue model from customer service dialogue recording, to recommend the method of customer service reply; by the end of the training mode of model construction, compared with the traditional method and artificial rules based on the characteristics of fast construction; the method to enhance the recovery the contents of the coverage of customer service reply recommendation system; at the same time, the invention can be applied to various vertical field service, including but not limited to: electricity, medicine and the law.

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的客服回复推荐方法
本专利技术属于客服辅助
，具体涉及一种基于深度学习的客服回复推荐方法。
技术介绍
随着互联网经济的不断发展，提供在线商品和服务选购的电商平台的规模和成交量也在日益增大，这种改变的潮流对在线客服的服务效率提出更高要求。同时一些新的客服场景，如在线健康咨询、在线法律咨询，涉及知识较多，对从业人员专业要求较高。现有的解决思路有两种：一种是利用智能客服机器人直接替代人工承接一部分咨询任务；另一种是利用计算机来辅助人工客服以提升其工作效率。常见的智能客服机器人通常以手工构建的知识库作为核心引擎，替代人工完成一些常见的简单咨询服务。这种方法的不足之处主要有：机器人通常只能处理常见的标准问题，对于一些个性化较强或出现频次较低的问题则较难处理；复杂知识库的建立需要极大成本；用户对机器人的接受程度不如人工客服。计算机辅助人工客服，通常可以完成一些不直接和用户交互的任务如：标准回复推荐、常用问答对推荐。现有的客服辅助系统主要针对所需专业知识相对较少的场景设计，如交易纠纷、商品信息咨询等。现有解决方案需要人工进行前期知识库或语料的建立和整理，成本较高。同时知识库和标准回复存在覆盖率问题，通常针对一些出现次数较多的问题设计，对于个性化较强的问题则覆盖较少。传统在线客服场景问题分布比较集中、涉及专业知识相对较少，因此知识库和语料的构建成本和覆盖率问题比较容易解决。但是在对专业要求较高的场景下，由于涉及知识的深度和广度增加，知识库和对应语料的构建难度也随之增加，实现较高问题覆盖率较难。
技术实现思路
针对现有技术所存在的问题，本专利技术提出了一种基于...
基于深度学习的客服回复推荐方法

【技术保护点】
一种基于深度学习的客服回复推荐方法，包含以下步骤：(1)对聊天语料库中所有的客服回复进行聚类并构建候选客服回复集合；并在客服聊天语料库上训练词向量；(3)对客服聊天语料库的对话记录进行标准化处理；(4)在经标准化处理后的语料集上训练对话模型；(5)将客服当前的对话记录输入上述对话模型，获取相应的推荐回复。

【技术特征摘要】
1.一种基于深度学习的客服回复推荐方法，包含以下步骤：(1)对聊天语料库中所有的客服回复进行聚类并构建候选客服回复集合；并在客服聊天语料库上训练词向量；(3)对客服聊天语料库的对话记录进行标准化处理；(4)在经标准化处理后的语料集上训练对话模型；(5)将客服当前的对话记录输入上述对话模型，获取相应的推荐回复。2.根据权利要求1所述的客服回复推荐方法，其特征在于：所述的步骤(1)具体包括如下步骤：1.1使用中文分词器对语料中所有的客服回复进行处理，获取其分词结果；1.2使用LDA主题模型对分词后的对话进行主题建模，并获取其向量表示；1.3使用k-means聚类算法对客服回复在向量空间上进行聚类；1.4在每个类簇中均随机选取等量的回复，对其进行去重操作后构成候选回复集。3.根据权利要求1所述的客服回复推荐方法，其特征在于：所述的步骤(3)中对话记录的标准化处理的具体步骤如下：3.1删除对话记录中所有的格式控制符号及非人工产生的对话；3.2将对话按照产生对话的角色分为：用户的对话和客服的对话两种，在此基础上将每次服务的多条对话记录处理为：{user,host,user,host，…}的次序，即每组对话均以用户的对话开始，用户和客服的对话严格交替出现，其中user代表用户，host代表客服。4.根据权利要求1所述的客服回复推荐方法，其特征在于：所述的步骤(4)中对话模型训练的具体步骤如下：4.1从数据集中随机选取一批样本，每个样本均为多组对话序列可以表示为:{(u0,h0,u1,h1,…),…}，其中ui表示对话序列中用户的第i句话，hi表示对话序列中客服的第i句对话；4.2为样本中的每个客服对话均从语料库中随机选取一条客服对话作为负样本4.3对样本中每组对话序列的所有对话：均使用单句编码器进行编码，将各个句子均编码成为定长向量，分别获得各个句子的向量表达：4.4将每组对话序列表示为向量序列：在此基础上使用上下文编码器对该序列进行编码，其可以获取每条对话出现时已产生的对话记录的编码结果，用户和客服的每条对话都各自对应一个时刻，编码后获得一个向量输出序列，表示对各个时刻对话历史的编码结果：其中k为该组对话序列中所含对话数量；4.5在客服对话的每个时间刻，均使用对应时间刻i的作为输入，使用如下公式计算局部损失函数值：其中margin为手工设定的阈值，其中Sim(x,y)为相似度函数，其计算方法如下面公式所示：4.6将当前批次样本中所有局部损耗进行相加，得到本次更新所需的损失函数值，计算公式如下:其中：n为当前批次所含样本的数量，mi为第i个样本中...

【专利技术属性】
技术研发人员：王东辉，梁建增，庄越挺，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人