【技术实现步骤摘要】
一种融合用户兴趣偏好的对话生成方法
[0001]本专利技术涉及大数据与AI领域,特别涉及一种融合用户兴趣偏好的对话生成方法。
技术介绍
[0002]经典的对话系统(如智能客服系统)主要是基于语言的规则匹配、语意相似度匹配、或者基于大量的历史对话数据训练的通用语言模型,来对某一问句进行回复语句的生成;随着技术的发展,有更多新的算法和思想融入到了对话生成的过程中,主流方法包括通过结合用户一段时间内的所有话语学习用户的兴趣关注点,从而再结合问题语句生成相应的回复话语;还包括针对某一问题语句,对话生成模型生成多个候选回复话语,然后结合与目标用户特征相似用户的喜好,为目标用户推荐其相似用户最喜欢的候选话语作为最终回复语句。使得对话系统逐渐由仅使用大量历史语句进行学习的通用对话系统向结合了用户的兴趣便好的个性化对话系统进行发展。
[0003]现有对话生成技术中的个性化都仅仅结合了相似用户的喜好或者用户历史的对话信息等较浅显地获取用户的兴趣来实现对话生成的个性化,但没有通过用户的特征及行为序列去更深层次的挖掘用户的兴趣化偏好,并将其融入到对话生成系统中。
技术实现思路
[0004]本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种融合用户兴趣偏好的对话生成方法。
[0005]本专利技术提供了如下的技术方案:
[0006]本专利技术提供一种融合用户兴趣偏好的对话生成方法,包括数据、模型结构和具体流程,其中数据包含以下:
[0007](1.1)用户特征数据
[0008]用户 ...
【技术保护点】
【技术特征摘要】
1.一种融合用户兴趣偏好的对话生成方法,其特征在于,包括数据、模型结构和具体流程,其中数据包含以下:(1.1)用户特征数据用户特征数据主要包括用户年龄、性别、所在城市等一系列与用户相关的数据;我们可以通过用户在平台注册时所填写的信息或第三方平台上的信息获取到;(1.2)用户行为数据用户行为数据主要包括用户在某些平台上一段时间窗口内对于事物的点击、观看、收藏、转发等行为的记录;可以通过平台后台对于用户的行为记录日志拉取到;(1.3)问题语句问题语句指用户使用对话系统时提出的问题的自然语言序列;模型结构包含以下:基于用户特征数据的特征提取模块、基于用户行为数据的兴趣预测模块、基于问句的回复语生成模块;其中,对于用户特征提取模块的特征提取过程可采用如TextCNN等网络进行特征提取,兴趣预测模块中的特征提取可采用LSTM等时序网络进行特征提取,回复语生成模块中的特征提取采用Transformer网络结构进行计算;具体流程包括以下:S1、当用户对问答系统(如,智能客服系统、智能外呼系统)提出某个问题时,系统获取所提问题的文本序列(如语音则通过ASR转为文本);同时获取该用户的特征数据和一段时间窗口内的行为数据;S2、对于用户的特征数据、用户行为数据、问题语句,分别通过特定的Embedding形式,转化为表征向量;用户特征数据中主要为字符类别型变量,在此通过构建字典的方式将数据映射到相应索引编码,然后将索引编码输入word2vec进行推理,获取各数据的表征向量;用户行为数据主要为数值型类别变量,将这些变量分别通过一定手段的数理统计技术的处理,拿到对应时间序列的向量,作为表征向量;问题文本数据通过使用开源Bert模型进行动态编码的学习,拿到序列对应的表征向量;S3、针对各表征向量,分别采用相应的网络结构进行特征提取;其中用户特征数据采用TextCNN网络进行特征提取;行为数据采用LSTM网络进行时序特征提取;问题文本序列特征采用Transformer网络进行特征提取;用户特征数据主要是离散的结构化数据,如[性别,年龄,城市,
…
],由于这类离散特征数据比较稀疏,且前后之间没时间序列关联,特征较容易提取,所以这块采用结构简单、速度较快的TextCNN进行特征提取,最后得到一个包含用户特征信息的高维特征向量;用户的行为数据,这块主要采用的是一定时间窗口内用户在某些平台上的点击、浏览等行为数据,该数据具有时间序列特征,同时由于LSTM网络是典型的处理序列数据的网络,所以在这块采用的LSTM网络进行时序特征的提取,得到包含用户兴趣变化趋势的高维特征向量;问题文本数据是一个文本序列数据,主要是基于网络对数据进行特征编...
【专利技术属性】
技术研发人员:杨康,王宣皓,唐文华,
申请(专利权)人:天翼电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。