一种基于改进LDA模型的对话模板匹配方法及装置制造方法及图纸

技术编号:35692195 阅读:12 留言:0更新日期:2022-11-23 14:41
本申请公开了一种基于改进LDA模型的对话模板匹配方法及装置,可应用于通讯技术领域或金融领域。在执行所述方法时,获取用户发送的对话数据;基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复对话数据,其中,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的;将所述答复对话数据发送至用户。由此可见,本申请基于蜻蜓算法对LDA模型的主题数进行优化,确定LDA模型的最优主题数,明确了LDA模型的主题数,提高客服机器人对话模板匹配的准确度和匹配效率。机器人对话模板匹配的准确度和匹配效率。机器人对话模板匹配的准确度和匹配效率。

【技术实现步骤摘要】
一种基于改进LDA模型的对话模板匹配方法及装置


[0001]本申请涉及通讯
,尤其涉及一种基于改进LDA模型的对话模板匹配方法及装置。

技术介绍

[0002]随着移动设备设备的普及,应用于终端设备的终端软件APP被广泛使用,在这个背景下,为加大自助服务的建设,提高自助服务效率和服务质量,智能客服机器人应运而生,但是用户在与智能客服机器人沟通时常常会遇到智能机器人时常无法准确回答自己的问题,现在的智能机器人大多的逻辑就是根据客户的输入信息进行对话模板匹配,检测文本内容的相似性,最终从对话模板库中匹配对应的目标对话模板,现有技术中,匹配对应的目标对话模板一般使用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)算法模型(又称文档主题生成模型),但是现有隐含狄利克雷分布LDA算法模型因为主题数的不确定,造成模型的匹配准确度降低,如何提高客服机器人对话模板匹配的准确度,提高客服机器人对话模板匹配效率是一个亟需解决的问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种基于改进LDA模型的对话模板匹配方法及装置,旨在通过改进LDA模型提高客服机器人对话模板匹配的准确度和匹配效率。
[0004]其方案包括:
[0005]第一方面,本申请实施例提供了一种基于改进LDA模型的对话模板匹配方法,所述方法包括:
[0006]获取用户发送的对话数据;
[0007]基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,其中,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的;
[0008]将所述答复数据发送至用户。
[0009]优选的,所述预先训练的文档主题生成LDA模型,包括:
[0010]获取训练对话数据集,所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题;
[0011]将所述训练对话数据作为文档主题生成LDA模型的输入,将所述对话数据对应的训练主题作为所述文档主题生成LDA模型的的输出,并对所述文档主题生成LDA模型进行训练,以获得所述预先训练的文档主题生成LDA模型。
[0012]优选的,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的,包括:
[0013]以模型初始准确率作为所述蜻蜓算法的初始适应度,以模型初始主题数作为所述蜻蜓算法的初始位置,对所述预先训练的文档主题生成LDA模型进行迭代更新,以得到最优
主题数,其中,所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成LDA模型后计算得到的;
[0014]确定所述预先训练的文档主题生成LDA模型的主题数为所述最优主题数,以得到所述预设的文档主题生成LDA模型。
[0015]优选的,所述基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,包括:
[0016]将所述对话数据输入所述预设的文档主题生成LDA模型,以获得所述用户的对话主题;
[0017]基于预设的知识库映射关系,从预设的对话模板库中为所述对话主题匹配对话数据。
[0018]第二方面,本申请实施例提供了一种基于改进LDA模型的对话模板匹配装置,所述装置包括:
[0019]获取模块,用于获取用户发送的对话数据;
[0020]匹配模块,用于基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,其中,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的;
[0021]发送模块,用于将所述答复数据发送至用户。
[0022]优选的,所述预先训练的文档主题生成LDA模型,包括:
[0023]获取训练对话数据集,所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题;
[0024]将所述训练对话数据作为文档主题生成LDA模型的输入,并将所述对话数据对应的训练主题作为所述文档主题生成LDA模型的的输出,对所述文档主题生成LDA模型进行训练,以获得所述预先训练的文档主题生成LDA模型。
[0025]优选的,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的,包括:
[0026]以模型初始准确率作为所述蜻蜓算法的初始适应度,以模型初始主题数作为所述蜻蜓算法的初始位置,对所述预先训练的文档主题生成LDA模型进行迭代更新,以得到最优主题数,其中,所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成LDA模型后计算得到的;
[0027]确定所述预先训练的文档主题生成LDA模型的主题数为所述最优主题数,以得到所述预设的文档主题生成LDA模型。
[0028]优选的,所述匹配模块包括:
[0029]主题获取子模块,用于将所述对话数据输入所述预设的文档主题生成LDA模型,以获得所述用户的对话主题;
[0030]对话匹配子模块,用于基于预设的知识库映射关系,从预设的对话模板库中为所述对话主题匹配答复数据。
[0031]第三方面,本申请实施例提供了一种电子设备,所述电子设备包括:
[0032]存储器,用于存储一个或多个程序;
[0033]处理器;当所述一个或多个程序被所述处理器执行时,实现前述第一方面任一项
所述的方法。
[0034]第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有程序,当所述程序被处理器执行时,实现前述第一方面任一项所述的方法。
[0035]上述技术方案具有如下有益效果:
[0036]本申请实施例提供了一种基于改进LDA模型的对话模板匹配方法及装置。在执行所述方法时,获取用户发送的对话数据;基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,其中,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的;将所述答复数据发送至用户。由此可见,本实施例中基于蜻蜓算法对LDA模型的主题数进行优化,确定LDA模型的最优主题数,明确了LDA模型的主题数,由此提高客服机器人对话模板匹配的准确度和匹配效率。
附图说明
[0037]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例提供的一种基于改进LDA模型的对话模板匹配方法流程示意图;
[0039]图2为本申请实施例提供的一种基于改进LDA模型的对话模板匹配装置结构示意图。
具体实施方式
[0040]下面将结合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进LDA模型的对话模板匹配方法,其特征在于,所述方法包括:获取用户发送的对话数据;基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,其中,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的;将所述答复数据发送至用户。2.根据权利要求1所述的方法,其特征在于,所述预先训练的文档主题生成LDA模型,包括:获取训练对话数据集,所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题;将所述训练对话数据作为文档主题生成LDA模型的输入,将所述对话数据对应的训练主题作为所述文档主题生成LDA模型的的输出,并对所述文档主题生成LDA模型进行训练,以获得所述预先训练的文档主题生成LDA模型。3.根据权利要求2所述的方法,其特征在于,所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的,包括:以模型初始准确率作为所述蜻蜓算法的初始适应度,以模型初始主题数作为所述蜻蜓算法的初始位置,对所述预先训练的文档主题生成LDA模型进行迭代更新,以得到最优主题数,其中,所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成LDA模型后计算得到的;确定所述预先训练的文档主题生成LDA模型的主题数为所述最优主题数,以得到所述预设的文档主题生成LDA模型。4.根据权利要求3所述的方法,其特征在于,所述基于预设的文档主题生成LDA模型,从预设的对话模板库中为所述对话数据匹配答复数据,包括:将所述对话数据输入所述预设的文档主题生成LDA模型,以获得所述用户的对话主题;基于预设的知识库映射关系,从预设的对话模板库中为所述对话主题匹配答复数据。5.一种基于改进LDA模型的对话模板匹配装置,其特征在于,所述装置包括:获取模块,用于获取用户发送的对话数据;匹配模块,用于基于预设的文档主题生成LDA模...

【专利技术属性】
技术研发人员:李文兵王子铭昂娟张全龙程梦琴
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1