一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质技术方案

技术编号:27146472 阅读:24 留言:0更新日期:2021-01-27 22:00
本发明专利技术涉及数据分析技术领域,为基于多轮对话问答式的分析思路衍生方法、系统及存储介质,其方法包括步骤:所输入的自然语言问题进行文本预处理、分词处理;对自然语言问题进行自然语言理解处理,完成意图识别和槽值填充;针对分析任务,当自然语言问题表述不清楚时,通过对话管理实现多轮陈述过程,填充完所有必填的槽值,确定待补充的槽值对;根据待补充的槽值对确定生成自然语言的内容,构建文本结构,得到基本问句,再根据待补充的槽值对将基本问句聚合而成最终问句。本发明专利技术对未表述清楚的分析问题通过追问方式,将关键信息补充完整以完成分析任务;用户无需了解复杂的数据结构、分析方法,降低了数据分析工作的门槛。降低了数据分析工作的门槛。降低了数据分析工作的门槛。

【技术实现步骤摘要】
一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质


[0001]本专利技术涉及数据分析
,尤其涉及一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质。

技术介绍

[0002]现有的问答式数据分析系统,一般是用户提出自然语言描述的问题,系统经过解析后自动查询数据库,得到结果并呈现给用户一个可视化的答案。这仅仅是针对一些特定的比较简单的问题查询,例如用户提出“某地区这个月的用电量是多少”,现有的提问式数据分析系统会将数据库中当月的用电量数据聚合成一个汇总值,并返回给用户一个可视化的视图或者一个具体的数值。
[0003]当用户的提问比较复杂时,如“上半年广州市不同用户类型的用电趋势如何?”,上述现有的提问式数据分析系统,由于仅有数据查询功能,用户所提问题对应的结果并不直接存在于数据库中,因而将不能满足用户的复杂提问式分析需求;此时可通过分析路径推荐的方法,来让用户快速完成数据分析过程。当用户提出的问题与系统共享库中的分析路径都无关系时,则推荐的分析路径很可能不是用户想要的结果,甚至无推荐结果;此时可通过分析节点生成的方法,来满足用户快速获取数据分析结果的需求。
[0004]然而,在更为复杂的情况下,当用户提出的自然语言问题缺少部分关键信息时,无论是分析路径推荐技术还是分析节点生成技术都无法得到有效的分析结果。例如,用户提出“广州市的用电量趋势如何?”因缺少时间窗口信息,用户可能无法得到有效的反馈结果。因此,本专利技术提出基于多轮对话问答式的分析思路衍生方法等技术方案,用于解决上述的问题。<br/>
技术实现思路

[0005]本专利技术提供基于多轮对话问答式的分析思路衍生方法、系统及存储介质,其利用多轮对话技术,对于用户未表述清楚的分析问题通过追问的方式,让用户将分析问题的关键信息补充完整,从而完成分析任务,不需要了解复杂的数据结构、分析方法,大大降低了用户进行数据分析工作的门槛,以便快速探索数据,发现业务中存在的问题。
[0006]根据本专利技术的基于多轮对话问答式的分析思路衍生方法,包括以下步骤:
[0007]S1、对所输入的自然语言问题进行文本预处理、分词处理,将自然语言问题中的词语转为词向量;
[0008]S2、对所输入的自然语言问题进行自然语言理解处理,完成意图识别和槽值填充;
[0009]S3、针对分析任务,当所输入自然语言问题的表述不清楚时,通过对话管理实现多轮陈述过程,使步骤S2填充完所有必填的槽值,确定待补充的槽值对;
[0010]S4、根据待补充的槽值对确定生成自然语言的内容,通过自然语言生成技术构建文本结构,得到基本问句,再根据待补充的槽值对将基本问句聚合而成最终问句。
[0011]在优选的实施例中,步骤S2包括:
[0012]S21、把所输入的自然语言问题进行数据分析的真实意图识别出来;
[0013]S22、槽值填充,把自然语言问题所相应的文本内容转换成槽值对。而步骤S22中实现槽值填充过程的输入是自然语言问题中的词语经过词向量转换模型转化的稠密向量Xn,输出为槽值对。
[0014]优选地,步骤S3包括:
[0015]S31、通过自然语言理解进入分析任务流程,通过对话状态维护判断当前分析任务的槽值是否填充完毕,若填充完毕则触发分析任务执行,同时标记下一轮会话将是一个新的分析任务会话;若未填充完毕,则生成自然语言返回给输入端,继续向输入端进行追问以补充未填充的槽值对;
[0016]S32、通过自然语言理解进入分析任务流程后,对话状态维护负责维护当前的对话状态;生成决策系统根据当前不同的对话状态做出不同的反应,是继续与输入端进行对话交互还是执行分析任务;当前分析任务执行后,通过会话继续执行下一个分析任务;此时对输入端发起的新问题进行实体识别后,判断识别到的实体是否出现在上一分析任务中,如果当前新问题中的实体与上一分析任务毫无关系,则判断为新的分析任务。
[0017]在优选的实施例中,步骤S4包括:
[0018]S41、通过对话状态维护过程中对当前分析任务的槽值对的状态跟踪,确定哪些槽值对需要补充;待补充的槽值对信息为需要生成自然语言的内容,从而向输入端追问来补充当前分析任务的槽值对信息;
[0019]S42、通过基础的提问模板构建组织文本顺序,通过基础的问句结构和待补充的槽值对信息组成基本问句;
[0020]S43、当待补充的槽值对信息多于1个时,将多个待补充的槽值对信息的问句合成一个问句,再结合基础问句生成更加流畅且方便阅读的最终问句;
[0021]S44、基于语言模型和句法结构对最终问句进行优化。
[0022]根据本专利技术的基于多轮对话问答式的分析思路衍生系统,包括:
[0023]预处理模块,用于对所输入的自然语言问题进行文本预处理、分词处理,将自然语言问题中的词语转为词向量;
[0024]自然语言理解模块,用于对所输入的自然语言问题进行自然语言理解处理,完成意图识别和槽值填充;
[0025]对话管理模块,用于针对分析任务,当所输入自然语言问题的表述不清楚时,通过对话管理实现多轮陈述过程,填充完所有必填的槽值,确定待补充的槽值对;
[0026]自然语言生成模块,用于根据待补充的槽值对确定生成自然语言的内容,通过自然语言生成技术构建文本结构,得到基本问句,再根据待补充的槽值对将基本问句聚合而成最终问句。
[0027]本专利技术的存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时,实现本专利技术分析思路衍生方法的步骤。
[0028]与现有技术相比,本专利技术的显著效果在于:利用多轮对话技术,对于用户在一次问话中未表述清楚的分析问题通过追问的方式,让用户将分析问题的关键信息补充完整,从而完成分析任务;同时,基于上下文对话内容即时解析,判断分析节点任务之间的关系,将
一个个独立的分析节点连接起来形成分析路径;使得用户通过自然语言问题的输入就可以完成数据分析工作,不需要了解复杂的数据结构、分析方法,大大降低了用户进行分析工作的门槛,以便快速探索数据,发现业务中存在的问题。
附图说明
[0029]图1是本专利技术分析思路可视化方法的实现流程图;
[0030]图2为CBOW词向量转换模型的结构示意图;
[0031]图3是LSTM模型的结构示意图;
[0032]图4为NBT-CNN架构图。
具体实施方式
[0033]为使得本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合实施例及附图,对本专利技术的技术方案进行清楚、完整的描述。显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0034]参阅图1,本实施例提供的一种基于多轮对话问答式的分析思路衍生方法,包括:
[0035]S1、对所输入的自然语言问题进行文本预处理、分词处理。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多轮对话问答式的分析思路衍生方法,其特征在于,包括以下步骤:S1、对所输入的自然语言问题进行文本预处理、分词处理,将自然语言问题中的词语转为词向量;S2、对所输入的自然语言问题进行自然语言理解处理,完成意图识别和槽值填充;S3、针对分析任务,当所输入自然语言问题的表述不清楚时,通过对话管理实现多轮陈述过程,使步骤S2填充完所有必填的槽值,确定待补充的槽值对;S4、根据待补充的槽值对确定生成自然语言的内容,通过自然语言生成技术构建文本结构,得到基本问句,再根据待补充的槽值对将基本问句聚合而成最终问句。2.根据权利要求1所述的分析思路衍生方法,其特征在于,步骤S2包括:S21、把所输入的自然语言问题进行数据分析的真实意图识别出来;S22、槽值填充,把自然语言问题所相应的文本内容转换成槽值对。3.根据权利要求2所述的分析思路衍生方法,其特征在于,步骤S22中实现槽值填充过程的输入是自然语言问题中的词语经过词向量转换模型转化的稠密向量Xn,输出为槽值对。4.根据权利要求2或3所述的分析思路衍生方法,其特征在于,步骤S22中在LSTM模型前面添加了一个Embedding嵌入层,形成最终的用于实现槽值填充的网络,该网络的输入是当前词在词典中的索引值;槽值填充过程是输入当前词在词典中的索引值,从Embedding嵌入层得到词向量信息,再送入LSTM模型,在LSTM模型中通过softmax函数回归处理得到每个候选标签的概率值,选择概率最大的值作为槽值填充。5.根据权利要求2所述的分析思路衍生方法,其特征在于,步骤S22中槽值填充的过程包括以下步骤:(1)尝试填写自然语言问题所相应的文本内容中词槽;(2)若词槽填写失败,判断该词槽是否必填;(3)若该词槽必填,反问输入端,重新填写该词槽;(4)若该词槽非必填,则针对该词槽所在槽组的填写过程结束。6.根据权利要求1所述的分析思路衍生方法,其特征在于,步骤S3包括:S31、通过自然语言理解进入分析任务流程,通过对话状态维护判断当前分析任务的槽值是否填充完毕,若填充完毕则触发分析任务执行,同时标记下一轮会话将是一个新的分析任务会话;若未填充完毕,则生成自然语言返回给输入端,继续向输入端进行追问以补充未填充的槽值对;S32、通过自然语言理解进入分析任务流程后,对话状态维护负责维护当前的对话状态;生成决策系统根据当前不同的对话状态做出不同的反应,是继续与输入端进行对话交互还是执行分析任务;当前分析任务执行后,通过会话继续执行下...

【专利技术属性】
技术研发人员:姜磊钟颖欣辛岩杨钊
申请(专利权)人:佰聆数据股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1