一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质技术方案

技术编号：27146472 阅读：24 留言：0更新日期：2021-01-27 22:00

本发明专利技术涉及数据分析技术领域，为基于多轮对话问答式的分析思路衍生方法、系统及存储介质，其方法包括步骤：所输入的自然语言问题进行文本预处理、分词处理；对自然语言问题进行自然语言理解处理，完成意图识别和槽值填充；针对分析任务，当自然语言问题表述不清楚时，通过对话管理实现多轮陈述过程，填充完所有必填的槽值，确定待补充的槽值对；根据待补充的槽值对确定生成自然语言的内容，构建文本结构，得到基本问句，再根据待补充的槽值对将基本问句聚合而成最终问句。本发明专利技术对未表述清楚的分析问题通过追问方式，将关键信息补充完整以完成分析任务；用户无需了解复杂的数据结构、分析方法，降低了数据分析工作的门槛。降低了数据分析工作的门槛。降低了数据分析工作的门槛。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质

[0001]本专利技术涉及数据分析
，尤其涉及一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质。

技术介绍

[0002]现有的问答式数据分析系统，一般是用户提出自然语言描述的问题，系统经过解析后自动查询数据库，得到结果并呈现给用户一个可视化的答案。这仅仅是针对一些特定的比较简单的问题查询，例如用户提出“某地区这个月的用电量是多少”，现有的提问式数据分析系统会将数据库中当月的用电量数据聚合成一个汇总值，并返回给用户一个可视化的视图或者一个具体的数值。
[0003]当用户的提问比较复杂时，如“上半年广州市不同用户类型的用电趋势如何？”，上述现有的提问式数据分析系统，由于仅有数据查询功能，用户所提问题对应的结果并不直接存在于数据库中，因而将不能满足用户的复杂提问式分析需求；此时可通过分析路径推荐的方法，来让用户快速完成数据分析过程。当用户提出的问题与系统共享库中的分析路径都无关系时，则推荐的分析路径很可能不是用户想要的结果，甚至无推荐结果；此时可通过分析节点生成的方法，来满足用户快速获取数据分析结果的需求。
[0004]然而，在更为复杂的情况下，当用户提出的自然语言问题缺少部分关键信息时，无论是分析路径推荐技术还是分析节点生成技术都无法得到有效的分析结果。例如，用户提出“广州市的用电量趋势如何？”因缺少时间窗口信息，用户可能无法得到有效的反馈结果。因此，本专利技术提出基于多轮对话问答式的分析思路衍生方法等技术方案，用于解决上述的问题。<...

【技术保护点】

【技术特征摘要】
1.一种基于多轮对话问答式的分析思路衍生方法，其特征在于，包括以下步骤：S1、对所输入的自然语言问题进行文本预处理、分词处理，将自然语言问题中的词语转为词向量；S2、对所输入的自然语言问题进行自然语言理解处理，完成意图识别和槽值填充；S3、针对分析任务，当所输入自然语言问题的表述不清楚时，通过对话管理实现多轮陈述过程，使步骤S2填充完所有必填的槽值，确定待补充的槽值对；S4、根据待补充的槽值对确定生成自然语言的内容，通过自然语言生成技术构建文本结构，得到基本问句，再根据待补充的槽值对将基本问句聚合而成最终问句。2.根据权利要求1所述的分析思路衍生方法，其特征在于，步骤S2包括：S21、把所输入的自然语言问题进行数据分析的真实意图识别出来；S22、槽值填充，把自然语言问题所相应的文本内容转换成槽值对。3.根据权利要求2所述的分析思路衍生方法，其特征在于，步骤S22中实现槽值填充过程的输入是自然语言问题中的词语经过词向量转换模型转化的稠密向量Xn，输出为槽值对。4.根据权利要求2或3所述的分析思路衍生方法，其特征在于，步骤S22中在LSTM模型前面添加了一个Embedding嵌入层，形成最终的用于实现槽值填充的网络，该网络的输入是当前词在词典中的索引值；槽值填充过程是输入当前词在词典中的索引值，从Embedding嵌入层得到词向量信息，再送入LSTM模型，在LSTM模型中通过softmax函数回归处理得到每个候选标签的概率值，选择概率最大的值作为槽值填充。5.根据权利要求2所述的分析思路衍生方法，其特征在于，步骤S22中槽值填充的过程包括以下步骤：(1)尝试填写自然语言问题所相应的文本内容中词槽；(2)若词槽填写失败，判断该词槽是否必填；(3)若该词槽必填，反问输入端，重新填写该词槽；(4)若该词槽非必填，则针对该词槽所在槽组的填写过程结束。6.根据权利要求1所述的分析思路衍生方法，其特征在于，步骤S3包括：S31、通过自然语言理解进入分析任务流程，通过对话状态维护判断当前分析任务的槽值是否填充完毕，若填充完毕则触发分析任务执行，同时标记下一轮会话将是一个新的分析任务会话；若未填充完毕，则生成自然语言返回给输入端，继续向输入端进行追问以补充未填充的槽值对；S32、通过自然语言理解进入分析任务流程后，对话状态维护负责维护当前的对话状态；生成决策系统根据当前不同的对话状态做出不同的反应，是继续与输入端进行对话交互还是执行分析任务；当前分析任务执行后，通过会话继续执行下...

【专利技术属性】
技术研发人员：姜磊，钟颖欣，辛岩，杨钊，
申请(专利权)人：佰聆数据股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人