一种用于对话交互系统的数据处理方法及装置制造方法及图纸

技术编号：15639525 阅读：289 留言：0更新日期：2017-06-16 00:06

一种用于对话交互系统的数据处理方法及装置，其中，该方法包括：获取用户输入的对话交互数据并解析，生成对话交互数据对应的候选答案集合；计算对话交互数据与预设问题答案集合中各个问题的相似度，并根据各个问题的相似度确定最相似问题，预设问题答案集合中问题与其对应答案的相关度满足设定的高相关度标准；获取预设问题答案集合中最相似问题的答案，并计算最相似问题的答案与候选答案集合中各个答案的相似度，根据候选答案集合中各个答案的相似度从候选答案集合中确定出相似度最高的答案并输出。本方法通过借用高相关度的问题答案集合，保证了对话交互中，对交互信息输出与其相关度最高的回复，保证了对话交互质量，提升了对话交互过程中的用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于对话交互系统的数据处理方法及装置
本专利技术涉及机器人
，具体地说，涉及一种用于对话交互系统的数据处理方法及装置。
技术介绍
随着科学技术的不断发展，信息技术、计算机技术以及人工智能技术的引入，机器人的研究已经逐步走出工业领域，逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人，人机交互也就成为决定智能机器人发展的重要因素。机器人通常采用对话交互系统来实现与用户之间的人机对话，对话交互系统的实现架构大体可以分为检索式模型和生成式模型两种。其中，检索式模型是从已经存在的语料中查找与问题最为匹配的答案，其准确率较高但适应性较差。与之相反，生成式模型则是通过大量的语料和机器学习算法训练得到的，其具有很好的系统适应性，但是目前无法保证较高的准确率。由于检索式模型合乎语法并且相对可靠可控，因此目前行业内仍然以采用检索式模型为主。然而，对于检索式模型来说，其语料库中问题与答案的质量的好坏将直接影响其用户体验。如果语料库质量不佳的话，很可能会造成对话交互系统与用户之间的交互出现前言不搭后语或是输出不提供任何信息的应付性答案等问题，这都对对话系统的用户体验有着致命影响。
技术实现思路
为解决上述问题，本专利技术提供了一种用于对话交互系统的数据处理方法，其包括：对话交互数据获取步骤，获取用户输入的对话交互数据并解析，生成所述对话交互数据对应的候选答案集合；最相似问题确定步骤，计算所述对话交互数据与预设问题答案集合中各个问题的相似度，并根据各个问题的相似度确定...
一种用于对话交互系统的数据处理方法及装置

【技术保护点】
一种用于对话交互系统的数据处理方法，其特征在于，包括：对话交互数据获取步骤，获取用户输入的对话交互数据并解析，生成所述对话交互数据对应的候选答案集合；最相似问题确定步骤，计算所述对话交互数据与预设问题答案集合中各个问题的相似度，并根据各个问题的相似度确定最相似问题，所述预设问题答案集合中问题与其对应答案的相关度满足设定的高相关度标准；答案生成步骤，获取所述预设问题答案集合中所述最相似问题的答案，并计算所述最相似问题的答案与所述候选答案集合中各个答案的相似度，根据所述候选答案集合中各个答案的相似度从所述候选答案集合中确定出相似度最高的答案并输出。

【技术特征摘要】
1.一种用于对话交互系统的数据处理方法，其特征在于，包括：对话交互数据获取步骤，获取用户输入的对话交互数据并解析，生成所述对话交互数据对应的候选答案集合；最相似问题确定步骤，计算所述对话交互数据与预设问题答案集合中各个问题的相似度，并根据各个问题的相似度确定最相似问题，所述预设问题答案集合中问题与其对应答案的相关度满足设定的高相关度标准；答案生成步骤，获取所述预设问题答案集合中所述最相似问题的答案，并计算所述最相似问题的答案与所述候选答案集合中各个答案的相似度，根据所述候选答案集合中各个答案的相似度从所述候选答案集合中确定出相似度最高的答案并输出。2.如权利要求1所述的方法，其特征在于，在所述最相关问题确定步骤中，计算所述对话交互数据与预设问题答案集合中各个问题的相似度的步骤包括：对所述对话交互数据进行分词处理，获取所述对话交互数据中各个分词的词向量；根据所述对话交互数据中各个分词的词向量及其权重，计算所述对话交互数据的句向量；获取所述预设问题答案集合中各个问题的句向量，计算所述对话交互数据的句向量与预设问题答案集合中各个问题的句向量的相似度，得到所述对话交互数据与预设问题答案集合中各个问题的相似度。3.如权利要求2所述的方法，其特征在于，根据tf-idf算法计算所述对话交互数据中各个分词的权重。4.如权利要求1～3中任一项所述的方法，其特征在于，在所述答案生成步骤中，如果所述最相似问题的答案与所述候选答案集合中各个答案的相似度均小于预设相似度阈值，则对所述候选答案集合进行聚类迭代，确定所述候选答案集合中与所述对话交互数据最相关的答案并输出。5.一种用于对话交互系统...

【专利技术属性】
技术研发人员：包强，
申请(专利权)人：北京光年无限科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人