一种问答方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23161710 阅读:17 留言:0更新日期:2020-01-21 21:59
本申请公开了一种问答方法、装置、电子设备及存储介质,涉及知识库问答领域。具体实现方案为:确定与自然语言问题匹配的自然语言问题模板,所述自然语言问题模板能够匹配至少一类自然语言问题;根据自然语言问题模板与第一语言问题模板的对应关系,查找所述自然语言问题模板对应的第一语言问题模板;采用所述第一语言问题模板,生成所述自然语言问题对应的第一语言问题。本申请实施例采用的自然语言问题模板能够匹配至少一类自然问题模板,不需要编写数量庞大的模板就可以使用业务检索需求,节约人力及时间成本。

【技术实现步骤摘要】
一种问答方法、装置、电子设备及存储介质
本申请涉及一种计算机
,尤其涉及一种知识库问答(KB-QA,KnowledgeBaseQuestionAnswering)领域。
技术介绍
知识库以三元组的形式存储着大量实体和关系,当用户提出一个自然语言问题时,需要将自然语言问题转换成知识库能理解的语言。现有的问答系统大多基于语义解析、向量建模等方式实现。其中,向量建模在可控性和精确性上较差。基于语义解析的方式在面对较复杂的业务数据时,通常采用基于字符串的正则模板来实现问题的转换。一个正则模板一般只能对应一个自然语言问题的一个问法,导致需要编写数量庞大的规则模板以适应业务检索需求。
技术实现思路
本专利技术实施例提供一种问答方法及装置,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种问答方法,包括:确定与自然语言问题匹配的自然语言问题模板,自然语言问题模板能够匹配至少一类自然语言问题;根据自然语言问题模板与第一语言问题模板的对应关系,查找自然语言问题模板对应的第一语言问题模板;采用第一语言问题模板,生成自然语言问题对应的第一语言问题。由于一个自然语言问题模板能够匹配至少一类自然语言问题,避免了为每一个自然语言问题编写一个自然模板,因此不需要编写数量庞大的模板就可以使用业务检索需求,节约人力及时间成本。在一种实施方式中,第一语言问题模板为SPARQL语言问题模板,第一语言问题为采用SPARQL语言描述的问题。采用SPARQL语言问题模板,能够生成对应的SPARQL问题,便于进行查询检索。在一种实施方式中,确定与自然语言问题匹配的自然语言问题模板之前,还包括:设置多个规则模板,各个规则模板包括自然语言问题模板与第一语言问题模板的对应关系。在一种实施方式中,设置规则模板的方式为:收集至少一类自然语言问题的多种表达方式;分析多种表达方式中的关键字,根据关键字设定词汇匹配规则;并分析多种表达方式中的实体或属性,根据实体或属性设定词性匹配规则;根据词汇匹配规则及词性匹配规则构建自然语言问题模板;根据自然语言问题模板及第一语言问题模板的构建规则,构建自然语言问题模板所对应的第一语言问题模板。每种规则模板对应至少一类自然语言问题的多种表达方式,能够避免编写数量庞大的规则模板,提高效率。在一种实施方式中,还包括:统计无法匹配自然语言问题模板的自然语言问题,根据统计结果对规则模板进行更新维护。对规则模板进行更新维护,能够提高问答系统的鲁棒性。在一种实施方式中,还包括:获取初始数据;对初始数据进行结构化处理,得到结构化的实体数据,并将结构化的实体数据中的实体名称按照自定义字典的格式存储;根据结构化的实体数据定义知识库的本体描述,在本体描述的属性中添加属性的含义;根据本体描述,将结构化的实体数据转换为资源描述框架(RDF)格式的数据。采用RDF格式的数据能够便于采用SPARQL问题进行查询检索。在一种实施方式中,还包括:采用第一语言问题查找资源描述框架格式的数据,得到针对自然语言问题的答案。在一种实施方式中,方法还包括:抽取本体描述的属性,将抽取出的属性作为SPARQL元语;确定与自然语言问题匹配的自然语言问题模板,包括:根据SPARQL元语及实体名称对自然语言问题进行切词处理,得到多个分词;利用多个分词的顺序及各个分词的词性或词汇值分别对各个自然语言问题模板进行匹配检测,确定与自然语言问题匹配的自然语言问题模板;其中,自然语言问题模板包括具有固定顺序的多个分词、以及各个分词的词性或词汇值。采用SPARQL元语及实体名称对自然语言问题进行切词处理,并利用得到的分词进行自然语言问题模板的匹配检测,能够提高查询的准确率。在一种实施方式中,利用多个分词的顺序及各个分词的词性或词汇值分别对各个自然语言问题模板进行匹配检测,包括:结合预先设定的规则推理,利用多个分词的顺序及各个分词的词性或词汇值分别对各个自然语言问题模板进行匹配检测。结合规则推理进行匹配检测,能够便于对复杂问题的查询检索。第二方面,本专利技术实施例提供了一种问答装置,包括:匹配模块,语言确定与自然语言问题匹配的自然语言问题模板,自然语言问题模板能够匹配至少一类自然语言问题;查找模块,语言根据自然语言问题模板与第一语言问题模板的对应关系,查找自然语言问题模板对应的第一语言问题模板;生成模块,语言采用第一语言问题模板,生成自然语言问题对应的第一语言问题。在一种实施方式中,第一语言问题模板为SPARQL语言问题模板,第一语言问题为采用SPARQL语言描述的问题。在一种实施方式中,还包括:设置模块,用于设置多个规则模板,各个规则模板包括自然语言问题模板与第一语言问题模板的对应关系。在一种实施方式中,还包括:获取模块,用于获取初始数据;结构化模块,用于对初始数据进行结构化处理,得到结构化的实体数据,并将结构化的实体数据中的实体名称按照自定义字典的格式存储;本体描述定义模块,根据结构化的实体数据定义知识库的本体描述,在本体描述的属性中添加属性的含义;格式转化模块,用于根据本体描述,将结构化的实体数据转换为资源描述框架格式的数据。在一种实施方式中,还包括:答复模块,用于采用第一语言问题查找资源描述框架格式的数据,得到针对自然语言问题的答案。在一种实施方式中,元语创建模块,用于抽取本体描述的属性,将抽取出的属性作为SPARQL元语;匹配模块用于:根据SPARQL元语及实体名称对自然语言问题进行切词处理,得到多个分词;利用多个分词的顺序及各个分词的词性或词汇值分别对各个自然语言问题模板进行匹配检测,确定与自然语言问题匹配的自然语言问题模板;其中,自然语言问题模板包括具有固定顺序的多个分词、以及各个分词的词性或词汇值。在一种实施方式中,实体名称包括上市公司股票名称;匹配模块进行切词处理时,优先使用上市公司股票名称对自然语言问题进行切词处理。第三方面,本申请实施例提出一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行问答方法的任一方法。第四方面,本申请实施例提出一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行问答方法的任一方法。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1为根据本申请实施例一种问答方法的实现流程示意图一;图2为根据本申请实施例一种问答方法的实现流程示意图二;图3本文档来自技高网...

【技术保护点】
1.一种问答方法,其特征在于,包括:/n确定与自然语言问题匹配的自然语言问题模板,所述自然语言问题模板能够匹配至少一类自然语言问题;/n根据自然语言问题模板与第一语言问题模板的对应关系,查找所述自然语言问题模板对应的第一语言问题模板;/n采用所述第一语言问题模板,生成所述自然语言问题对应的第一语言问题。/n

【技术特征摘要】
1.一种问答方法,其特征在于,包括:
确定与自然语言问题匹配的自然语言问题模板,所述自然语言问题模板能够匹配至少一类自然语言问题;
根据自然语言问题模板与第一语言问题模板的对应关系,查找所述自然语言问题模板对应的第一语言问题模板;
采用所述第一语言问题模板,生成所述自然语言问题对应的第一语言问题。


2.根据权利要求1所述的方法,其特征在于,所述第一语言问题模板为SPARQL语言问题模板,所述第一语言问题为采用SPARQL语言描述的问题。


3.根据权利要求1或2所述的方法,其特征在于,所述确定与自然语言问题匹配的自然语言问题模板之前,还包括:
设置多个规则模板,各个规则模板包括所述自然语言问题模板与所述第一语言问题模板的对应关系。


4.根据权利要求3所述的方法,其特征在于,设置所述规则模板的方式为:
收集至少一类自然语言问题的多种表达方式;
分析所述多种表达方式中的关键字,根据所述关键字设定词汇匹配规则;并分析所述多种表达方式中的实体或属性,根据所述实体或属性设定词性匹配规则;
根据所述词汇匹配规则及词性匹配规则构建自然语言问题模板;
根据所述自然语言问题模板及第一语言问题模板的构建规则,构建所述自然语言问题模板所对应的第一语言问题模板。


5.根据权利要求3所述的方法,其特征在于,还包括:
统计无法匹配自然语言问题模板的自然语言问题,根据统计结果对所述规则模板进行更新维护。


6.根据权利要求2所述的方法,其特征在于,还包括:
获取初始数据;
对所述初始数据进行结构化处理,得到结构化的实体数据,并将所述结构化的实体数据中的实体名称按照自定义字典的格式存储;
根据所述结构化的实体数据定义知识库的本体描述,在所述本体描述的属性中添加所述属性的含义;
根据所述本体描述,将所述结构化的实体数据转换为资源描述框架格式的数据。


7.根据权利要求6所述的方法,其特征在于,还包括:
采用所述第一语言问题查找所述资源描述框架格式的数据,得到针对所述自然语言问题的答案。


8.根据权利要求6所述的方法,其特征在于,所述方法还包括:抽取所述本体描述的属性,将抽取出的属性作为SPARQL元语;
所述确定与自然语言问题匹配的自然语言问题模板,包括:
根据所述SPARQL元语及所述实体名称对自然语言问题进行切词处理,得到多个分词;
利用所述多个分词的顺序及各个分词的词性或词汇值分别对各个自然语言问题模板进行匹配检测,确定与所述自然语言问题匹配的自然语言问题模板;其中,所述自然语言问题模板包括具有固定顺序的多个分词、以及各个所述分词的词性或词汇值。


9.根据权利要求8所述的方法,其特征在于,所述利用所述多个分词的顺序及各个...

【专利技术属性】
技术研发人员:周丽芳尹存祥骆金昌方军钟辉强吴晓晖
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1