标准知识库的构建方法、电子装置及存储介质制造方法及图纸

技术编号:17541671 阅读:25 留言:0更新日期:2018-03-24 18:45
本发明专利技术公开了一种标准知识库的构建方法,属于数据库维护领域。一种标准知识库的构建方法,包括如下步骤:S1、构建答案文件;S2、构建问题模板;S3、设置恒定项和疑问词;S4、预设问题‑答案对的生成规则;S5、形成问题‑答案对。采用本发明专利技术构建标准知识库,可以实现批量导入数据,并根据规则自动生成问题‑答案对,减少了基础数据库的维护工作量,大大提高了工作效率。

The construction method, electronic device and storage medium of standard knowledge base

The invention discloses a method of constructing a standard knowledge base, which belongs to the field of database maintenance. A method for constructing a standard knowledge base, which comprises the following steps: S1, S2, construction of the answer file; construction template; S3, set constant and interrogative words; S4, answers to the questions set generation rules; S5 formation, answers. Construction of standard knowledge base by the invention, can achieve bulk import data, and according to the rules of the automatic generation of answers, reduce the maintenance of basic database, greatly improving the work efficiency.

【技术实现步骤摘要】
标准知识库的构建方法、电子装置及存储介质
本专利技术涉及数据库维护领域,涉及一种标准知识库的构建方法、电子装置及存储介质。
技术介绍
随着互联网的飞速发展,人们服务意识的提高,网络客服已经普及到各行各业,深入到日常商业服务的各个环节。目前,常见的网络客户通常由智能客服机器人和人工客服组成,相较于传统的客服方式,智能客服可以实现昼夜和节假日的全天候服务,分流人工客服负担,从而有效降低企业客服领域的运营成本。但是,智能客服机器人的回答都是事先设置好的,通常都是按一个问题对应一个答案的方式进行配对保存在基础数据库中,因此在构建基础数据库时,需要尽可能多地维护问题-答案对,以实现智能客服机器人的智能回答,因而也使得基础数据库的维护工作量巨大,各种问题只要有一处关键词变化,就要重新维护一个问题-答案对,耗费大量的人力成本。因此,现在急需一种可快速维护基础数据库的方法,以降低企业在基础数据库维护方面的人力成本。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中数据库维护工作量大的问题,提出了一种标准知识库的构建方法、电子装置及计算机可读存储介质,通过设定问题和答案的组成规则,使得系统可以根据设定的规则将接收到的内容进行问题和答案的自动生成。本专利技术是通过下述技术方案来解决上述技术问题:1、一种标准知识库的构建方法,其特征在于,包括如下步骤:S1、构建答案文件:搜集答案,将所述答案按统一格式拆分后整理到同一个文件中,所述文件包括表格或者文本;S2、构建问题模板:根据答案文件中的答案确定问题模板,所述问题模板为包括有若干变动项、若干恒定项和疑问词的词序列;S3、设置恒定项和疑问词:根据答案文件中的答案所表述的意思,确定问题模板中的恒定项和疑问词;S4、形成问题-答案对:根据问题-答案对的生成规则,获取所述答案文件中相应位置的内容嵌入到所述问题模板中的相应变动项中生成问题,同时获取答案文件中相应位置的内容以生成答案,将生成的所述问题和所述答案关联保存为问题-答案对。其中,当步骤S1中所述文件为表格时,包括以下分步骤:S11、搜集答案;S12、将每个答案拆分为由若干关键词组成的词序列;S13、获取每个词序列中表征答案含义的两个含义关键词;S14、将含义关键词去重并分类;S15、将一类含义关键词作为表格的首行,另一类含义关键词作为表格的首列,且首行和首列的交叉单元格空白;S16、获取词序列中表征答案数值的数值关键词;S17、将所述数值关键词填写在该数值关键词所在词序列中的两个含义关键词所在行和列交叉的单元格内。进一步地,步骤S2具体包括以下分步骤:S21、对应答案文件中含义关键词的种类确定问题模板中变动项的数量;S22、根据语法,在变动项、恒定项和疑问词之间加入虚词,以形成符合语法的问题模板。更进一步地,步骤S4具体包括以下分步骤:S40、获取表格中首行和首列中首个非空白单元格作为两个变动项的当前位置;S41、根据问题-答案对的生成规则,获取当前位置中的含义关键词对应嵌入到问题模板的变动项位置生成问题暂存;S42、获取生成问题的两个含义关键词所在行和列交叉的单元格中数值关键词作为答案暂存;S43、将暂存的问题和答案关联保存;S44、判断首个变动项对应的当前位置中的含义关键词是否为该含义关键词所在首行或者首列中的最后一个词,若是则执行步骤S46,若否则执行步骤S45;S45、将首个变动项对应的当前位置沿该当前位置中的含义关键词所在的首行或者首列向后顺序推移一个,并重置首个变动项对应的当前位置,执行步骤S41;S46、判断第二个变动项对应当前位置中的含义关键词是否为该含义关键词所在首例或者首行中的最后一个词,若是则执行步骤S48,若否则执行步骤S47;S47、将第二个变动项对应的当前位置沿该当前位置中的含义关键词所在的首列或者首行向后顺序推移一个,执行步骤S41;S48、结束。其中,当步骤S1中所述文件为文本时,包括以下分步骤:S11’、搜集答案;S12’、将每个答案拆分为由若干关键词组成的词序列;S13’、保留词序列中表征答案含义的含义关键词和表征答案数值的数值关键词;S14’、将同一个词序列中的含义关键词和数值关键词按顺序排列,并在各关键词之间采用统一的关键词分隔符进行分隔;S15’、在不同词序列之间采用不同于关键词分隔符的统一的词序列分隔符进行分隔。进一步地,步骤S2具体包括以下分步骤:S21’、对应答案文件中同一个词序列中关键词分隔符的数量确定问题模板中变动项的数量;S22’、根据语法,在变动项、恒定项和疑问词之间加入虚词,以形成符合语法的问题模板。更进一步地,步骤S4包括以下分步骤:S40’、获取文本中首个词序列分隔符的位置作为当前词序列分隔符的位置,以及首个词序列分隔符之前各关键词分隔符的位置作为各当前关键词分隔符的位置;S41’、根据问题-答案对的生成规则,获取各当前关键词分隔符之前的各含义关键词对应嵌入到问题模板的变动项位置生成问题暂存;S42’、获取当前词序列分隔符之前数值关键词作为答案暂存;S43’、将暂存的问题和答案关联保存;S44’、判断当前词序列分隔符是否为答案文件中最后一个词序列分隔符,若是则执行步骤S47’,若否则执行步骤S45’;S45’、将当前词序列分隔符的位置顺序后移并重置当前词序列分隔符的位置;S46’、各当前关键词分隔符的位置重置为当前词序列分隔符之前各关键词分隔符的位置,执行步骤S41’;S47’、结束。其中,步骤S3具体包括以下分步骤:S31、将每个答案拆分为由若干关键词组成的词序列;S32、获取词序列中表征答案含义的含义关键词中的抽象名词作为恒定项;S33、在恒定项之后设置一个适合于询问答案文件中数值关键词的疑问词。一种电子装置,包括存储器和处理器,所述存储器上存储有可被所述处理器执行的标准知识库的构建系统,所述标准知识库的构建系统包括:文件接收模块,用于接收整理好的答案文件,所述答案文件中包含有至少一个答案,所述答案按统一格式拆分后整理到同一个文件中,所述文件包括表格或者文本;模板设置模块,用于根据答案文件中的答案设置问题模板,所述问题模板为包括有若干变动项、若干恒定项和疑问词的词序列;输入模块,用于接收恒定项和疑问词的内容;问题-答案对生成模块,用于根据问题-答案对的生成规则将接收到的答案文件中相应位置的内容嵌入到所述问题模板中的相应变动项中生成问题,同时获取答案文件中相应位置的内容以生成答案,将生成的所述问题和所述答案关联保存为问题-答案对。一种计算机可读存储介质,所述计算机可读存储介质内存储有标准知识库的构建系统,所述标准知识库的构建系统可被至少一个处理器所执行,以使所述至少一个处理器执行如前述中任一项所述的标准知识库的构建方法的步骤。本专利技术的积极进步效果在于:采用本专利技术构建标准知识库,可以实现批量导入数据,并根据规则自动生成问题-答案对,减少了基础数据库的维护工作量,大大提高了工作效率。附图说明图1示出了本专利技术电子装置一实施例的硬件架构示意图;图2示出了本专利技术电子装置中标准知识库的构建系统一实施例的程序模块示意图;图3示出了本专利技术标准知识库的构建方法实施例一的流程图;图4示出了本专利技术标准知识库的构建方法实施例二中构建答案文件的流程图;图5示出了本专利技术标准知识库本文档来自技高网...
标准知识库的构建方法、电子装置及存储介质

【技术保护点】
一种标准知识库的构建方法,其特征在于,包括如下步骤:S1、构建答案文件:搜集答案,将所述答案按统一格式拆分后整理到同一个文件中,所述文件包括表格或者文本;S2、构建问题模板:根据答案文件中的答案确定问题模板,所述问题模板为包括有若干变动项、若干恒定项和疑问词的词序列;S3、设置恒定项和疑问词:根据答案文件中的答案所表述的意思,确定问题模板中的恒定项和疑问词;S4、形成问题‑答案对:根据问题‑答案对的生成规则,获取所述答案文件中相应位置的内容嵌入到所述问题模板中的相应变动项中生成问题,同时获取答案文件中相应位置的内容以生成答案,将生成的所述问题和所述答案关联保存为问题‑答案对。

【技术特征摘要】
1.一种标准知识库的构建方法,其特征在于,包括如下步骤:S1、构建答案文件:搜集答案,将所述答案按统一格式拆分后整理到同一个文件中,所述文件包括表格或者文本;S2、构建问题模板:根据答案文件中的答案确定问题模板,所述问题模板为包括有若干变动项、若干恒定项和疑问词的词序列;S3、设置恒定项和疑问词:根据答案文件中的答案所表述的意思,确定问题模板中的恒定项和疑问词;S4、形成问题-答案对:根据问题-答案对的生成规则,获取所述答案文件中相应位置的内容嵌入到所述问题模板中的相应变动项中生成问题,同时获取答案文件中相应位置的内容以生成答案,将生成的所述问题和所述答案关联保存为问题-答案对。2.根据权利要求1所述的标准知识库的构建方法,其特征在于,当步骤S1中所述文件为表格时,包括以下分步骤:S11、搜集答案;S12、将每个答案拆分为由若干关键词组成的词序列;S13、获取每个词序列中表征答案含义的两个含义关键词;S14、将含义关键词去重并分类;S15、将一类含义关键词作为表格的首行,另一类含义关键词作为表格的首列,且首行和首列的交叉单元格空白;S16、获取词序列中表征答案数值的数值关键词;S17、将所述数值关键词填写在该数值关键词所在词序列中的两个含义关键词所在行和列交叉的单元格内。3.根据权利要求2所述的标准知识库的构建方法,其特征在于,步骤S2具体包括以下分步骤:S21、对应答案文件中含义关键词的种类确定问题模板中变动项的数量;S22、根据语法,在变动项、恒定项和疑问词之间加入虚词,以形成符合语法的问题模板。4.根据权利要求2所述的标准知识库的构建方法,其特征在于,步骤S4具体包括以下分步骤:S40、获取表格中首行和首列中首个非空白单元格作为两个变动项的当前位置;S41、根据问题-答案对的生成规则,获取当前位置中的含义关键词对应嵌入到问题模板的变动项位置生成问题暂存;S42、获取生成问题的两个含义关键词所在行和列交叉的单元格中数值关键词作为答案暂存;S43、将暂存的问题和答案关联保存;S44、判断首个变动项对应的当前位置中的含义关键词是否为该含义关键词所在首行或者首列中的最后一个词,若是则执行步骤S46,若否则执行步骤S45;S45、将首个变动项对应的当前位置沿该当前位置中的含义关键词所在的首行或者首列向后顺序推移一个,并重置首个变动项对应的当前位置,执行步骤S41;S46、判断第二个变动项对应当前位置中的含义关键词是否为该含义关键词所在首例或者首行中的最后一个词,若是则执行步骤S48,若否则执行步骤S47;S47、将第二个变动项对应的当前位置沿该当前位置中的含义关键词所在的首列或者首行向后顺序推移一个,执行步骤S41;S48、结束。5.根据权利要求1所述的标准知识库的构建方法,其特征在于,当步骤S1中所述文件为文本时,包括以下分步骤:S11’、搜集答案;S12’、将每个答案拆分为由若干关键词组成的词序...

【专利技术属性】
技术研发人员:卢川高祎璠
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1