知识库的优化方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34926230 阅读:32 留言:0更新日期:2022-09-15 07:20
本发明专利技术涉及人工智能技术,揭露了一种知识库的优化方法,包括:获取目标用户的最新提问语义和历史问答记录语义;根据原知识库对所述最新提问语义进行答案匹配,当匹配到所述最新提问语义的语义答案时,获取所述目标用户的语义满意度,根据所述语义答案和语义满意度对所述原知识库进行数据更新,当无法匹配到所述最新提问语义的语义答案时获取预设网页的网页答案;获取所述目标用户的网页满意度,根据所述网页答案和网页满意度对所述原知识库进行数据更新,完成对所述原数据库的优化。此外,本发明专利技术还涉及区块链技术,数据列表可存储于区块链的节点。本发明专利技术还提出一种知识库的优化装置、电子设备以及存储介质。本发明专利技术可以提高知识库的优化效率。识库的优化效率。识库的优化效率。

【技术实现步骤摘要】
知识库的优化方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种知识库的优化方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]纵观互联网的发展历史,企业知识库是一个自助服务库或图书馆,可以用来存储有关企业产品、服务或主题的易于检索的信息。从本质上讲,它是一个企业内部或外部知识的集合,可以帮助目标用户及时寻找所需问题的答案。知识库系统对于现有的机器人系统而言,是类似于大脑般的核心存在,但当知识库一直维持原状时,势必跟不上企业产品的迭代升级和市场快速发展。
[0003]对于现如今的知识库系统,只是由目标用户提供了一些固有的问题答案以及一些固定的话术,其知识量十分有限,而对于目标用户所提出的固定标准问题以外的其它问题,机器人是无法回答的,最终只能给目标用户一个兜底的话术,给目标用户的感觉就是提供答案的机器人能力很弱,轻则导致目标用户情绪不满,重则有可能导致目标用户对公司的产品也失去信心;同时,只依靠运营人员去扩充知识库的知识储量时,会因为运营人员的知识储量使得知识库的知识更新受限,而且重复的人工劳动出现错误的可能性也会大大增加,导致知识库优化效率过低。因此如何提升知识库的优化效率,成为了亟待解决的问题。

技术实现思路

[0004]本专利技术提供一种知识库的优化方法、装置及计算机可读存储介质,其主要目的在于解决知识库的优化效率较低的问题。
[0005]为实现上述目的,本专利技术提供的一种知识库的优化方法,包括:
[0006]获取目标用户的最新提问和历史问答记录,分别对所述最新提问和所述历史问答记录进行语义分析,得到最新提问语义和历史问答记录语义;
[0007]根据原知识库对所述最新提问语义进行答案匹配,判断是否能从所述原知识库匹配到所述最新提问语义的语义答案:
[0008]当匹配到所述最新提问语义的语义答案时,将所述语义答案发送给所述目标用户,获取所述目标用户关于所述语义答案的语义满意度,根据所述语义答案和语义满意度对所述原知识库进行数据更新,完成对所述原数据库的优化;
[0009]当无法匹配到所述最新提问语义的语义答案时,根据所述最新提问语义获取预设网页的网页答案;
[0010]根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户;
[0011]获取所述目标用户关于所述网页答案的网页满意度,根据所述网页答案和网页满意度对所述原知识库进行数据更新,完成对所述原数据库的优化。
[0012]可选地,所述所述获取所述目标用户关于所述语义答案的语义满意度,包括:
[0013]获取预设的语义期望问卷的问卷框架,根据所述语义答案对所述问卷框架进行问题类型配置,得到一级语义期望问卷;
[0014]对所述一级语义期望问卷进行页面组件配置,得到二级语义期望问卷;
[0015]对所述二级语义期望问卷进行功能按钮的配置,得到标准语义期望问卷;
[0016]将所述标准语义期望问卷推送给所述目标用户,当用户完成所述标准语义期望问卷后,得到所述语义答案的语义满意度。
[0017]可选地,所述根据所述最新提问语义获取预设网页的网页答案,包括:
[0018]根据所述预设网页的统一资源定位符得到所述预设网页的页面;
[0019]逐个对所述页面进行网页结构分析,得到所述页面的页面结构;
[0020]生成所述最新提问语义的语义标签,根据预设的捕获器、所述页面结构和所述语义标签获取预设网页的的网页答案。
[0021]可选地,所述根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户,包括:
[0022]设置所述的网页答案来源的网页重要性;
[0023]生成所述历史问答记录语义的语义重要性,根据所述网页重要性和所述语义重要性构建多个重要性的判断矩阵;
[0024]利用预设的权重计算公式逐个计算所述判断矩阵的权重,选取所述判断矩阵的权重中的最大权重值为最大特征根;
[0025]将所述最大特征根对应的网页答案作为最优结果,将所述最优结果发送给所述目标用户。
[0026]可选地,所述根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户,包括:
[0027]分别生成所述网页答案来源的网页评分指标和所述历史问答记录语义的语义评分指标;
[0028]利用所述网页评分指标和所述语义评分指标生成标准评分指标,计算所述标准评分指标的平均数、标准差;
[0029]根据所述平均数、标准差计算所述标准评分指标的变异系数,利用所述变异系数逐个对所述标准评分指标进行权重计算,得到每个所述标准评分指标的指标权重值;
[0030]利用所述权重值计算网页答案的答案适配度,选取所述答案适配度最大值为目标适配度,将所述目标适配度对应的网页答案作为最优结果发送给所述目标用户。
[0031]可选地,所述根据所述网页答案和网页满意度对所述原知识库进行数据更新,完成对所述原数据库的优化,包括:
[0032]对所述网页答案和所述网页满意度进行数据清洗,得到网页数据;
[0033]根据预设的置信度规则筛选出所述网页数据中置信度低于预设的置信度阈值的网页数据作为目标网页数据;
[0034]将所述目标网页数据更新到所述原知识库,完成对所述原数据库的优化。
[0035]可选地,所述分别对所述最新提问和所述历史问答记录进行语义分析,得到最新提问语义和历史问答记录语义,包括:
[0036]对所述所述最新提问和所述历史问答记录进行分词处理,得到最新提问分词和历
史问答分词;
[0037]统计所述最新提问分词中每一个分词的最新提问分词频率,选取所述最新提问分词频率大于预设最新提问频率阈值的最新提问分词为最新提问关键词,将所述最新提问关键词中每一个词语转换为最新提问词向量;
[0038]统计所述历史问答分词中每一个分词的历史问答分词频率,选取所述历史问答分词频率大于预设历史问答频率阈值的历史问答分词为历史问答关键词,将所述历史问答关键词中每一个词语转换为历史问答词向量;
[0039]将所述最新提问词向量拼接为最新提问向量矩阵,并确定所述最新提问向量矩阵为所述最新提问的最新提问语义,将所述历史问答词向量拼接为历史问答向量矩阵,并确定所述历史问答向量矩阵为所述历史问答的历史问答语义。
[0040]为了解决上述问题,本专利技术还提供一种知识库的优化装置,所述装置包括:
[0041]语义分析模块,用于获取目标用户的最新提问和历史问答记录,分别对所述最新提问和所述历史问答记录进行语义分析,得到最新提问语义和历史问答记录语义;
[0042]语义答案模块,用于根据原知识库对所述最新提问语义进行答案匹配,判断是否能从所述原知识库匹配本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识库的优化方法,其特征在于,所述方法包括:获取目标用户的最新提问和历史问答记录,分别对所述最新提问和所述历史问答记录进行语义分析,得到最新提问语义和历史问答记录语义;根据原知识库对所述最新提问语义进行答案匹配,判断是否能从所述原知识库匹配到所述最新提问语义的语义答案:当匹配到所述最新提问语义的语义答案时,将所述语义答案发送给所述目标用户,获取所述目标用户关于所述语义答案的语义满意度,根据所述语义答案和语义满意度对所述原知识库进行数据更新,完成对所述原数据库的优化;当无法匹配到所述最新提问语义的语义答案时,根据所述最新提问语义获取预设网页的网页答案;根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户;获取所述目标用户关于所述网页答案的网页满意度,根据所述网页答案和网页满意度对所述原知识库进行数据更新,完成对所述原数据库的优化。2.如权利要求1所述的知识库的优化方法,其特征在于,所述所述获取所述目标用户关于所述语义答案的语义满意度,包括:获取预设的语义期望问卷的问卷框架,根据所述语义答案对所述问卷框架进行问题类型配置,得到一级语义期望问卷;对所述一级语义期望问卷进行页面组件配置,得到二级语义期望问卷;对所述二级语义期望问卷进行功能按钮的配置,得到标准语义期望问卷;将所述标准语义期望问卷推送给所述目标用户,当用户完成所述标准语义期望问卷后,得到所述语义答案的语义满意度。3.如权利要求1所述的知识库的优化方法,其特征在于,所述根据所述最新提问语义获取预设网页的网页答案,包括:根据所述预设网页的统一资源定位符得到所述预设网页的页面;逐个对所述页面进行网页结构分析,得到所述页面的页面结构;生成所述最新提问语义的语义标签,根据预设的捕获器、所述页面结构和所述语义标签获取预设网页的的网页答案。4.如权利要求1所述的知识库的优化方法,其特征在于,所述根据网页答案来源和所述历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户,包括:设置所述的网页答案来源的网页重要性;生成所述历史问答记录语义的语义重要性,根据所述网页重要性和所述语义重要性构建多个重要性的判断矩阵;利用预设的权重计算公式逐个计算所述判断矩阵的权重,选取所述判断矩阵的权重中的最大权重值为最大特征根;将所述最大特征根对应的网页答案作为最优结果,将所述最优结果发送给所述目标用户。5.如权利要求1所述的知识库的优化方法,其特征在于,所述根据网页答案来源和所述
历史问答记录语义对所述网页答案进行评分,选取评分最高的网页答案作为最优结果发送给所述目标用户,包括:分别生成所述网页答案来源的网页评分指标和所述历史问答记录语义的语义评分指标;利用所述网页评分指标和所述语义评分指标生成标准评分指标,计算所述标准评分指标的平均数、标准差;根据所述平均数、标准差计算所述标准评分指标的变异系数,利用所述变异系数逐个对所述标准评分指标进行权重计算,得到每个所述标准评分指标的指标权重值;利用所述权重值计算网页答案的答案适配度,选取所述答案适配度最...

【专利技术属性】
技术研发人员:翟永青
申请(专利权)人:未鲲上海科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1