System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 知识冲突处理方法及制冷设备技术_技高网

知识冲突处理方法及制冷设备技术

技术编号:44659725 阅读:0 留言:0更新日期:2025-03-19 20:18
本发明专利技术提供一种知识冲突处理方法及制冷设备,所述方法包括:获取待处理的m项知识数据;分别计算每项知识数据与其余m‑1项知识数据的语义相似度,筛选与该知识数据语义相似的知识数据构建相似语义数据集,以确定m组相似语义数据集;计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集。本发明专利技术提供的知识冲突处理方法,通过计算语义相似度可捕捉知识数据之间的关联性,有助于知识数据的整合;基于重叠率进行选择性地合并知识数据集,可避免产生重复和冗余的知识,提炼出精简和无重复的目标知识数据集,提高知识数据集的质量。

【技术实现步骤摘要】

本专利技术涉及计算机,具体地涉及一种知识冲突处理方法及制冷设备


技术介绍

1、随着人工智能技术的发展,其应用也逐渐走进各行各业乃至普通消费者的生活。其中,以智能问答、语音助手为代表的对话系统应用尤为突出,不少企业的客服系统都引入了智能问答系统来增强客服能力或减少人力成本。由于不少企业的业务部门都积累了大量的faq(frequently asked questions,常见问题解答),通常采用基于faq的文本匹配算法作为构建智能问答系统的基础手段。但是,所述faq资源也存在诸多问题,较为突出的就是知识冲突问题,比如,faq中的问题表述不同,但其语义是类似的,对应的有多条解答,且多条解答各自不相同,甚至在一些关键数值上不一致。

2、目前,可采用以下两种方式解决上述知识冲突问题:一是在faq的生产端尽量解决知识冲突问题。即,在录入新知识时,利用算法与faq知识库中已有的旧知识进行比对,选取可能相似的若干旧知识,让业务人员人工审查是否存在冲突问题,此类方法只能用来解决知识增量问题,对存量知识问题并不适应。二是将问题抽象表征化,即人为对faq中的问题添加一种抽象表征形式,比如,将其中的主语、谓语等抽取出来按照一定的格式组合成一个序列,并将其中的词语换成标准词语。如此,当表达同一种语义的不同问题表述时,其抽象表征形式应该是一样或至少十分相似,以此可自动监测知识冲突问题,但这类方法对人工和机器的要求都较高,会给项目本身增添大量成本,在实际应用方面存在一定的困难。


技术实现思路

1、本专利技术的目的之一在于提供一种知识冲突处理方法,以解决现有技术在解决知识冲突方面采用将自然语言抽象为高结构化表征形式,这使得无论是采用人工标注还是机器算法,都存在转换质量无法保证、转换成本过高的技术问题。

2、本专利技术的目的之一在于提供一种制冷设备。

3、为了实现上述专利技术目的之一,本专利技术提供一种知识冲突处理方法,包括:获取待处理的m项知识数据;分别计算每项知识数据与其余m-1项知识数据的语义相似度,筛选与该知识数据语义相似的知识数据构建相似语义数据集,以确定m组相似语义数据集;计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集;其中,所述目标知识数据集包含无重叠的n项知识数据;m≥n。

4、作为本专利技术一实施方式的进一步改进,所述知识数据包括预设问答知识库中的所有问题;所述预设问答知识库包括用户提出的若干组问题和对应的若干组回答至少其中之一。

5、作为本专利技术一实施方式的进一步改进,所述知识数据为存量问题数据。

6、作为本专利技术一实施方式的进一步改进,所述“分别计算每项知识数据与其余m-1项知识数据的语义相似度”具体包括:对每项知识数据进行向量化表示,得到对应的知识向量;基于相似向量检索工具,计算每个知识向量与其余m-1项知识向量的语义相似度,得到m-1项语义相似度值;其中,所述相似向量检索工具包括faiss相似性搜索。

7、作为本专利技术一实施方式的进一步改进,所述“筛选与该知识数据语义相似的知识数据构建相似语义数据集”具体包括:根据第一知识数据对应的m-1项语义相似度值,判断并确定语义相似度值大于相似度预设阈值的所有其余知识数据,形成第一参考数据集;在所述第一参考数据集中筛选得到语义相似度值降序排列后排名靠前的k项问题数据,构成所述第一相似语义数据集;m≥k。

8、作为本专利技术一实施方式的进一步改进,所述“计算并根据所述m组相似语义数据集之间的重叠率”具体包括:获取第一相似语义数据集和第二相似语义数据集;计算并统计所述第一相似语义数据集和所述第二相似语义数据集之间元素交集的个数,得到重叠数据量;比较所述第一相似语义数据集和所述第二相似语义数据集中的元素个数,统计元素个数较多的数据集个数,作为合并数据量;根据所述重叠数据量和所述合并数据量,计算得到对应于所述第一相似语义数据集和所述第二相似语义数据集的重叠率;其中,所述重叠率在数值上等于所述重叠数据量与所述合并数据量的比值。

9、作为本专利技术一实施方式的进一步改进,所述“计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集”具体包括:分别计算每组相似语义数据集与其余m-1组相似语义数据集的重叠率,筛选最大重叠率的相似语义数据集,以确定待合并数据集;其中,所述待合并数据集包括两组相似语义数据集;判断所述最大重叠率是否大于重叠率阈值;若是,则对所述待合并数据集执行集合的并集操作,并根据操作结果更新所述m组相似语义数据集,得到m-1组中间知识数据集;迭代循环计算并根据中间知识数据集两两之间的重叠率,选择性合并所述中间知识数据集,直到重新确定的最大重叠率不大于所述重叠率阈值,确定所述目标知识数据集。

10、作为本专利技术一实施方式的进一步改进,所述待合并数据集包括第一相似语义数据集和第二相似语义数据集;所述“对所述待合并数据集执行集合的并集操作,并根据操作结果更新所述m组相似语义数据集,得到m-1组中间知识数据集”具体包括:将所述第二相似语义数据集的数据元素合并至所述第一相似语义数据集中,更新所述第一相似语义数据集,并删除所述第二相似语义数据集,得到所述m-1组中间知识数据集。

11、作为本专利技术一实施方式的进一步改进,所述待合并数据集包括第一相似语义数据集和第二相似语义数据集;所述“对所述待合并数据集执行集合的并集操作,并根据操作结果更新所述m组相似语义数据集,得到m-1组中间知识数据集”具体包括:构建空的新相似语义数据集,合并所述第一相似语义数据集和所述第二相似语义数据集,将合并后的结果存储至所述新相似语义数据集,并删除所述第一相似语义数据集和所述第二相似语义数据集,得到所述m-1组中间知识数据集。

12、作为本专利技术一实施方式的进一步改进,在所述“计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集”之后,所述方法还包括:获取对应于所述目标知识数据集的回答数据;根据所述回答数据,对所述目标知识数据集进行重叠情况校验,判断在所述回答数据约束下所述目标知识数据集中是否还存在重叠的知识数据项;若是,则根据判断结果,计算并合并重叠率最大的相似语义数据集,更新所述目标知识数据集。

13、为实现上述专利技术目的之一,本专利技术还提供一种制冷设备,包括:存储器,用于存储可执行指令;处理器,用于运行所述存储器存储的可执行指令时,实现上述任意所述知识冲突处理方法的步骤。

14、与现有技术相比,本专利技术实施例具有如下至少一种有益效果:

15、本专利技术采用知识冲突处理方法,通过计算语义相似度来捕获知识数据之间的关联性,可对知识数据进行语义层面的分组,形成多组相似语义数据集。有助于知识数据的整合,以便于自动生成多组语义相似度更高、更聚合的知识数据集,为后续知识检测提供高质量的数据支持;同时,通过计算相似语义数据集的重叠率,选择性地合并知识数据集,可避免产生过多重复和冗余的知识本文档来自技高网...

【技术保护点】

1.一种知识冲突处理方法,其特征在于,包括:

2.根据权利要求1所述的知识冲突处理方法,其特征在于,所述知识数据包括预设问答知识库中的所有问题;所述预设问答知识库包括用户提出的若干组问题和对应的若干组回答至少其中之一。

3.根据权利要求1所述的知识冲突处理方法,其特征在于,所述知识数据为存量问题数据。

4.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“分别计算每项知识数据与其余m-1项知识数据的语义相似度”具体包括:

5.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“筛选与该知识数据语义相似的知识数据构建相似语义数据集”具体包括:

6.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“计算并根据所述m组相似语义数据集之间的重叠率”具体包括:

7.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集”具体包括:

8.根据权利要求7所述的知识冲突处理方法,其特征在于,所述待合并数据集包括第一相似语义数据集和第二相似语义数据集;所述“对所述待合并数据集执行集合的并集操作,并根据操作结果更新所述m组相似语义数据集,得到m-1组中间知识数据集”具体包括:

9.根据权7所述的知识冲突处理方法,其特征在于,所述待合并数据集包括第一相似语义数据集和第二相似语义数据集;所述“对所述待合并数据集执行集合的并集操作,并根据操作结果更新所述m组相似语义数据集,得到m-1组中间知识数据集”具体包括:

10.根据权利要求1所述的知识冲突处理方法,其特征在于,在所述“计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知识数据集”之后,所述方法还包括:

11.一种制冷设备,其特征在于,包括:存储器,用于存储可执行指令;处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1-10任一项所述知识冲突处理方法的步骤。

...

【技术特征摘要】

1.一种知识冲突处理方法,其特征在于,包括:

2.根据权利要求1所述的知识冲突处理方法,其特征在于,所述知识数据包括预设问答知识库中的所有问题;所述预设问答知识库包括用户提出的若干组问题和对应的若干组回答至少其中之一。

3.根据权利要求1所述的知识冲突处理方法,其特征在于,所述知识数据为存量问题数据。

4.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“分别计算每项知识数据与其余m-1项知识数据的语义相似度”具体包括:

5.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“筛选与该知识数据语义相似的知识数据构建相似语义数据集”具体包括:

6.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“计算并根据所述m组相似语义数据集之间的重叠率”具体包括:

7.根据权利要求1所述的知识冲突处理方法,其特征在于,所述“计算并根据所述m组相似语义数据集之间的重叠率,选择性合并所述知识数据,确定目标知...

【专利技术属性】
技术研发人员:刘卫强孔令磊马坚赵弇锋曾谁飞李敏张景瑞
申请(专利权)人:青岛海尔电冰箱有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1