构建方法、构建系统、厨房电器、计算机可读存储介质技术方案

技术编号:34332610 阅读:46 留言:0更新日期:2022-07-31 02:22
本发明专利技术公开了一种构建方法、构建系统、厨房电器、计算机可读存储介质。构建方法包括:获取关键词;根据关键词获取菜谱相关的问答对;对问答对进行筛选并形成问答库;基于关键词,对问答库进行聚类处理,生成问答对的意图分组。上述构建方法,可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法,进行烹饪领域菜谱知识问答数据库的自动构建,能够省去大量的人工且覆盖菜谱的多个知识方面,对于每一个问题意图能够获取不同用户的不同可能问法,增强了问答对数据库的覆盖范围和语义泛化性。强了问答对数据库的覆盖范围和语义泛化性。强了问答对数据库的覆盖范围和语义泛化性。

【技术实现步骤摘要】
构建方法、构建系统、厨房电器、计算机可读存储介质


[0001]本专利技术涉及厨房智能化
,特别涉及一种构建方法、构建系统、厨房电器、计算机可读存储介质。

技术介绍

[0002]在相关技术中,烹饪知识智能问答系统分析用户提出的问题,然后在已经构建的问答数据库中寻找最相似的问题并返回对应的答案,所以智能问答系统的基础是烹饪类知识问答对数据库。
[0003]然而针对同一菜谱内容,不同用户提出的问题五花八门,对于同一类问题的问法也是各种各样,完全通过人工搜集问答库效率低且不全面。

技术实现思路

[0004]本专利技术提供了一种构建方法、构建系统、厨房电器、计算机可读存储介质。
[0005]本专利技术实施方式提供的一种菜谱类知识问答对库的构建方法,包括:
[0006]获取关键词;
[0007]根据所述关键词获取菜谱相关的问答对;
[0008]对所述问答对进行筛选并形成问答库;
[0009]基于所述关键词,对所述问答库进行聚类处理,生成所述问答对的意图分组。
[0010]上述构建方法,可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法,进行烹饪领域菜谱知识问答数据库的自动构建,能够省去大量的人工且覆盖菜谱的多个知识方面,对于每一个问题意图能够获取不同用户的不同可能问法,增强了问答对数据库的覆盖范围和语义泛化性。
[0011]在某些实施方式中,获取关键词,包括:
[0012]从预设的相关文本中获取词频大于或等于词频阈值的词语作为所述关键词。
[0013]在某些实施方式中,获取关键词,包括:
[0014]将预设的相关文本的问题中的词转化为高维向量表示;
[0015]根据聚类算法对向量空间中的词进行聚类处理;
[0016]获取与菜谱中心词距离小于距离阈值的词作为所述关键词。
[0017]在某些实施方式中,根据所述关键词获取菜谱相关的问答对,包括:
[0018]利用所述关键词形成关键词组合;
[0019]基于所述关键词组合进行匹配以获取所述问答对。
[0020]在某些实施方式中,对所述问答对进行筛选并形成问答库,包括以下至少一种筛选条件:
[0021]设置问题长度阈值;
[0022]所述问答对中是否包括预设的关键词表中的词;
[0023]根据短文本语义距离衡量方法设置距离阈值。
[0024]在某些实施方式中,所述构建方法还包括:
[0025]对所述问答库进行扩充。
[0026]在某些实施方式中,基于所述关键词,对所述问答库进行聚类处理,生成所述问答对的意图分组,包括:
[0027]利用所述关键词对所述问答库进行意图初分以得到不同意图的问答对分组;
[0028]对所述问答对分组进行细聚类,将相同问题意图的问答对归为同一类以得到所述问答对的意图分组。
[0029]在某些实施方式中,所述构建方法还包括:
[0030]筛选所述问答对的意图分组。
[0031]本专利技术实施方式提供的一种菜谱类知识问答对库的构建系统,包括:
[0032]第一获取模块,用于获取关键词;
[0033]第二获取模块,用于根据所述关键词获取菜谱相关的问答对;
[0034]筛选模块,用于对所述问答对进行筛选并形成问答库;
[0035]意图分类模块,用于基于所述关键词,对所述问答库进行聚类处理,生成所述问答对的意图分组。
[0036]上述构建系统,可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法,进行烹饪领域菜谱知识问答数据库的自动构建,能够省去大量的人工且覆盖菜谱的多个知识方面,对于每一个问题意图能够获取不同用户的不同可能问法,增强了问答对数据库的覆盖范围和语义泛化性。
[0037]本专利技术实施方式提供的一种厨房电器,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现上述任一实施方式的构建方法。
[0038]上述厨房电器,可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法,进行烹饪领域菜谱知识问答数据库的自动构建,能够省去大量的人工且覆盖菜谱的多个知识方面,对于每一个问题意图能够获取不同用户的不同可能问法,增强了问答对数据库的覆盖范围和语义泛化性。
[0039]本专利技术实施方式提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现上述任一实施方式的构建方法。
[0040]上述计算机可读存储介质,可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法,进行烹饪领域菜谱知识问答数据库的自动构建,能够省去大量的人工且覆盖菜谱的多个知识方面,对于每一个问题意图能够获取不同用户的不同可能问法,增强了问答对数据库的覆盖范围和语义泛化性。
[0041]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0042]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
[0043]图1是本专利技术实施方式的构建方法的流程示意图;
[0044]图2是本专利技术实施方式的构建系统的模块示意图;
[0045]图3

图4是本专利技术实施方式的构建方法的流程示意图;
[0046]图5是本专利技术实施方式的构建系统的模块示意图;
[0047]图6是本专利技术实施方式的构建方法的流程示意图;
[0048]图7

图8是本专利技术实施方式的构建系统的模块示意图;
[0049]图9是本专利技术实施方式的厨房电器的结构示意图;
[0050]图10是本专利技术实施方式的厨房电器的模块示意图;
[0051]图11是本专利技术实施方式的构建系统执行构建方法的示意图。
[0052]主要元件符号说明:
[0053]构建系统100;
[0054]第一获取模块110、第二获取模块120、筛选模块130、意图分类模块140、问答对重聚类子模块141、问答对细聚类子模块142、循环模块150、问题对调整模块160;
[0055]厨房电器200、存储器210、处理器220。
具体实施方式
[0056]下文的公开提供了许多不同的实施方式或例子用来实现本专利技术的不同结构。为了简化本专利技术的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本专利技术。此外,本专利技术可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本专利技术提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
[0057]下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种菜谱类知识问答对库的构建方法,其特征在于,包括:获取关键词;根据所述关键词获取菜谱相关的问答对;对所述问答对进行筛选并形成问答库;基于所述关键词,对所述问答库进行聚类处理,生成所述问答对的意图分组。2.根据权利要求1所述的构建方法,其特征在于,获取关键词,包括:从预设的相关文本中获取词频大于或等于词频阈值的词语作为所述关键词。3.根据权利要求1所述的构建方法,其特征在于,获取关键词,包括:将预设的相关文本的问题中的词转化为高维向量表示;根据聚类算法对向量空间中的词进行聚类处理;获取与菜谱中心词距离小于距离阈值的词作为所述关键词。4.根据权利要求1所述的构建方法,其特征在于,根据所述关键词获取菜谱相关的问答对,包括:利用所述关键词形成关键词组合;基于所述关键词组合进行匹配以获取所述问答对。5.根据权利要求1所述的构建方法,其特征在于,对所述问答对进行筛选并形成问答库,包括以下至少一种筛选条件:设置问题长度阈值;所述问答对中是否包括预设的关键词表中的词;根据短文本语义距离衡量方法设置距离阈值。6.根据权利要求1所述的构建方法,其特征在于,所述构建方法还包括:对所述问答库进行扩充。...

【专利技术属性】
技术研发人员:钱志达孙裕文
申请(专利权)人:美的集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1