本发明专利技术公开了一种基于6W规则知识元的知识自学习方法,涉及信息技术领域。本发明专利技术实施例提供的基于6W规则知识元的知识自学习方法,通过利用标注对应的标识的数量N和标注的结构对标注进行分类,并在同一类标注中,获取该类标注对应的所有的不同标识的数量M,最后,随机从M个标识中挑选N个标识(M≥N),自由排列,代入归为一类的标注中,因此,对于一类标注,就会得到个新的标注(包括已有的标注和通过学习得到的标注),可见,本发明专利技术中,根据已有知识学习出了许多新的知识,极大的扩展了知识体系,加强了知识库的建设,提高了知识的实际应用能力;另外,学习过程简单清晰,方便知识的管理。
【技术实现步骤摘要】
本专利技术涉及信息
,尤其涉及一种基于6W规则知识元的知识自学习方法。
技术介绍
随着信息技术的不断发展,数据库中存储的数据量越来越多,涉及到的知识量也 越来越多,但是,为了使信息技术能够利用存储的数据解决社会中的更加精细或复杂的问 题,为社会发展做出更大的贡献,需要更多的知识量。 目前,知识量虽然比较大,但是对于结构相似,涉及的概念也相同或相近的知识, 由于部分概念之间不存在联系,所以,在人们利用知识的过程中,就无法发现知识中隐藏的 语义关系和规则,从而忽视了大量未知的知识,极大的减小了可利用的知识量,减弱了知识 在解决社会问题中的作用。
技术实现思路
本专利技术的目的在于提供一种基于6W规则知识元的知识自学习方法,发现对于结 构相似,部分标识之间却不存在联系的知识中的隐藏的语义关系和规则,从而扩展知识体 系,加强知识库的建设,提尚知识的实际应用能力。 为了实现上述目的,本专利技术采用的技术方案如下: 一种基于6W规则知识元的知识自学习方法,包括如下步骤: S1,对数据库进行整体扫描,获取所有的知识元,所述知识元用标识和所述标识对 应的标注表达,其中,所述标识包括自变量标识和因变量标识,所述因变量标识随着所述自 变量标识的变化而变化; S2,获取所述标注对应的标识的数量N,根据所述标注对应的标识的数量和所述标 注的结构,对所述标注进行分类,将所述标识的数量和所述标注的结构均相同的标注归为 一类,并获取所述归为一类的标注对应的所有的不同标识的数量M ; S3,在所述归为一类的标注中,随机从M个标识中挑选N个标识,自由排列,代入所 述标注中,得到^ ? &个新的标注;遍历所有的所述归为一类的标注; S4,判断所述新的标注是否存在于知识库中,如果是,则结束;否则,执行S5 ; S5,利用所述自变量标识和所述因变量标识对应的具体数据,对所述新的标注进 行验证,如果所述新的标注达到设定的正确率,则所述新的标注是正确的,将所述新的标注 存储在知识库中,否则,结束。 进一步地,S2包括如下步骤: S201,获取所述标注对应的标识的数量N,根据所述标注对应的标识的数量进行分 类,将所述标识的数量相同的标注归为一类,得到一级标注; S202,根据所述标注的结构对所述一级标注进行分类,将结构相同的标注归为一 类,得到二级标注; S203,获取所述二级标注包含的所有的标注,并确定所有的标注对应的所有不相 同的标识的数量M。 进一步地,S5包括如下步骤: S501,获取所述新的标注中的所述自变量标识和所述因变量标识对应的具体数 据,并将所述具体数据代入所述新的标注中,得到验证用标注;S502,判断所述验证用标注是否正确,如果正确,则记录正确的所述验证用标注的 数量,否则,记录错误的所述验证用标注的数量; S503,根据正确的所述验证用标注的数量和错误的所述验证用标注的数量,计算 所述新的标注的正确率; S504,判断所述新的标注的正确率是否达到设定值,如果达到,则将所述新的标注 存储在知识库中,否则,结束。 其中,S502中,所述判断所述验证用标注是否正确,具体为: 在所述验证用标注中利用所述自变量标识对应的具体数据进行计算,如果计算结 果等于所述因变量标识对应的具体数据,则所述验证用标注是正确的,否则,所述验证用标 注是错误的。 其中,S502中,所述判断所述验证用标注是否正确,具体为: 在所述验证用标注中利用所述自变量标识对应的具体数据进行计算,如果计算结 果在所述因变量标识对应的具体数据所允许的误差范围内,则所述验证用标注是正确的, 否则,所述验证用标注是错误的。 优选地,所述正确率根据所述新的标注允许的可信度以及因变量标识对应的具体 数据的误差值进行设定。 更优选地,所述设定的正确率为n :〇? 8 < n < 1。 本专利技术的有益效果是:本专利技术实施例提供的基于6W规则知识元的知识自学习 方法,通过利用标注对应的标识的数量N和标注的结构对标注进行分类,并在同一类标注 中,获取该类标注对应的所有的不同标识的数量M,最后,随机从M个标识中挑选N个标识 (M彡N),自由排列,代入归为一类的标注中,因此,对于一类标注,就会得到Cf * ,Y!个新的 标注(包括已有的标注和通过学习得到的标注),可见,通过本专利技术实施例提供的知识自学 习方法,根据已有知识学习出了许多新的知识,极大的扩展了知识体系,加强了知识库的建 设,提高了知识的实际应用能力;另外,本专利技术实施例提供的知识自学习方法,过程简单清 晰,方便知识的管理。【附图说明】 图1是本专利技术实施例提供的基于6W规则知识元的知识自学习方法的流程示意图。【具体实施方式】 为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图,对本专利技术进 行进一步详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本专利技术,并不用于 限定本专利技术。 本专利技术中,一些术语的解释如下: 知识元是不可再分割的具有完备知识表达的知识单位。知识元可以定义为一个 标识以及与该标识相关的方法,该标识相关的方法即为该标识相关的标注,其中,标识定义 为数据元,也就是概念,数据元是从概念角度定义一个数据的最小单元,通过数据元素来描 述;标注是标识和标识之间的联系,也就是概念之间的联系;知识定义为标识和标注,具体 包括知识编号、标注、标识和可信度,其中,知识编号是指知识具有的唯一编号,可信度的取 值为0~100,取值越高则知识越可信。 实施例一 如图1所示,本专利技术实施例提供了一种基于6W规则知识元的知识自学习方法,可 以包括如下步骤: S1,对数据库进行整体扫描,获取所有的知识元,所述知识元用标识和所述标识对 应的标注表达,其中,所述标识包括自变量标识和因变量标识,所述因变量标识随着所述自 变量标识的变化而变化; S2,获取所述标注对应的标识的数量N,根据所述标注对应的标识的数量和所述标 注的结构,对所述标注进行分类,将所述标识的数量和所述标注的结构均相同的标注归为 一类,并获取所述归为一类的标注对应的所有的不同标识的数量M ; S3,在所述归为一类的标注中,随机从M个标识中挑选N个标识,自由排列,代入所 述标注中,得到C§个新的标注;遍历所有的所述归为一类的标注; S4,判断所述新的标注是否存在于知识库中,如果是,则结束;否则,执行S5 ; S5,利用所述自变量标识和所述因变量标识对应的具体数据,对所述新的标注进 行验证,如果所述新的标注达到设定的正确率,则所述新的标注是正确的,将所述新的标注 存储在知识库中,否则,结束。 6W规则是指诺贝尔文学奖获得者英国作家吉卜林的思考问题、解决问题的方法, 在信息
中,在上述基础上明确了业务逻辑6W描述方法,即"Where (什么地方)、 When (什么时间)、Who (什么人)、Which (针对什么)、What (做了什么,含如何做)、Why (为 什么)";本专利技术中的数据结构按照6W规则进行描述。 其中,S2可以包括如下步骤: S201,获取所述标注对应的标识的数量N,根据所述标注对应的标识的数量进行分 类,将所述标识的数量相同的标注归为一类,得到一级标注; S202,根据所述标注的结构对所述一级标注进行分类,将结构本文档来自技高网...
【技术保护点】
一种基于6W规则知识元的知识自学习方法,其特征在于,包括如下步骤:S1,对数据库进行整体扫描,获取所有的知识元,所述知识元用标识和所述标识对应的标注表达,其中,所述标识包括自变量标识和因变量标识,所述因变量标识随着所述自变量标识的变化而变化;S2,获取所述标注对应的标识的数量N,根据所述标注对应的标识的数量和所述标注的结构,对所述标注进行分类,将所述标识的数量和所述标注的结构均相同的标注归为一类,并获取所述归为一类的标注对应的所有的不同标识的数量M;S3,在所述归为一类的标注中,随机从M个标识中挑选N个标识,自由排列,代入所述标注中,得到个新的标注;遍历所有的所述归为一类的标注;S4,判断所述新的标注是否存在于知识库中,如果是,则结束;否则,执行S5;S5,利用所述自变量标识和所述因变量标识对应的具体数据,对所述新的标注进行验证,如果所述新的标注达到设定的正确率,则所述新的标注是正确的,将所述新的标注存储在知识库中,否则,结束。
【技术特征摘要】
【专利技术属性】
技术研发人员:谭远华,张超林,夏冬梅,
申请(专利权)人:克拉玛依红有软件有限责任公司,
类型:发明
国别省市:新疆;65
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。