System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于跨度和习题解析的数学知识点关系预测方法技术_技高网

一种基于跨度和习题解析的数学知识点关系预测方法技术

技术编号:43835215 阅读:6 留言:0更新日期:2024-12-31 18:33
本发明专利技术公开了一种基于跨度和习题解析的数学知识点关系预测方法,引入了跨度信息和构建了一个外部习题解析知识库作为提示,并使用交叉注意力机制对输入的文本知识点对与跨度信息进行融合得到知识点跨度融合特征表示,以提高模型在不同跨度长度下对知识点关系的捕捉能力。与此同时,模型以半自动方式将习题解析文本转化为习题解析树。这一过程基于对习题解析内容分析,构建出一种层级化的知识表达结构。通过抽取解析内容中具有逻辑顺序的知识点,并将其映射为图结构。在生成习题解析树后,模型使用图注意力网络对其进行表示学习,并将得到的习题解析树的表示与知识点‑跨度融合特征表示进行拼接,以生成最终的融合特征向量来进行关系预测。

【技术实现步骤摘要】

本专利技术属于数据处理,具体涉及一种基于跨度和习题解析的数学知识点关系预测方法


技术介绍

1、在中学数学知识体系中,知识点间的逻辑关系有多种,其中包括偏序、平行和独立关系等,这多种关系统称为知识点依赖关系。随着个性化学习需求的增加使得每个学生都需要有针对性的学习路径。在个性化教育中,由于每个学生的学习能力、背景和兴趣各不相同,这使得他们的学习路径具有高度的个性化特征。而个性化推荐系统的质量在很大程度上取决于知识点关系预测的准确性。数学学科知识点之间的关系又极为复杂,并且往往存在多层次的依赖结构,一些知识点间的关联并不明显,导致模型难以挖掘这种隐含信息。并且,随着教育内容和教学大纲的不断更新,知识点的定义和它们之间的关系也在发生变化,那么知识点关系预测模型也需要具备适应变化的能力。因此,数学领域的知识点间关系预测需要应对复杂知识结构和隐含知识点关系等多方面的难点问题。

2、早期的数据驱动方法如关联规则挖掘和序列模式挖掘,虽能发现知识点间的显式依赖关系,却无法捕捉复杂和隐含的知识结构。随着图模型方法的引入,如知识图谱和贝叶斯网络,它们通过图结构和概率推断在一定程度上简化了问题的复杂性。但是,知识图谱的构建过程高度依赖人工干预和大量的领域知识,且在面对知识结构的动态变化时表现出较大的局限性。随后的机器学习方法,包括监督学习和无监督学习,通过大量数据训练模型,但依赖于标注数据且可能忽略个性化学习路径。在数据驱动+深度学习的时代,尽管模型在预测复杂关系方面有所提升,但其计算资源的需求依然很高,同时模型的解释性较差。此外,这些模型通常缺乏有效的知识结构信息,导致隐含关系的挖掘变得困难。更重要的是,现有研究尚未考虑数学学科中不同章节之间的知识点具有各自的相关性和跨度,这进一步限制了模型的有效性和应用。近年来,各类大语言模型如chatgpt,文心一言和通义千问等的兴起为教育数据分析带来新的机遇,然而却面临领域数据稀缺,结构化数据处理不足,泛化能力的局限以及模型幻觉生成的问题。“9.11比9.8大”是大语言模型生成幻觉的典型例子,该例子展示了大模型在比较两个数大小时大模型普遍采取文本模型,容易从文本角度去理解这些数字,忽略了语境中的实际含义,体现了其依赖语言模式而非现实世界推理的局限性。

3、在中学数学领域,由于知识点数量庞大,人工标注和验证这些知识点关系需要耗费大量的精力。因此,开发一个具备强泛化能力的分类模型是必要的。这样的模型能够通过对部分知识点的训练,推广到未涉及的知识点,从而实现知识点关系自动预测和验证。但是这不仅需要模型能够准确捕捉知识点之间的明确和隐含关系,还需具备高效的泛化能力,适应不断变化和扩展的知识结构。


技术实现思路

1、针对现有技术中的不足,本专利技术提供了一种基于跨度和习题解析的数学知识点关系预测方法,包括以下步骤:

2、步骤s1:构建数据集,数据集包括若干知识链,知识链包括文本知识点对、跨度信息文本和标注的真实关系;

3、步骤s2:形式化关系预测任务并构建关系预测模型,关系预测模型包括习题解析模块、嵌入模块、图注意力网络、融合模块和关系预测模块,导入步骤s1中的文本知识点对至习题解析模块,获取知识点节点和邻接矩阵;

4、步骤s3:导入步骤s1中的文本知识点对和跨度信息文本,以及步骤s2中的知识点节点至嵌入模块,分别获取知识点对特征表示、跨度特征表示和知识点节点特征矩阵;

5、步骤s4:导入步骤s2中邻接矩阵和步骤s3中的知识点节点特征矩阵至图注意力网络,获取习题解析树表示;

6、步骤s5:导入步骤s3中的知识点对特征表示和跨度特征表示至融合模块中,获取知识点跨度融合表示;导入步骤s4中的习题解析树表示至融合模块中与知识点跨度融合表示进入进一步融合,获取融合特征表示;

7、步骤s6:导入步骤s5中的融合特征表示至关系预测模块中,获取分类概率,并根据分类概率获得预测结果;

8、步骤s7:构建交叉熵损失函数,通过步骤s1中标注的真实关系最小化损失函数以优化模型的参数。

9、进一步的,步骤s2中的形式化关系预测任务具体为:

10、在给定任意知识链对应的融合特征表示作为输入,构建一个二分类函数来预测文本知识点对之间的依赖关系,输出预测的依赖关系标签,也即预测结果,形式化表示如下:

11、;

12、其中,表示融合特征表示,表示二分类函数,表示预测结果。

13、进一步的,步骤s2中的导入步骤s1中的文本知识点对至习题解析模块,获取知识点节点和邻接矩阵,具体为:

14、步骤s21:输入文本知识点对,在外部习题解析知识库中去检索获取对应的习题解析文本;

15、步骤s22:通过基于glm架构的chatglm对话语言模型来自动抽取习题解析文本中的知识点,基于解题逻辑,将知识点组合成三元组;使用图形数据库处理三元组来构建习题解析树;

16、习题解析树形式化为:

17、;

18、其中,表示习题解析树,v为知识点的集合,包含n个知识点,,也即知识点节点;e为边的集合,表示知识点之间的连接关系;

19、每条边(p, q)∈e表示知识点节点vq与知识点节点vp之间存在连接关系,由此生成习题解析树的邻接矩阵。

20、进一步的,步骤s3具体为:

21、步骤s31:嵌入模块通过预训练语言模型获取知识点对特征表示和跨度特征表示,表示为:

22、;

23、;

24、其中,为文本知识点对的第i个字经过albert预训练语言模型得到的向量表示,为文本知识点对的第n个字经过albert预训练语言模型得到的向量表示,为跨度信息文本的第m个字经过albert预训练语言模型得到的向量表示;为跨度信息文本的第i个字经过albert预训练语言模型得到的向量表示;n和m分别表示文本知识点对、跨度信息文本中字的总数量;为知识点对特征表示,为跨度特征表示,表示预训练语言模型;

25、步骤s32:对于步骤s22中的习题解析树中的第q个知识点,使用albert预训练模型提取到对应的知识点表示;将所有的知识点表示进行组合得到知识点特征矩阵,表示为:

26、。

27、进一步的,步骤s4具体为:

28、步骤s41:将习题解析树gtree的知识点特征矩阵输入到图注意力网络中,以获得更新后的知识点特征矩阵;

29、具体为:对知识点特征矩阵进行线性变换,通过权重矩阵w,将习题解析树中第q个知识点的知识点表示转换到新的特征空间;也即特征映射操作,表示为:

30、;

31、其中,表示更新后的知识点表示;

32、通过重复特征映射操作获取更新后的知识点特征矩阵,表示为:

33、;

34、步骤s42:计算每个知识点节点与其邻居知识点节点之间的注意力分数,通过导入步骤s22的邻接矩阵本文档来自技高网...

【技术保护点】

1.一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S2中的形式化关系预测任务具体为:

3.如权利要求1所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S2中的导入步骤S1中的文本知识点对至习题解析模块,获取知识点节点和邻接矩阵,具体为:

4.如权利要求3所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S3具体为:

5.如权利要求4所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S4具体为:

6.如权利要求5所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S5具体为:

7.如权利要求6所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S6具体为:

8.如权利要求7所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤S7具体为:

【技术特征摘要】

1.一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤s2中的形式化关系预测任务具体为:

3.如权利要求1所述的一种基于跨度和习题解析的数学知识点关系预测方法,其特征在于,步骤s2中的导入步骤s1中的文本知识点对至习题解析模块,获取知识点节点和邻接矩阵,具体为:

4.如权利要求3所述的一种基于跨度和习题解析的数学知识点关系预测方法...

【专利技术属性】
技术研发人员:王岚清罗文兵陶聪王明文杜嘉诚王涛刘振桢颜昌宇
申请(专利权)人:江西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1