基于知识结构的相似试题识别方法技术

技术编号：27059362 阅读：35 留言：0更新日期：2021-01-15 14:39

本发明专利技术公开了一种基于知识结构的相似试题识别方法，综合了文本、图像及知识点与知识点结构多方位因素来进行试题对的相似度计算，可以提升相似试题识别的效果；此外，在建模过程中，通过综合考虑文本和图片特征来获取语义表示，再利用知识结构获得基于知识结构的语义表示，在改进模型效果的同时，还具有高度的可解释性。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识结构的相似试题识别方法
本专利技术涉及机器学习和教育数据挖掘
，尤其涉及一种基于知识结构的相似试题识别方法。
技术介绍
识别相似试题(FSE)是在线教育系统的一项基本且具有挑战性的任务，它可以用于试题检索和学生能力建模等在线教育系统。近年来，在线教育系统的研究和应用蓬勃发展，这些系统不仅可以帮助老师有针对性地给学生布置试题，还能协助学生巩固自己学习到的知识点；其中相似试题识别任务在这里面扮演着至关重要的角色。知识点的结构信息储存在知识结构中，知识结构解释了一个领域中的知识概念是如何相互关联的，它可以用来建模知识之间的关联概念从而进一步帮助识别相似的试题。目前，相似试题识别的相关工作大多是利用试题的相似文本、图片或者知识点标签特征，但是忽略了知识点的结构信息，因此，相似试题识别的效果还有待提升。
技术实现思路
本专利技术的目的是提供一种基于知识结构的相似试题识别方法，引入了知识点的结构信息，相较于现有方案而言，考虑因素更加全面，对数据的理解更加深入，可以准确高效地判断题对之间的相似程度，有效提升相似试题识别的效果。本专利技术的目的是通过以下技术方案实现的：一种基于知识结构的相似试题识别方法，包括：获取试题集合与待识别的试题，试题集合中每一试题与待识别的试题均包含相关的内容信息、知识点及知识点间关系构成的知识结构；构建基于知识结构的多模态模型，其包含内容表示层、结构融合层及相似度得分层；其中，内容表示层用于提取试题内容信息中的文本与图像之间的联合语...

【技术保护点】
1.一种基于知识结构的相似试题识别方法，其特征在于，包括：/n获取试题集合与待识别的试题，试题集合中每一试题与待识别的试题均包含相关的内容信息、知识点及知识点间关系构成的知识结构；/n构建基于知识结构的多模态模型，其包含内容表示层、结构融合层及相似度得分层；其中，内容表示层用于提取试题内容信息中的文本与图像之间的联合语义表示向量；结构融合层则结合联合语义表示以及试题的知识点及知识结构提取基于知识结构的语义表示向量；相似度得分层则利用试题集合中每一试题与待识别的试题的语义表示向量计算试题之间的相似度得分。/n

【技术特征摘要】
1.一种基于知识结构的相似试题识别方法，其特征在于，包括：
获取试题集合与待识别的试题，试题集合中每一试题与待识别的试题均包含相关的内容信息、知识点及知识点间关系构成的知识结构；
构建基于知识结构的多模态模型，其包含内容表示层、结构融合层及相似度得分层；其中，内容表示层用于提取试题内容信息中的文本与图像之间的联合语义表示向量；结构融合层则结合联合语义表示以及试题的知识点及知识结构提取基于知识结构的语义表示向量；相似度得分层则利用试题集合中每一试题与待识别的试题的语义表示向量计算试题之间的相似度得分。

2.根据权利要求1所述的一种基于知识结构的相似试题识别方法，其特征在于，内容信息包括：试题文本以及相应的图像；
对于试题文本，利用正则匹配删除无用符号后进行分词，再删除停止词和低频词；
对于各试题的图像，进行尺寸调节，使得所有试题的大小一致。

3.根据权利要求1所述的一种基于知识结构的相似试题识别方法，其特征在于，所述内容表示层包括：图卷积网络、基于注意力机制的长短记忆模型；
内容信息中的图像输入至图卷积网络，提取出固定长度的特征向量；
将图像的特征向量处理为联合表示向量后与文本进行拼接，再输出至基于注意力机制的长短记忆模型，获得试题的联合语义表示向量

4.根据权利要求3所述的一种基于知识结构的相似试题识别方法，其特征在于，联合表示向量与文本进行拼接公式为：

其中，wt为文本中的第t个分词，一个分词对应一个时刻；为图像的联合表示向量，通过下述方式得到：

其中，I表示试题q中图片的总数，αj为第j个图像的注意力权重；ht-1表示第t-1时刻基于注意力机制的长短记忆模型的隐藏层状态；gj、gi分别表示第j个、第i个图像的特征向量；Wai表示待学习的参数，表示gj的转置。

5.根据权利要求1所述的一种基于知识结构的相似试题识别方法，其特征在于，所述结构融合层包括：CKA模块与树卷积网络；其中：
所述CKA模块中：先使用嵌入的方法将知识点向量进行降维，表示为：uc＝kcW...

【专利技术属性】
技术研发人员：佟威，刘淇，陈恩红，童世炜，何理扬，黄威，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人