System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及基于深度学习的数据预测识别,特别涉及一种基于mooc综合特征融合的辍学预测方法及装置。
技术介绍
1、近年来,随着“互联网+教育”模式的兴起,在线教育在全球范围内迅速发展,为传统教育方式带来了前所未有的挑战和变革。特别是大规模在线开放课程(mooc),自2012年起迅速兴起,凭借其高质量的课程内容和易于获取的资源,吸引了全球数百万学习者的关注。mooc平台提供了灵活便捷的学习方式,打破了地理位置的限制,推动了教育资源的普及化和全球化共享。然而,尽管访问量巨大,mooc平台面临一个显著的挑战是显著的高辍学率,与传统课堂学习相比,mooc学习者更容易中途放弃学习,这种现象严重影响了mooc平台的教育效果和长期发展。
2、当前,虽然许多研究和实践尝试通过分析学习者的行为数据来预测辍学风险,以便及时采取干预措施,但面临着多方面的挑战。导致学习者辍学的原因多种多样,包括但不限于学习动力不足、课程难度不匹配、时间管理挑战以及缺乏个性化学习支持等。传统的预测方法通常基于统计分析或简单的行为指标进行,如登录频次、观看视频的数量等,这些方法虽然提供了一定的参考价值,但往往忽视了学习行为的复杂性和动态性,以及课程内容和学习者个人背景的多样性。
3、近年来,虽然一些研究开始尝试使用机器学习方法来预测mooc学习者的辍学风险,这些方法能够在一定程度上捕捉学习者行为的复杂模式,但仍存在诸多限制。首先,许多现有模型依赖于大量手动特征,手动特征提取不仅耗时耗力,而且很难捕捉到数据中的深层次模式和关联,从而限制了预测模型的
4、因此,迫切需要开发一种高效、准确、可靠的辍学预测方法和系统,该系统应能够综合分析mooc学习者的多维度信息,利用先进的数据处理和模型训练技术,自动提取和融合关键特征,从而提供更为准确和个性化的辍学风险预测。
技术实现思路
1、鉴于现有技术中的上述缺陷或不足,本专利技术提供了一种基于mooc综合特征融合的辍学预测方法及装置,该方法旨在充分利用学习者的学习行为数据、个人属性信息和课程特性,通过深度学习技术自动提取和融合这些多维度信息,从而构建一个更为精准和全面的辍学风险预测模型。本专利技术不仅显著提高了辍学预测的准确性和效率,也为mooc平台的学习者支持和干预策略制定提供了一种新的解决方案。
2、本专利技术的一个方面,提供了一种基于mooc综合特征融合的辍学预测方法,包括如下步骤:
3、获取mooc学习者的学习行为日志、基本属性信息和课程结构数据,从中提取学习行为信息、学习者属性信息和课程信息;
4、针对学习者待检测的mooc课程实例,从学习行为信息序列、学习者属性信息序列和课程信息序列中分别提取序列特征,将每个序列特征转换为统一维度的特征向量;
5、计算不同特征向量间的互信息,将所述互信息与原始的特征向量融合为综合特征向量;
6、采用由全连接网络构成的注意力网络分析各综合特征向量之间的内部关系权重,根据所述权重对每个综合特征向量进行加权求和,得到融合特征向量;
7、对所述融合特征向量进行辍学风险二分类预测,输出mooc学习者的辍学风险预测结果。
8、进一步的,还包括:
9、对学习行为日志、基本属性信息和课程结构数据中重复的登录记录进行去重处理,对格式不一致的日期进行格式化操作,对异常值进行数据清洗。
10、进一步的,所述从学习行为信息序列、学习者属性信息序列和课程信息序列中分别提取序列特征,将每个序列特征转换为统一维度的特征向量的步骤,包括:对学习行为信息序列、学习者属性信息序列和课程信息序列进行嵌入操作,得到学习行为信息、学习者属性信息和课程信息三个视角的嵌入向量;通过三组并行的transform网络捕获每个视角的特定信息,并将所述嵌入向量转换为细化的特征向量;其中,每组transform网络包含多头自注意力机制和位置前馈网络,所述自注意力机制通过层归一化和残差细化每层的输出。
11、进一步的,所述计算不同特征向量间的互信息,将所述互信息与原始的特征向量融合为综合特征向量的步骤,包括:计算每一对不同特征向量之间的交叉相关矩阵,以获取互信息;利用压缩网络将每一对不同特征向量之间的交叉相关矩阵从嵌入空间映射到较低维度空间;将压缩网络获得的特征向量和原始特征向量进行拼接,形成综合特征向量。
12、进一步的,所述采用由全连接网络构成的注意力网络分析各综合特征向量之间的内部关系权重,根据所述权重对每个综合特征向量进行加权求和,得到融合特征向量的步骤,包括:计算每个综合特征向量的注意力得分;使用softmax函数对所有综合特征向量的注意力得分进行归一化处理,得到每个综合特征向量的最终注意力权重;其中,所有综合特征向量的权重之和等于1,且重要性越高的综合特征向量权重越大;根据得到的综合特征向量的注意力权重,对每个综合特征向量进行加权求和,得到融合后的综合特征向量。
13、进一步的,所述对所述融合特征向量进行辍学风险二分类预测,输出mooc学习者的辍学风险预测结果的步骤,包括:将融合后的综合特征向量输入至一个或多个全连接层中,将处理后的特征通过softmax分类器映射为学习者辍学的概率分布,选择概率最高的类别作为最终的预测结果。
14、本专利技术的另一方面,还提供了一种基于mooc综合特征融合的辍学预测装置,包括:
15、获取模块,被配置为获取mooc学习者的学习行为日志、基本属性信息和课程结构数据,从中提取学习行为信息、学习者属性信息和课程信息;
16、特征提取模块,被配置为针对学习者待检测的mooc课程实例,从学习行为信息序列、学习者属性信息序列和课程信息序列中分别提取序列特征,将每个序列特征转换为统一维度的特征向量;
17、互信息融合模块,被配置为计算不同特征向量间的互信息,将所述互信息与原始的特征向量融合为综合特征向量;
18、注意力加权模块,被配置为采用由全连接网络构成的注意力网络分析各综合特征向量之间的内部关系权重,根据所述权重对每个综合特征向量进行加权求和,得到融合特征向量;
19、预测分类模块,被配置为对所述融合特征向量进行辍学风险二分类预测,输出mooc学习者的辍学风险预测结果。
20、进一步的,所述特征提取模块被进一步配置为:
21、对学习行为信息序列、学习者属性信息序列和课程信息序列进行嵌入操作,得到学习行为信息、学习者属性信息和课程信息的嵌入向量;
22、通过三组并行的transform网络将所述嵌入向量转换为细化的特征向量。
23、进一步的,所述互信息融合模块被进一步配置为:
24、计算每一对不本文档来自技高网...
【技术保护点】
1.一种基于MOOC综合特征融合的辍学预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于MOOC综合特征融合的辍学预测方法,其特征在于,还包括:
3.根据权利要求1所述的一种基于MOOC综合特征融合的辍学预测方法,其特征在于,所述从学习行为信息序列、学习者属性信息序列和课程信息序列中分别提取序列特征,将每个序列特征转换为统一维度的特征向量的步骤,包括:
4.根据权利要求1所述的一种基于MOOC综合特征融合的辍学预测方法,其特征在于,所述计算不同特征向量间的互信息,将所述互信息与原始的特征向量融合为综合特征向量的步骤,包括:
5.根据权利要求1所述的一种基于MOOC综合特征融合的辍学预测方法,其特征在于,所述采用由全连接网络构成的注意力网络分析各综合特征向量之间的内部关系权重,根据所述权重对每个综合特征向量进行加权求和,得到融合特征向量的步骤,包括:
6.根据权利要求1所述的一种基于MOOC综合特征融合的辍学预测方法,其特征在于,所述对所述融合特征向量进行辍学风险二分类预测,输出MOOC学习者的辍学风险
7.一种基于MOOC综合特征融合的辍学预测装置,其特征在于,包括:
8.根据权利要求7所述的一种基于MOOC综合特征融合的辍学预测装置,其特征在于,所述特征提取模块被进一步配置为:
9.根据权利要求7所述的一种基于MOOC综合特征融合的辍学预测装置,其特征在于,所述互信息融合模块被进一步配置为:
10.根据权利要求7所述的一种基于MOOC综合特征融合的辍学预测装置,其特征在于,所述注意力加权模块被进一步配置为:
...【技术特征摘要】
1.一种基于mooc综合特征融合的辍学预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于mooc综合特征融合的辍学预测方法,其特征在于,还包括:
3.根据权利要求1所述的一种基于mooc综合特征融合的辍学预测方法,其特征在于,所述从学习行为信息序列、学习者属性信息序列和课程信息序列中分别提取序列特征,将每个序列特征转换为统一维度的特征向量的步骤,包括:
4.根据权利要求1所述的一种基于mooc综合特征融合的辍学预测方法,其特征在于,所述计算不同特征向量间的互信息,将所述互信息与原始的特征向量融合为综合特征向量的步骤,包括:
5.根据权利要求1所述的一种基于mooc综合特征融合的辍学预测方法,其特征在于,所述采用由全连接网络构成的注意力网络分析各综合特征向量之间的内...
【专利技术属性】
技术研发人员:李想,朱文雷,杨坤,刘美麟,王陶然,王刚,姚可,张嘉欢,崔勤,
申请(专利权)人:北京长亭科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。