本发明专利技术公开了一种基于人工神经网络的学生行为预测方法,其特征在于:包括以下步骤:步骤一:数据收集,获取学生的一卡通数据、课堂出勤数据和学生成绩数据;步骤二:数据预处理,进行数据清洗、数据集成、数据选择和数据变换;步骤三:学生行为特征提取;步骤四:将提取的学生行为特征生成样本集,建立学生行为神经网络模型;步骤五:根据学生行为特征的重要性,建立学生行为特征的决策树模型;步骤六:基于决策树模型,对学生行为进行预测。本发明专利技术通过采集学生的的行为特征,对学生行为特征进行排序,并经过神经网络进行特征的约减,建立决策树模型,对学生行为进行预测,及时发现学生的异常,对学生进行监督。
【技术实现步骤摘要】
一种基于人工神经网络的学生行为预测方法
本专利技术涉及校园数据处理领域,尤其是一种基于人工神经网络的学生行为预测方法。
技术介绍
在现在大学校园里,学校的管理还在沿用传统的学生管理和服务方式,通过专业、年级对学生划分,对学生采用单一化的管理方式;并且只是对学生的课堂出勤和考试进行管理,其他时间没有进行实时监督和管理;而很多学生的自制能力比较差,不能自觉的学习,甚至不按时进行上课,最终导致学习成绩不好,没有学到知识,甚至无法完成学业;并且现在学校的管理还是后置式管理,只有当学生发生问题后,才进行管理,不能预先对学生的行为进行预测,实现对学生的监督。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的问题,提供一种基于人工神经网络的学生行为预测方法,通过采集学生的的行为特征,对学生行为特征进行排序,并经过神经网络进行特征的删减,建立决策树模型,对学生行为进行预测;通过对学生行为的自动预测,及时发现学生的异常,对学生进行有效的管理,改善现有校园管理的缺陷。本专利技术采用的技术方案如下:本专利技术一种基于人工神经网络的学生行为预测方法,包括以下步骤:步骤一:数据收集,获取学生的一卡通数据、课堂出勤数据和学生成绩数据;步骤二:数据预处理,进行数据清洗、数据集成、数据选择和数据变换;数据清洗:数据缺失信息补充、重复数据清理和异常数据清理;数据集成:将数据进行统一的存储和管理;数据选择:选择合适的数据量,以及目标数据;数据变换:转换数据的格式;步骤三:学生行为特征提取,分别提取收集数据中的学生去图书馆的次数、在图书馆的时间、学生借阅书本量、宿舍进出时间和次数、学生消费时间和金额、学生课堂出勤次数、学生的成绩、宿舍上网时间、学生在实验室的时间和次数;步骤四:将提取的学生行为特征生成样本集,建立学生行为神经网络模型;步骤五:根据学生行为特征的重要性,建立学生行为特征的决策树模型;步骤六:基于决策树模型,对学生行为进行预测。以上方法,学生去图书馆的次数、在图书馆的时间、学生借阅书本量反映了学生在图书馆的学习时间,对学习成绩有很大的影响;宿舍进出时间和次数能够反映学生在宿舍的时间,离开宿舍和回来的时间,在宿舍的时间过长,一般是玩游戏或睡觉,早出和晚归的次数跟学生的成绩有密切的关系;学生在实验室的时间和次数也反映了学生的学习时间;宿舍上网时间直接反映了学生上网的习惯,可以推测出学生是否在玩游戏;学生消费时间和金额,正常时间的消费一般是学习学生的习惯,特别吃早餐的是去学习的学生;学生课堂出勤次数直接反映了学生课堂学习时间;通过这些学生行为特征的提取能够较为准确的反映学生的学习行为;并基于这些特征建立决策树,能够预测到学生的学习行为和学习成绩,对学生进行监督,促进学校的管理。作为优选,所述步骤一中,一卡通数据包括图书馆门禁数据、图书馆借阅数据、宿舍门禁数据、一卡通消费数据、宿舍上网时间数据和实验室门禁数据。以上方法,由于学校中通过一卡通实现门禁识别、消费等功能,一卡通数据中包含学生在校园内的使用情况,一定程度上反映了学生在校园的行为轨迹。作为优选,所述步骤五具体包括:S1:对提取的学生行为特征进行重要性排序;S2:用神经网络对重要的特征进行训练,检验其预测精度,筛选出若干重要的特征,以重要性最大的特征作为根结点建立决策树;S3:对决策树进行剪枝处理。以上方法,由于采集的学生行为特征和数据很多,当使用决策树进行预测时,输入特征太多,计算复杂,导致决策树效率低,在输入前需要对特征进行删减,通过对特征进行排序,并利用神经网络对特征进行约减,能够去除冗余信息,从而提高决策树的效率。作为优选,所述S1中,学生行为特征进行重要性排序的方法:根据公式计算学生行为特征特征的分离值关联值C(K)=∑i≠j|x(i,k)-x(j,k)|×sign|y(i)-y(j)|,其中,S(K)是第k个特征的分离值,S1、S2分别是去掉特征k之后的数据组内距离和组间距离;C(K)是第k个特征的关联值,x(i,k)、x(j,k)分别为第i、j个样本的第k个特征值,y(i)、y(j)分别是第i、j个样本的输出值,sign(x)是符号函数;基于分离值和关联值计算属性的重要性R(K)=aS(K)+(1-a)C(K),其中,R(K)是第k个特征的重要性,a是0到1之间的常数;根据属性的重要性对属性进行排序。以上方法,通过计算特征的重要性进行排序,作为删减的指标,方便于后期对特征的删减,提高预测速度。作为优选,所述S2具体包括:用神经网络对其中重要的特征进行训练,并检测其预测精度,按照特征的重要性次序增加一个临近的特征进行训练,比对能够和原来的检测结果相比,反复进行,找到分类效果最佳的特征。以上方法,通过神经网络对特征进行约减,找到最佳的决策树输入特征和数量。作为优选,所述S3中,对决策树进行剪枝处理方法:S30:计算每个剪枝子树结点的期望错误率E(S)=(N-n+k-1)/(N+k),其中,S表示该子树中包含的所有训练实例,k为分类的个数,N为S中所有训练实例的个数,n为在S中占比例最多的分类的训练实例的个数;S31:计算结点的预备错误率BE:对每个非叶子结点的结点N,设该结点的个子节点为N1,N2,…Nm;计算出每个节点的期望错误率E、预备错误率BE、Error,BE(N)=∑Pi*Error(Ni),Error(N)=min(E(N),BE(N));S32:由决策树的第二层开始,每一层每个节点进行判断;若结点的预备错误率BE大于期望错误率E,则用该子树中出现比例最多的分类值作为叶子结点来代替该子树,并将该子树全部剪去,然后考虑同一层下一个节点,直到整棵树被检查过;S33:若期望错误率小于预备错误率,该子树剪枝;S34:由树的第二层节点开始,对于任何结点,当其子树中的失败结点的个数大于或等于子树叶子总结点的1/3时,该结点剪去。以上方法,由于决策树的空间和时间复杂性很大,影响了决策树的效率,需要剪去部分子树或结点;在剪去结点的检查中,通过预备错误率与期望错误率的比较,进行判断;有时数据不完整,树的有些分支在数据库中没有存在相应的记录,决策树中叶结点的值不是训练集的分类,该类结点为失败结点;当决策树中包含较多的失败结点,则这棵树的正确率会有很大的影响,需要剪去此类结点。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、通过对学生的行为预测,监督学生的行为,改善学校的管理,提高学生的学习效果;学生的行为数据是学生在校园的学习方式和生活习惯的反映,通过对学生的行为数据进行分析,建立预测模型,预测学生的行为,从而对学生进行前置管理和监督,提高学习成绩。2、学生行为预测效率高,通过决策树进行预测,并且通过特征重要性的排序,以及神经网络的筛选,将特征进行约简,优化决策树的输入,提高预测的效率,快速得到预测结果。附图说明本专利技术将通过例子并参照附图的方式说明,其中:图1是本专利技术一种基于人工神经网络的学生行为预测方法的结构示意图。具体实施方式本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特本文档来自技高网...
【技术保护点】
1.一种基于人工神经网络的学生行为预测方法,其特征在于:包括以下步骤:步骤一:数据收集,获取学生的一卡通数据、课堂出勤数据和学生成绩数据;步骤二:数据预处理,进行数据清洗、数据集成、数据选择和数据变换;数据清洗:数据缺失信息补充、重复数据清理和异常数据清理;数据集成:将数据进行统一的存储和管理;数据选择:选择合适的数据量,以及目标数据;数据变换:转换数据的格式;步骤三:学生行为特征提取,分别提取收集数据中的学生去图书馆的次数、在图书馆的时间、学生借阅书本量、宿舍进出时间和次数、学生消费时间和金额、学生课堂出勤次数、学生的成绩、宿舍上网时间、学生在实验室的时间和次数;步骤四:将提取的学生行为特征生成样本集,建立学生行为神经网络模型;步骤五:根据学生行为特征的重要性,建立学生行为特征的决策树模型;步骤六:基于决策树模型,对学生行为进行预测。
【技术特征摘要】
1.一种基于人工神经网络的学生行为预测方法,其特征在于:包括以下步骤:步骤一:数据收集,获取学生的一卡通数据、课堂出勤数据和学生成绩数据;步骤二:数据预处理,进行数据清洗、数据集成、数据选择和数据变换;数据清洗:数据缺失信息补充、重复数据清理和异常数据清理;数据集成:将数据进行统一的存储和管理;数据选择:选择合适的数据量,以及目标数据;数据变换:转换数据的格式;步骤三:学生行为特征提取,分别提取收集数据中的学生去图书馆的次数、在图书馆的时间、学生借阅书本量、宿舍进出时间和次数、学生消费时间和金额、学生课堂出勤次数、学生的成绩、宿舍上网时间、学生在实验室的时间和次数;步骤四:将提取的学生行为特征生成样本集,建立学生行为神经网络模型;步骤五:根据学生行为特征的重要性,建立学生行为特征的决策树模型;步骤六:基于决策树模型,对学生行为进行预测。2.如权利要求1所述的基于人工神经网络的学生行为预测方法,其特征在于:所述步骤一中,一卡通数据包括图书馆门禁数据、图书馆借阅数据、宿舍门禁数据、一卡通消费数据、宿舍上网时间数据和实验室门禁数据。3.如权利要求1所述的基于人工神经网络的学生行为预测方法,其特征在于:所述步骤五具体包括:S1:对提取的学生行为特征进行重要性排序;S2:用神经网络对重要的特征进行训练,检验其预测精度,筛选出若干重要的特征,以重要性最大的特征作为根结点建立决策树;S3:对决策树进行剪枝处理。4.如权利要求3所述的基于人工神经网络的学生行为预测方法,其特征在于:所述S1中,学生行为特征进行重要性排序的方法:根据公式计算学生行为特征特征的分离值关联值C(K)=∑i≠j|x(i,k)-x(j,k)|×sign|y(i)-y(j)|,其中,S(K)是第k个特征的分离值,S1、S2分别是去掉特征k之后的数据组内距离和组间...
【专利技术属性】
技术研发人员:黄冠铭,丁凯,王力舟,吴琪,
申请(专利权)人:四川文轩教育科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。