一种学生在校情况判别方法及其系统技术方案

技术编号:24356650 阅读:14 留言:0更新日期:2020-06-03 02:42
本发明专利技术提出了一种学校在校情况判别方法及其系统,所述方法步骤如下:S1、通过校园网络采集各个校园业务系统的数据;S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表;S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;S4、根据步骤S3的筛选结果判断学生在校情况。所述系统包括数据采集模块、数据清洗模块、数据筛选模块、在校情况分析模块和数据存储模块。本发明专利技术方法和系统可以自动化判断学生在校情况,具有数据质量需求低、容错率高的特点。

A distinguishing method and system of students' situation in school

【技术实现步骤摘要】
一种学生在校情况判别方法及其系统
本专利技术涉及一种学生在校情况判别方法及其系统,属于高校教育教学

技术介绍
在高校的教育工作中,经常需要判断和了解学生在校情况,从而选择实施相应的教育教学工作,传统判断学生在校情况的做法往往是通过人工统计或利用考勤打卡装置配合命令的方式,但这种做法存在人力管理成本高、灵活性差、学生配合积极性不高等问题,近些年随着高校信息化建设水平的提升,部分高校出现了利用学生在校数据推算和预测学生在校情况的方法,比如基于一卡通消费数据判断学生在校情况,或者通过监控识别系统判断学生在校情况,但是一方面学校的数据质量参差不齐,消费模型随机性比较大,另一方面每个学生的行为习惯不同,单一的数据很难说明问题,所以现有的学生在校情况判断方法精确度有限,而且软硬件配合的系统成本较高。
技术实现思路
为了解决现有技术难以准确判断学生在校情况的问题,本专利技术提出了一种学生在校情况判别方法及其系统,利用多维度的异构数据进行耦合分析,判断学生在校情况,具有数据质量需求低、容错率高的特点。为解决上述技术问题,本专利技术采用了如下技术手段:一种学校在校情况判别方法,具体包括以下步骤:S1、通过校园网络采集各个校园业务系统的数据;S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库;S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;S4、根据步骤S3的筛选结果判断学生在校情况。进一步的,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。进一步的,步骤S2的具体操作为:将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格并加载到大数据存储库中。进一步的,步骤S3的具体操作为:预先设置参数,所述参数包括学生学号和筛选时段,从学生在校活动记录表中筛选出所有在筛选时段内的学生在校活动记录,构成综合记录表,再根据学生学号从综合记录表中筛选出每个学生的活动记录表,所述活动记录表包含多条数据链,每条数据链包括学生学号和活动时间。进一步的,步骤S4的具体操作如下:S41、设共有n个学生,选取第i个学生的活动记录表Xi,i=1,2,…,n,利用计数函数统计该学生在筛选时段内的活动次数Ci;S42、按照活动时间大小从小到大的为活动记录表中的数据链进行排序,利用最大数据链中的活动时间减去最小数据链中的活动时间,获得该学生在筛选时段内的活动时间长度Ti;S43、重复步骤S41和S42,计算所有学生的活动次数和活动时间长度,分别求取活动次数平均值单次活动时间长度Di和单次活动时间长度平均值具体公式如下:S44、当第i个学生的活动次数Ci大于0,则判断该学生在筛选时段内在校,否则判断该学生在筛选时段内不在校;当该学生的活动时间长度Ti大于等于阈值A,且单次活动时间长度Di小于等于单次活动时间长度平均值则判断该学生在筛选时段内全时段在校;S45、根据该学生在筛选时段内的活动次数Ci和活动次数平均值计算该学生的活跃度;S56、将S44的判断结果和S45的活跃度按照学生学号对应的存储在大数据存储库中。进一步的,所述阈值A的取值范围是筛选时段长度的60%~80%。一种学生在校情况判别系统,包括数据采集模块、数据清洗模块、数据筛选模块、在校情况分析模块和数据存储模块;所述数据采集模块,用于通过校园网络采集各个校园业务系统的数据;所述数据清洗模块,用于对数据采集模块采集到的数据进行数据抽取、数据转换和数据集成,获得学生在校活动记录表;所述数据筛选模块,用于根据参数从学生在校活动记录表筛选每个学生的活动记录表;所述在校情况分析模块,用于根据数据筛选模块筛选的活动记录表分析判断学生在校情况,所述学生在校情况包括学生是否在校、学生在校时段和学生活跃度;所述数据存储模块,用于存储数据采集模块采集的数据、学生在校活动记录表、活动记录表和学生在校情况。进一步的,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。进一步的,所述数据清洗模块采用PentahoDataIntegration、OracleDataIntegrator或CloverDX工具平台。进一步的,所述数据筛选模块、在校情况分析模块和数据存储模块集成在ElasticStack/或ApacheSpark计算引擎中。采用以上技术手段后可以获得以下优势:本专利技术提出了一种学生在校情况判别方法及其系统,基于日渐丰富的校园生活,本专利技术方法和系统从多个校园业务网络中采集所需数据,并通过异构数据清洗技术处理采集的数据,将数据转换成统一格式,生成学生在校活动记录表,构建筛选参数和判别逻辑,通过筛选的数据逐步分析学生在校情况,判断学生是否在校、学生在校时段和学生活跃度。由于本专利技术方法和系统关联的校园业务系统较多,数据来源广,覆盖了学生在校的大部分活动,所以对采集的数据质量需求较低,容错率高。本专利技术方法和系统的操作简单、计算量较小,对硬件的需求较低,随着数据增多,对学生在校情况的判断的准确度会不断提升,有效减少随机性和数据质量造成的误差。附图说明图1为本专利技术一种学生在校情况判别方法的步骤流程图。图2为一种学生在校情况判别系统的结构示意图。图中,1是数据采集模块,2是数据清洗模块,3是数据筛选模块,4是在校情况分析模块,5是数据存储模块。具体实施方式下面结合附图对本专利技术的技术方案作进一步说明:一种学校在校情况判别方法,如图1所示,具体包括以下步骤:S1、通过校园网络采集各个校园业务系统的数据,本专利技术方法中的校园业务系统主要包括一卡通系统、图书馆系统、考勤系统和校园网系统,涵盖了学习、消费、娱乐在内的多个系统。通过网络从一卡通系统获取消费记录,刷卡消费记录中包括学生姓名、学号、卡号、消费金额和消费时间等信息,从图书馆系统中饭获取图书借阅记录,借阅记录包括学生姓名、学号、借阅书名、借阅时间等信息,借阅记录又可以分为借书记录和还书记录,从考勤系统中获取考勤记录,考勤记录包括学生姓名、学号、考勤时间、考勤地点等信息,从校园网系统获取网络接入记录,网络接入记录包括学生姓名、学号、网络接入号码、网络接入时间和网络接入地点,网络接入记录又可以分为上线记录和下线记录。S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库,具体操作为:将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格,学生在校活动记录本文档来自技高网...

【技术保护点】
1.一种学校在校情况判别方法,其特征在于,包括以下步骤:/nS1、通过校园网络采集各个校园业务系统的数据;/nS2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库;/nS3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;/nS4、根据步骤S3的筛选结果判断学生在校情况。/n

【技术特征摘要】
1.一种学校在校情况判别方法,其特征在于,包括以下步骤:
S1、通过校园网络采集各个校园业务系统的数据;
S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库;
S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;
S4、根据步骤S3的筛选结果判断学生在校情况。


2.根据权利要求1所述的一种学校在校情况判别方法,其特征在于,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。


3.根据权利要求2所述的一种学校在校情况判别方法,其特征在于,步骤S2的具体操作为:
将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格并加载到大数据存储库中。


4.根据权利要求3所述的一种学校在校情况判别方法,其特征在于,步骤S3的具体操作为:
预先设置参数,所述参数包括学生学号和筛选时段,从学生在校活动记录表中筛选出所有在筛选时段内的学生在校活动记录,构成综合记录表,再根据学生学号从综合记录表中筛选出每个学生的活动记录表,所述活动记录表包含多条数据链,每条数据链包括学生学号和活动时间。


5.根据权利要求4所述的一种学校在校情况判别方法,其特征在于,步骤S4的具体操作如下:
S41、设共有n个学生,选取第i个学生的活动记录表Xi,i=1,2,…,n,利用计数函数统计该学生在筛选时段内的活动次数Ci;
S42、按照活动时间大小从小到大的为活动记录表中的数据链进行排序,利用最大数据链中的活动时间减去最小数据链中的活动时间,获得该学生在筛选时段内的活动时间长度Ti;
S43、重复步骤S41和S42,计算所有学生的活动次数和活动时间长度,分别求取活动次数平均值单次活动时间长度Di和单次活动时间长度平均值具体公式如下:





<...

【专利技术属性】
技术研发人员:董汉舫
申请(专利权)人:南京零镜科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1