System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 考生作答信息的异常检测方法、系统及存储介质技术方案_技高网

考生作答信息的异常检测方法、系统及存储介质技术方案

技术编号:43587132 阅读:9 留言:0更新日期:2024-12-06 17:50
本发明专利技术实施例提供一种考生作答信息的异常检测方法、系统及存储介质,属于计算机算法应用领域。该方法包括:获取无纸化考试过程中,考生的作答过程和作答信息,并提取作答过程和作答信息中的关键特征生成对应的矩阵数据;针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度;若矩阵数据为无标注数据,则使用聚类算法对矩阵数据进行无监督学习,确定异常考生的行为特征;若矩阵数据为标注数据,则采用监督学习确定异常考生的行为特征。通过利用考中作答的数据进行考生异常及雷同筛查,对考生之间的行为、作答内容计算相似度数值,利用有监督学习或无监督学习对考生行为相似的批量考生进行识别,以对考生疑似异常情况进行预警。

【技术实现步骤摘要】

本专利技术涉及计算机算法应用,具体地涉及一种考生作答信息的异常检测方法、系统及存储介质


技术介绍

1、近年来,随着信息技术的飞速发展,无纸化考试已成为现代教育考试体系的重要组成部分。相对于传统纸质考试,无纸化考试为考试组织方提供了更多的灵活性和便捷性,也降低了考试的成本,无纸化考试作为一种重要趋势在国内外重大考试中有着越来越多的应用。

2、然而,这种考试形式的普及也带来了一个新的问题,如作弊等异常行为。为了维护考试的公平性和公正性,防止作弊行为的发生,开发高效的作弊检测算法显得尤为重要。


技术实现思路

1、本专利技术实施例的目的是提供一种考生作答信息的异常检测方法、系统及存储介质,用于对上机考试的考生作答数据进行深入分析,从而识别出潜在的考生异常行为,更好的保障无纸化考试的完成。

2、为了实现上述目的,本专利技术实施例提供一种考生作答信息的异常检测方法,包括:

3、获取无纸化考试过程中,考生的作答过程和作答信息,并提取所述作答过程和作答信息中的关键特征生成对应的矩阵数据;

4、针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度;

5、若矩阵数据为无标注数据,则使用聚类算法对矩阵数据进行无监督学习,并结合不同考生之间作答行为的相似度将考生区分为正常考生和异常考生,并针对所述异常考生进行异常检测,确定异常考生的行为特征;

6、若矩阵数据为标注数据,则采用监督学习方式针对标记出的异常考生样本进行异常检测,确定异常考生的行为特征。

7、可选的,考生的作答过程和作答信息包括但不限于考点信息、考场信息、考试区域信息、考试批次信息、考生信息、考试科目信息、考试试卷编号信息、考试试卷题号信息、考试科目题目顺序信息、考试题目结构信息、考生作答题目时间信息、考生浏览题目时间信息、考生修改题目时间信息以及考生题目作答内容信息。

8、可选的,提取所述作答过程和作答信息中的关键特征生成对应的矩阵数据,包括:

9、以作答时间为关键因素,提取每个考生对于每道题目的作答时间,并分别以考生号和题目号为横坐标纵坐标,构建横纵坐标对应元素为时间的矩阵;

10、以作答内容为关键因素,提取每个考生对于每道题目的作答内容,并分别以考生号和题目号为横坐标纵坐标,构建横纵坐标对应元素为作答内容的矩阵;

11、以浏览时间和修改次数为关键因素,提取每个考生对于每道题目的作答时间,并分别以考生号和题目号为横坐标纵坐标加一列修改次数,构建横纵坐标对应元素为浏览时间以及修改次数的矩阵。

12、可选的,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度,包括:

13、针对作答内容矩阵的相似计算,采用如下公式:

14、;

15、式中,为异或运算,,为不同样本集合,i为样本集合中的标号。

16、可选的,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度,包括:

17、针对时间轨迹矩阵的相似计算,采用如下公式:

18、;

19、式中,表示两个连续变量 (x,y) 的皮尔逊相关性系数,表示两个连续变量 (x,y) 之间的协方差,表示两个连续变量 (x,y)各自标准差的乘积,表示两个变量,与其各自期望值的差的乘积的期望值。

20、可选的,若矩阵数据为无标注数据,则使用聚类算法对矩阵数据进行无监督学习,并结合不同考生之间作答行为的相似度将考生区分为正常考生和异常考生,并针对所述异常考生进行异常检测,确定异常考生的行为特征,包括:

21、针对大范围跨考区跨考点数据,采用k-means聚类算法将大范围考生作答信息数据中远离主要簇的数据点作为异常点,进而确定异常考生;

22、针对小范围考点数据,采用单类支持向量机将小范围考点数据到中心点的距离小于等于临界距离的数据点作为异常点,进而确定异常考生。

23、可选的,若矩阵数据为标注数据,则采用监督学习方式针对标记出的异常考生样本进行异常检测,确定异常考生的行为特征,包括:

24、若矩阵数据为标注数据,则采用xgboost集成学习方法对标记出的异常考生样本进行异常检测,确定异常考生的行为特征;

25、其中,xgboost集成学习方法的目标函数如下:

26、

27、式中,作为损失函数衡量预测结果与真实结果差异,损失函数选用均方误差,为第个样本真实值,为第个样本预测值,为弱评估器即加入的决策树,t为预测轮数,为惩罚项,惩罚项中叶子节点个数和系数相乘与权重l2模的平方的和,为常数项。

28、可选的,所述考生作答信息的异常检测方法还包括:

29、将考生的作答信息视为离散分布的时间序列数据,并构建时间序列模型;

30、将获取的考生历史作答行为数据输入时间序列模型,预测考生未来的作答行为。

31、另一方面,本专利技术还提供一种考生作答信息的异常检测系统,包括:

32、获取单元,用于获取无纸化考试过程中,考生的作答过程和作答信息,并提取所述作答过程和作答信息中的关键特征生成对应的矩阵数据;

33、计算单元,用于针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度;

34、第一异常检测单元,用于若矩阵数据为无标注数据,则使用聚类算法对矩阵数据进行无监督学习,并结合不同考生之间作答行为的相似度将考生区分为正常考生和异常考生,并针对所述异常考生进行异常检测,确定异常考生的行为特征;

35、第二异常检测单元,用于若矩阵数据为标注数据,则采用监督学习方式针对标记出的异常考生样本进行异常检测,确定异常考生的行为特征。

36、另一方面,本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的考生作答信息的异常检测方法的步骤。

37、通过上述技术方案,利用考中作答的数据进行考生异常及雷同筛查,对考生之间的行为、作答内容等进行准确量化计算相似度数值,疑似集体作弊考生识别,对考生行为相似且具有相同性的批量考生进行识别,以对考生作答过程中的疑似异常情况进行预警通知监考员或考试组织方。

38、本专利技术实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

本文档来自技高网...

【技术保护点】

1.一种考生作答信息的异常检测方法,其特征在于,包括:

2.根据权利要求1所述的考生作答信息的异常检测方法,其特征在于,考生的作答过程和作答信息包括但不限于考点信息、考场信息、考试区域信息、考试批次信息、考生信息、考试科目信息、考试试卷编号信息、考试试卷题号信息、考试科目题目顺序信息、考试题目结构信息、考生作答题目时间信息、考生浏览题目时间信息、考生修改题目时间信息以及考生题目作答内容信息。

3.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,提取所述作答过程和作答信息中的关键特征生成对应的矩阵数据,包括:

4.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度,包括:

5.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度,包括:

6.根据权利要求1所述的考生作答信息的异常检测方法,其特征在于,若矩阵数据为无标注数据,则使用聚类算法对矩阵数据进行无监督学习,并结合不同考生之间作答行为的相似度将考生区分为正常考生和异常考生,并针对所述异常考生进行异常检测,确定异常考生的行为特征,包括:

7.根据权利要求1所述的考生作答信息的异常检测方法,其特征在于,若矩阵数据为标注数据,则采用监督学习方式针对标记出的异常考生样本进行异常检测,确定异常考生的行为特征,包括:

8.根据权利要求1所述的考生作答信息的异常检测方法,其特征在于,所述考生作答信息的异常检测方法还包括:

9.一种考生作答信息的异常检测系统,其特征在于,包括:

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的考生作答信息的异常检测方法的步骤。

...

【技术特征摘要】

1.一种考生作答信息的异常检测方法,其特征在于,包括:

2.根据权利要求1所述的考生作答信息的异常检测方法,其特征在于,考生的作答过程和作答信息包括但不限于考点信息、考场信息、考试区域信息、考试批次信息、考生信息、考试科目信息、考试试卷编号信息、考试试卷题号信息、考试科目题目顺序信息、考试题目结构信息、考生作答题目时间信息、考生浏览题目时间信息、考生修改题目时间信息以及考生题目作答内容信息。

3.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,提取所述作答过程和作答信息中的关键特征生成对应的矩阵数据,包括:

4.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度,包括:

5.根据权利要求2所述的考生作答信息的异常检测方法,其特征在于,针对矩阵数据进行相似计算,确定不同考生之间作答行为的相似度...

【专利技术属性】
技术研发人员:马磊袁峰汪军磊祝永心
申请(专利权)人:山东山大鸥玛软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1