一种采用改进遗传算法的试题库自动组卷实现方法,该方法主要操作步骤包括:(1)制订组卷策略,(2)选取试题,(3)自动组卷,(4)分析评价。本发明专利技术对传统的简单遗传算法进行了改进,不仅保留了传统遗传算法具有的内在并行性、全局寻优和收敛速度快的特点,而且能够较好地避免传统遗传算法会产生早期盲目搜索、过早收敛、收敛于局部最优解、局部搜索能力不强等缺陷,应用本发明专利技术的改进遗传方法,计算机能够快速组成试卷,并且试卷各项参数均能较好地满足组卷策略要求,多次自动组卷生成的试卷的试题随机性、科学性和合理性的指标高,能够满足网络考试的要求,具有很好的应用前景。(*该技术在2024年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及一种,确切地说,涉及一种在网络教育中,为拥有一个标准化的电子试题库的网络考试系统提供自动组成考试试卷的方法;且该自动组卷方法是基于标准的电子试题库、自定义的组卷策略和针对目前现有的自动组卷所存在的问题进行改进的遗传算法的基础上,属于数字信息处理
技术介绍
在基于现代网络教育技术的试题库建设中,试题库自动组卷是运用计算机的数据搜索、优化等信息处理技术,从试题库中自动选择试题,并对试题信息进行处理,最后组成试卷。具体地说,自动组卷问题就是计算机根据人机交互制定的自动组卷策略,将其转换成为选择试题的属性(难度、区分度、建议分值等)约束条件,然后利用计算机的信息处理能力,依照科学合理的搜索和处理方法,从试题库中自动搜索出一组试题组成试卷,这份试卷应该满足教育测量学上的难度、区分度、信度和时间效率等指标。目前,自动组卷的主要难题是如何保证生成的试卷能够最大程度地满足用户的不同需要,并具有随机性、科学性、合理性。尤其在网络交互式环境下,用户对组卷速度的要求较高,而在理论上能搜索到全局最优的算法可能会以牺牲时间作为代价,往往不能达到预期效果。因此,如何选择一个高效、科学、强壮的算法是自动组卷的关键。现有的试题库自动组卷方法有随机法、回溯法、遗传算法等等。其中随机法结构简单,对于单道题的抽取运行速度较快;但是,该方法的效率不高,最主要问题是不但要求试题库的试题量大,还要分布良好。随机法组卷通常需要搜索的时间较长,这对于网络考试是不可忍受的。回溯法是属于有条件的深度优先算法,对于组卷指标简单的试卷而言,组卷成功率较高。但是,在实际应用时发现这种算法要占用大量的内存,程序结构相对比较复杂,而且选取试题缺乏随机性,组卷时间长。遗传算法是一种模拟自然界适者生存的淘汰选择方式和遗传机制的计算机随机优化算法。生物种群的生存过程普遍遵循达尔文的优胜劣汰遗传进化准则群体中的个体依据其对环境的适应能力而被大自然所选择或淘汰。进化过程的结果反映在个体结构上,即包含若干基因的染色体组成结构中,相应的表现型和基因型的联系体现了个体的外部特性与内部机理间的逻辑关系。染色体还通过个体之间的交叉、变异来适应大自然环境。用计算机方式表示的生物染色体、或染色体就是一串二进制数码,有时也叫个体。其适应能力是对应每一个染色体中的某一个数值来衡量;染色体的选择或淘汰则是按照所面对的问题求最大值还是最小值。为了体现染色体的适应能力,引入了对问题所涉及到的每一个染色体都能进行度量的函数一适应度函数。适应度函数体现了自然进化中的优胜劣汰原则,通过适应度函数可以决定染色体的优、劣程度。对于优化问题,适应度函数就是目标函数。遗传算法的遗传操作主要有三种选择(selection)、交叉(crossover)、变异(mutation)。选择操作又叫复制操作,根据个体的适应度函数值所度量的优、劣程度决定它在下一代是被淘汰还是被遗传;交叉操作的简单方式是将被选择出的两个个体分别作为父母个体,并将两者的部分数位的数值进行对应的交换;变异操作的简单方式是改变数码串中的某个数位上的数字,可以理解为改变染色体中的某个基因。在遗传算法中,不是所有被选择的染色体都要进行交叉操作和/或变异操作,而是以一定概率进行的通常交叉发生的概率Pc与变异发生的概率Pm相比较,前者要比后者大若干个数量级,例如交叉概率取值范围是,变异概率取值范围是。种群的染色体总数叫种群规模,它对算法效率有明显的影响,规模太小不利于进化,而规模太大将导致进化时间长。对不同的问题可能有各自适宜的种群规模,通常种群规模为30至100。遗传算法同时具有内在的并行性、全局寻优和收敛速度快的特点,这些特点都适宜于处理试题库自动组卷的问题。下面结合一例采用简单遗传算法进行试题库自动组卷的实例来详细说明该算法首先确定计算机的编码方法假设题库中总共有n道题,计算机用一个n位的二进制数字串来表示,形式如F1F2F3...Fn。其中Fi有两种取值,当第i题被选中时,Fi=1,当第i题未被选中时,Fi=0。这样,一份试卷可表示为形如00101...0010的n位的二进制数字串。接着进行群体的初始化,具体方法是计算机随机生成m个如同上述形式的二进制数字串,该m个个体(即染色体)形成遗传群体。在该群体中,每个个体的二进制数字串的数位长度都相同,即每个染色体的基因数量是相同的。然后对群体开始进行遗传操作,也就是对群体循环地进行选择、交叉、变异的操作,直到满足设定的停止条件,或者达到最大的循环次数为止。其中选择操作是使用适应度函数计算每个个体的适应度值,再从中选择适应度值较高的个体(即较好地满足组卷约束条件的个体),按比例复制后遗传到下一代,最后删去适应度值低的个体,但要保持群体的总数大小不变。交叉操作是将两个个体(即二进制数字串)按照交叉概率Pc从某一位开始彼此互相交换该两个数字串的后一部分。将群体中的所有数字串都随机地两两组合以后,针对每一对数字串,从0~1之间产生一个随机数,若该数大于交叉概率Pc,则给该对数字串随机选择一个交换点,对该交换点之后的数字串进行交叉操作;否则保持原状。变异操作是将二进制数字串中随机选定的某一位数字按照变异概率Pm发生反转1变为0,0变为1。具体到组卷过程中有所改变,即在变化某一位的同时,随机选择的另一位也进行反转,表现为替换当前试卷中的一道题。最后在循环操作达到规定次数的群体中选择适应度值最高的个体,也就是选择其中相对最好地满足组卷策略的一个试题组合,该组合就是最后的试卷。目前,在进行试题库自动组卷时,使用传统遗传算法的比较多,因为该方法能够较快地找到比较满意的结果,但是还存在一些问题会产生早期的盲目搜索、过早收敛、收敛于局部最优解、局部搜索能力不强等弊病,这些缺陷影响了该方法的进一步拓展应用。因此,如何解决自动组卷的易于实现和组卷方法效率高的矛盾、组卷成功率高和组卷时间短的矛盾、以及试卷较好满足预定组卷策略和试卷试题随机性好的矛盾已经成为业内人士急需解决的研发课题。
技术实现思路
有鉴于此,本专利技术的目的是提供一种,该方法对传统的遗传算法进行了改进,能够为拥有标准化试题库的网络考试系统自动生成更加适宜于网络考试的试卷,同时,较好地解决了现有技术存在的各种矛盾和问题。本专利技术的目的是这样实现的一种,其特征在于该方法包括下列操作步骤(1)制订组卷策略根据试题库提供的试题分布信息产生人机交互界面,藉由该界面用户制订一套自动组卷的策略;所述组卷策略就是对目标试卷中所有试题的属性提出的规范和约束条件;(2)选取试题根据所述组卷策略形成的试题筛选条件从试题库中选取试题,这些被选试题的属性参数将被用于遗传算法自动组卷;(3)自动组卷根据所述组卷策略形成适应度函数,然后根据每一份试卷,即染色体或个体的适应度函数值和改进后的遗传算法进行试题群体的遗传筛选,直至选出适应度函数值最高的一组试题组成试卷。该方法还包括下述操作步骤(4)分析评价参照制订的组卷策略,对已经生成的试卷是否满足组卷策略要求给出评价,并分析其试题分布及其它属性参数;所述分析和评价用于以后组卷时的参考。所述步骤(1)中制订自动组卷策略至少包括下述操作步骤(11)制订试题过滤条件设置候选题目的包括但不局限于此的下述过滤条件最大使用次数、本文档来自技高网...
【技术保护点】
一种采用改进遗传算法的试题库自动组卷实现方法,其特征在于:该方法包括下列操作步骤:(1)制订组卷策略:根据试题库提供的试题分布信息产生人机交互界面,藉由该界面用户制订一套自动组卷的策略;所述组卷策略就是对目标试卷中所有试题的属性提出 的规范和约束条件;(2)选取试题:根据所述组卷策略形成的试题筛选条件从试题库中选取试题组成试卷,所述试卷上的被选试题的属性参数将被用于遗传算法自动组卷;(3)自动组卷:根据所述组卷策略形成适应度函数,然后根据每一份试卷,即染 色体或个体的适应度函数值和改进后的遗传算法进行试题群体的遗传筛选,直至选出适应度函数值最高的一组试题组成试卷。
【技术特征摘要】
【专利技术属性】
技术研发人员:勾学荣,文福安,上官右黎,于斌,董跃武,姬艳丽,郑敏,叶建统,黄凯东,李建伟,孙元涛,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。