基于项加权和项集关联度的课程正负模式挖掘方法及系统技术方案

技术编号:10789454 阅读:195 留言:0更新日期:2014-12-17 17:54
一种基于项加权和项集关联度的课程正负关联模式挖掘方法及挖掘系统,利用教育数据预处理模块对教务数据预处理;利用课程项集模式生成模块生成课程候选项集,计算其支持度,由此得到课程频繁项集和负项集,根据课程频繁项集和负项集的关联度进行项集剪枝,得到有趣的课程频繁项集和负项集;利用课程正负关联规则模式生成模块计算课程关联规则兴趣度和置信度,从课程频繁项集和负项集挖掘矩阵加权课程强正负关联规则;课程正负关联模式显示模块将课程模式显示给用户,供用户分析和使用。本发明专利技术方法挖掘的课程候选项集和挖掘时间明显减少,避免了无效的课程关联模式出现,挖掘效率得到极大提高,其模式可为教务管理、决策以及教改提供科学依据。

【技术实现步骤摘要】
基于项加权和项集关联度的课程正负模式挖掘方法及系统
本专利技术属于教育数据挖掘领域,具体是一种基于项加权和项集关联度的课程正负模式挖掘方法及系统,适用于教务数据课程正负关联模式发现,其模式可为教学改革和教育管理、决策提供科学的依据。该专利技术运用于高校教务管理系统,可以扩展教务管理功能,其关联模式可以有助于教师改善和调整方法,提高教学质量,同时,可以帮助学生提高学习效果。
技术介绍
教育数据无加权关联模式挖掘方法、教育数据加权关联规则挖掘方法和教育数据矩阵加权关联规则挖掘方法是目前常见的教育数据关联规则挖掘方法。教育数据无加权关联规则挖掘方法是传统的关联规则挖掘方法在教育信息化领域的具体应用。该方法的特点是各个项目按平等一致的方式处理,只考虑项目频度,其缺陷是:在挖掘时只考虑课程的选修关联,没有考虑课程之间具有不同的重要性,更没有考虑学生选修课程后的教学效果(即课程考试成绩)。典型的教育数据无加权关联规则挖掘方法是Apriori方法(R.Agrawal,T.Imielinski,A.Swami.Miningassociationrulesbetweensetsofitemsinlargedatabase[C].InProceedingof1993ACMSIGMODInternationalConferenceonManagementofData,WashingtonD.C.,1993,(5):207-216.)及其改进方法(董辉.基于兴趣度的高职课程关联规则挖掘[J].吉首大学学报(自然科学版),2012,33(3):41-46.李忠哗,王凤利,何丕廉.关联规则挖掘在课程相关分析中的应用[J].河北农业大学学报,2010,33(3):116-119.)。针对传统关联规则挖掘的缺陷,教育数据加权关联规则挖掘方法不仅考虑课程的选修关联,还给每门课程赋予一定的权值,以体现课程之间具有不同的重要性。典型的教育数据加权关联规则挖掘方法有Cai等(C.H.Cai,A.da,W.C.Fu,etal.MiningAssociationRuleswithWeightedItems[C]//ProceedingsofIEEEInternationaldatabaseEngineeringandApplicationSymposiums,1998:68-77.)提出的加权关联规则挖掘方法(即MINWAL方法)及其改进方法(刘建炜,张颖.基于加权关联规则算法的学生成绩数据挖掘研究[J].福建教育学院学报,2012(3):123-125.)。教育数据加权关联规则挖掘方法的缺陷是:只考虑课程之间的重要性,没有考虑课程考试成绩的影响。针对上述缺陷,教育数据矩阵加权关联规则挖掘方法引入项目权值,考虑了考虑学生所选修课程的教学效果,即考虑课程考试成绩,其典型的矩阵加权关联规则挖掘方法是谭义红等提出的向量空间模型中完全加权关联规则的挖掘方法(谭义红,林亚平.向量空间模型中完全加权关联规则的挖掘[J].计算机工程与应用,2003(13):208-211.)以及面向查询扩展的矩阵加权关联规则挖掘方法MWARM(黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865.)。当前,矩阵加权关联规则挖掘方法在教育数据分析中的典型应用是余如等(余如,黄丽霞,黄名选.教育信息化中课程考试成绩数据关联模式的发现.计算机与现代化,2014(2):10-14.)提出的课程成绩数据关联模式发现方法,获得了显著的效果。现有的教育数据完全加权关联规则挖掘方法的缺陷是:现有的方法只能挖掘完全加权正关联规则模式,没有解决矩阵加权负关联模式挖掘问题,另外,现有方法其所挖掘的关联模式数量仍然很庞大,增加用户选择所需模式的难度,无趣的、虚假的和无效的关联模式还很多,很难将其技术上升到应用层面。针对上述问题,本专利技术根据教育数据的特点,提出一种新的基于项加权和项集关联度的课程正负模式挖掘方法及系统。该专利技术方法克服了现有矩阵加权模式挖掘方法的不足,不仅能挖掘矩阵加权课程正负关联规则模式,还能够有效地减少无趣的和无效的课程关联模式出现,其课程候选项集和挖掘时间明显减少,提高了挖掘效率,其课程关联规则模式更接近实际,可为教学改革和教育管理、决策提供科学的依据,在教育信息化教务数据分析与挖掘领域具有重要的应用价值和广阔的应用前景。
技术实现思路
本专利技术的目的在于,针对教育数据课程正负关联模式挖掘进行深入探索,提出一种基于项加权和项集关联度的课程正负模式挖掘方法及系统,应用于教育数据挖掘领域,为教育数据课程正负关联模式挖掘与分析提供新的挖掘方法,通过课程正负关联规则模式分析发现教育领域潜在的教育、教学规律和教育发展趋势,提高任课教师提高教学质量和学生的学习效果。本专利技术所采取的技术方案是:一种基于项加权和项集关联度的课程正负模式挖掘方法,包括如下步骤:(1)教育数据预处理:待处理的教育数据进行如下的预处理:将课程当作项目,课程成绩当作项目权值,课程权值规范化为0至1之间,提取学生课程信息及其成绩,构建课程信息库和课程项目库。(2)挖掘教育数据课程矩阵加权频繁1-项集L1:从课程项目库中提取课程候选1-项集C1,累加C1项集权值w(C1),计算其支持度cisup(C1),与ms比较,从C1中挖掘课程矩阵加权频繁1-项集L1加入ciPIS。候选1-项集C1支持度cisup(C1)公式如下:其中,n为课程信息数据库的记录总数。(3)挖掘有趣的矩阵加权课程频繁i-项集Li和负i-项集Ni(所述的i≥2),包括以下(3.1)步至(3.3)步:(3.1)候选i_项集Ci由课程频繁(i-1)-项集Li-1进行Apriori连接,然后累加Ci的权值,计算其cisup(Ci)。cisup(Ci)计算公式如下:(3.2)对于课程候选i_项集Ci支持度cisup(Ci)≥最小支持度阈值ms,计算课程频繁项集关联度ciFIR(Ci),如果其ciFIR(Ci)≥最小频繁关联度阈值mFr,则该Ci为有趣的矩阵加权课程频繁i-项集Li,并加入课程频繁项集集合ciPIS。课程频繁项集关联度ciFIR(Ci)计算公式如下:其中,为Ci的子项集集合。(3.3)对于课程候选i_项集Ci支持度cisup(Ci)<ms,计算课程负项集关联度ciNIR(Ci),若其ciNIR(Ci)≥最小负项集关联度阈值mNr,则该Ci为有趣矩阵加权课程负i-项集Ni,并加入课程负项集集合ciNIS。课程负项集关联度ciNIR(Ci)计算公式如下:其中,为Ci的子项集集合。(4)从课程频繁项集集合ciPIS中挖掘有效的矩阵加权课程正负关联规则模式,包括以下(4.1)步至(4.6)步:(4.1)从课程频繁项集集合ciPIS中取出课程频繁项集Li,找出Li的所有真子集.(4.2)从Li的真子集集合中任意取出两个真子集I1和I2,当cisup(I1)≥ms,cisup(I2)≥ms,并且I1∪I2=Li,计算矩阵加权课程频繁项集(I1,I2)的相关系数ciPCC(I1,I2)。cisup(I1)、cisup(I2)和课程频繁项集(I1,I2)的相关系数ciPCC(I1,I2)本文档来自技高网
...
基于项加权和项集关联度的课程正负模式挖掘方法及系统

【技术保护点】
一种基于项加权和项集关联度的课程正负模式挖掘方法,其特征在于,包括如下步骤:(1)教育数据预处理:待处理的教育数据进行如下的预处理:将课程当作项目,课程成绩当作项目权值,课程权值规范化为0至1之间,提取学生课程信息及其成绩,构建课程信息库和课程项目库;(2)挖掘教育数据课程矩阵加权频繁1‑项集L1:从课程项目库中提取课程候选1‑项集C1,计算其支持度cisup(C1),与ms比较,从C1中挖掘课程矩阵加权频繁1‑项集L1加入ciPIS;(3)挖掘有趣的矩阵加权课程频繁i‑项集Li和负i‑项集Ni(所述的i≥2),包括以下(3.1) 步至(3.3) 步:(3.1)候选i_项集Ci由课程频繁(i‑1)‑项集Li‑1进行Apriori连接,然后累加Ci的权值,计算其cisup(Ci); (3.2)对于课程候选i_项集Ci支持度cisup(Ci)≥最小支持度阈值ms,计算课程频繁项集关联度ciFIR(Ci),如果其ciFIR(Ci)≥最小频繁关联度阈值mFr,则该Ci为有趣的矩阵加权课程频繁i‑项集Li,并加入课程频繁项集集合ciPIS;(3.3) 对于课程候选i_项集Ci支持度cisup(Ci)< ms,计算课程负项集关联度ciNIR(Ci),若其ciNIR(Ci)≥最小负项集关联度阈值mNr,则该Ci为有趣矩阵加权课程负i‑项集Ni,并加入课程负项集集合ciNIS;(4)从课程频繁项集集合ciPIS中挖掘有效的矩阵加权课程正负关联规则模式,包括以下(4.1) 步至(4.6) 步:(4.1)从课程频繁项集集合ciPIS中取出课程频繁项集Li,找出Li的所有真子集;(4.2)从Li的真子集集合中任意取出两个真子集I1和I2,当cisup(I1)≥ms,cisup(I2)≥ms,并且I1I2=, I1I2=Li,计算矩阵加权课程频繁项集(I1,I2)的相关系数ciPCC(I1,I2);(4.3)当ciPCC(I1,I2)≥相关系数阈值时,计算VMWAR(I1,I2, mc, mi)的值,若其值等于1,则得出矩阵加权课程强关联规则I1→I2 ,加入ciPAR;计算VMWAR(﹁I1,﹁I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则﹁I1→﹁I2 ,加入ciNAR;(4.4)当矩阵加权课程项集(I1,I2)的相关系数ciPCC(I1,I2)≤-,计算VMWAR(I1,﹁I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则I1→﹁I2,加入ciNAR;计算VMWAR(﹁I1,I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则﹁I1→I2 ,加入ciNAR; (4.5) 继续(4.2)步骤,当课程频繁项集Li的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(4.6)步;(4.6) 继续(4.1)步骤,当课程频繁项集集合中每个频繁项集Li都被取出一次,而且仅能取出一次,则(4)步运行结束,转入(5)步;(5)从课程负项集集合ciNIS中挖掘有效的矩阵加权课程负关联规则模式,包括以下(5.1) 步至(5.6) 步:(5.1)从课程负项集集合ciNIS中取出课程负项集Ni,找出Ni的所有真子集;(5.2)从Ni的真子集集合中任意取出两个真子集I1和I2,当cisup(I1)≥ms,cisup(I2)≥ms,并且I1I2=, I1I2=Ni,计算矩阵加权课程负项集(I1,I2)的相关系数ciPCC(I1,I2);(5.3)当矩阵加权课程负项集(I1,I2)的相关系数ciPCC(I1,I2)≥,计算VMWAR(﹁I1,﹁I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则﹁I1→﹁I2 ,加入ciNAR;(5.4)当矩阵加权课程负项集(I1,I2)的相关系数ciPCC(I1,I2)≤-,计算VMWAR(I1,﹁I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则I1→﹁I2,加入ciNAR;计算VMWAR(﹁I1,I2, mc, mi) 的值,若其值等于1,则得出矩阵加权课程强负关联规则﹁I1→I2 ,加入ciNAR;(5.5) 继续(5.2)步骤,当课程负项集Ni的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(5.6)步;(5.6) 继续(5.1)步骤,当课程频繁项集集合中每个负项集Ni都被取出一次,而且仅能取出一次,则(5)步运行结束;至此,矩阵加权课程正负关联模式挖掘结束;所述的ms为最小支持度阈值,mc为最小置信度阈值,mi为最小兴趣度阈值,为相关系数阈值。...

【技术特征摘要】
1.一种基于项加权和项集关联度的课程正负模式挖掘方法,其特征在于,包括如下步骤:(1)教育数据预处理:待处理的教育数据进行如下的预处理:将课程当作项目,课程成绩当作项目权值,课程权值规范化为0至1之间,提取学生课程信息及其成绩,构建课程信息库和课程项目库;(2)挖掘教育数据课程矩阵加权频繁1-项集L1:从课程项目库中提取课程候选1-项集C1,计算其支持度cisup(C1),与最小支持度阈值ms比较,从C1中挖掘课程矩阵加权频繁1-项集L1加入课程频繁项集集合ciPIS;(3)挖掘有趣的矩阵加权课程频繁i-项集Li和负i-项集Ni,所述的i≥2,包括以下(3.1)步至(3.3)步:(3.1)候选i-项集Ci由课程频繁(i-1)-项集Li-1进行Apriori连接,然后累加Ci的权值,计算其支持度cisup(Ci);(3.2)对于课程候选i-项集Ci支持度cisup(Ci)≥最小支持度阈值ms,计算课程频繁项集关联度ciFIR(Ci),如果其ciFIR(Ci)≥最小频繁关联度阈值mFr,则该Ci为有趣的矩阵加权课程频繁i-项集Li,并加入课程频繁项集集合ciPIS,所述的课程频繁项集关联度ciFIR(Ci)计算公式如下式(1)所示:式(1)中,为Ci的子项集集合,所述的cisup(Ik)为Ci的子项集Ik的支持度;(3.3)对于课程候选i-项集Ci支持度cisup(Ci)<ms,计算课程负项集关联度ciNIR(Ci),若其ciNIR(Ci)≥最小负项集关联度阈值mNr,则该Ci为有趣矩阵加权课程负i-项集Ni,并加入课程负项集集合ciNIS,所述的课程负项集关联度ciNIR(Ci)计算公式如下式(2)所示:式(2)中,为Ci的子项集集合;(4)从课程频繁项集集合ciPIS中挖掘有效的矩阵加权课程正负关联规则模式,包括以下(4.1)步至(4.6)步:(4.1)从课程频繁项集集合ciPIS中取出课程频繁项集Li,找出Li的所有真子集;(4.2)从Li的真子集集合中任意取出两个真子集I1和I2,当cisup(I1)≥ms,cisup(I2)≥ms,并且I1∪I2=Li,计算矩阵加权课程频繁项集(I1,I2)的相关系数ciPCC(I1,I2),所述的ciPCC(I1,I2)计算公式如下式(3)所示:式(3)中,cisup(I1,I2)为矩阵加权课程频繁项集(I1,I2)的支持度;(4.3)当ciPCC(I1,I2)≥相关系数阈值β时,计算有效的矩阵加权课程关联规则综合评价VMWAR(I1,I2,mc,mi)的值,若其值等于1,则得出矩阵加权课程强关联规则I1→I2,加入有效的矩阵加权课程正关联规则集合ciPAR;计算有效的矩阵加权课程关联规则综合评价的值,若其值等于1,则得出矩阵加权课程强负关联规则I2,加入有效的矩阵加权课程负关联规则集合ciNAR;所述的VMWAR(I1,I2,mc,mi)的计算公式如下式(4)所示:式(4)中,ciARI(I1→I2)为矩阵加权课程正关联规则I1→I2的兴趣度,其计算公式如下式(5)所示:式(5)中,ciconf(I1→I2)为矩阵加权课程正关联规则I1→I2的置信度,其计算公式如下式(6)所示:所述的的计算公式如下式(7)所示:式(7)中,为矩阵加权课程负关联规则的兴趣度,其计算公式如下式(8)所示:式(7)和式(8)中,为矩阵加权课程负关联规则的置信度,其计算公式如下式(9)所示:(4.4)当矩阵加权课程项集(I1,I2)的相关系数ciPCC(I1,I2)≤-β,计算有效的矩阵加权课程关联规则综合评价的值,若其值等于1,则得出矩阵加权课程强负关联规则加入有效的矩阵加权课程负关联规则集合ciNAR;计算有效的矩阵加权课程关联规则综合评价的值,若其值等于1,则得出矩阵加权课程强负关联规则加入有效的矩阵加权课程负关联规则集合ciNAR;所述的的计算公式如下式(10)所示:式(10)中,为矩阵加权课程负关联规则的兴趣度,其计算公式如下式(11)...

【专利技术属性】
技术研发人员:黄名选韦吉锋
申请(专利权)人:广西教育学院
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1