一种基于特征工程的在线课程画像的构建方法技术

技术编号:30021241 阅读:29 留言:0更新日期:2021-09-11 06:42
本发明专利技术公开了一种基于特征工程的在线课程画像的构建方法,涉及在线教育平台,智慧教育,教学辅助工具领域。所述方法引入知识图谱的逻辑架构和技术流程,采用多维度量化和模糊评价相结合的方法,包括以下步骤:S100、课程画像相关特征抽取,所述相关特征包括课程难度;S200、课程画像数据融合;S300、课程画像特征权重确立;S400、课程画像数据存储及绘制。本发明专利技术将当前在线教育平台中存在的海量且良莠不齐的课程进行多维度、全方位的评价,进而形成课程画像,能够筛选出匹配学习者画像的课程,让学习者的学习过程更加个性化。学习者的学习过程更加个性化。学习者的学习过程更加个性化。

【技术实现步骤摘要】
一种基于特征工程的在线课程画像的构建方法


[0001]本专利技术涉及一种基于特征工程的在线课程画像的构建方法,涉及在线教育平台,智慧教育,教学辅助工具领域。

技术介绍

[0002]随着信息技术的迅猛发展,人们的生产、生活和工作方式都在发生着变化,我们生活的世界日趋物联化、互联化和智能化。传统工业时代背景下的教育目标和教学模式已不再适合现今信息化、大数据时代的需求。各类机构、研究者等对于智慧教育的实现方式提出了很多新的创新点,如提出在线课堂、翻转课堂的应用实践形式,改变以往的教学模式,使学习者可以获得更多的自主学习时间和对应的学习资源,使学习过程更加高效。随着新型教育模式在线教育(e

Learning)和MOOC(Massive Open Online Courses,大规模开放式在线课程)的提出与逐渐普及,更多的学习者有机会到在线平台上进行访问和学习,相应地,平台积累了海量教学行为数据和知识资源,为平台自身的更新与完善提供了良好的基础。然而,在线学习系统在给学习者提供丰富的课程学习资源的同时也给学习者带来了困扰。随着海量在线课程资源的出现,对于一名想要获得感兴趣的知识的学习者来说,面对质量良莠不齐的在线课程,其极有可能遭遇“学习迷航”、“知识过载”、“信息爆炸”等难题,这些问题通常会令学习者产生方向迷失、半途而废的学习挫败感。为使学习者更加快速高效地选择在线课程资源,充分利用平台的优势,需要进行在线课程评价方法上的创新。

技术实现思路

[0003]本专利技术的目的在于提出一种基于特征工程的在线课程画像的构建方法,通过引入知识图谱的逻辑架构和技术流程,采用组合赋权法和线性加权法相结合的方法,全方位、多角度地对课程质量进行评价,解决了现有在线教育平台课程良莠不齐的问题,学习者能够更有针对性地选择与自己能力与兴趣相匹配的课程。
[0004]一种基于特征工程的在线课程画像的构建方法,所述构建方法包括以下步骤:
[0005]S100、进行课程画像相关特征抽取,所述相关特征包括课程难度;
[0006]S200、进行课程画像数据融合;
[0007]S300、进行课程画像相关特征权重确立;
[0008]S400、进行课程画像数据存储及绘制。
[0009]进一步的,在S100中,具体包括以下步骤:
[0010]S101、对预先存储的课程介绍文本数据信息进行结巴分词处理并提取分词数据信息;
[0011]S102、采用TF

IDF特征提取方法从非结构化文本中抽取出特征值,量化地表示课程文本信息;
[0012]S103、采用FastText文本分类算法对向量化的课程介绍文本进行文本分类,得到课程画像课程难度特征的的分类结果并存储于数据库中;
[0013]S104、对预先存储的课程大纲数据信息进行结巴分词并提取分词数据信息;
[0014]S105、基于分词数据信息,根据正则表达式匹配找出对应课程知识点并存储于数据库中;
[0015]S106、采用Jaccard相似度方法找出同类课程名的不同课程进行聚类,计算出该类课程的知识点全集并存储于数据库中;
[0016]S107、计算每门课程相较于同名课程全集的知识点覆盖度并存储于数据库中。
[0017]进一步的,在S101中,所述课程介绍文本数据信息包括课程的偏理论或者偏应用属性信息、偏入门或者偏进阶属性信息和适合学习人群的属性信息。
[0018]进一步的,在S104中,所述课程大纲数据信息包括课程知识点属性信息。
[0019]进一步的,在S200中,具体的,将抽取出的课程特征和统计出的课程相关数据分别做不同维度下的数据融合,将课程画像分为四个维度:课程基本信息、课程质量、课程难度和课程特色。
[0020]进一步的,在S300中,具体包括以下步骤:
[0021]S301、采用AHP层次分析法和熵权法相结合的方法确立课程画像特征权重;
[0022]S302、采用一种反映课程画像突出指标的线性加权方法计算课程画像特征值指标值。
[0023]进一步的,在S400中,具体包括以下步骤:
[0024]S401、将课程画像相关特征值与其所占权重相乘,得到所有特征在此画像中的具体值并存储于数据库中;
[0025]S402、采用知识图谱的方式在课程画像系统中展示课程画像。
[0026]本专利技术的有以下优点:
[0027]1、考虑到目前当前在线教育平台的在线课程数量过多及质量良莠不齐的情况,将在线课程的相关数据转化为课程画像的形式,回归课程本身,强调课程画像与学习者画像匹配,让学习者的选课过程不再盲目且更加个性化。
[0028]2、强调借助积累的学习者行为数据,和已有的课程数据,为课程建立个性化模型,能够筛选出适合学习者的课程,提供个性化的在线课程资源推荐,提高在线课程对于每个学习者的价值,更好地进行“因材施教”。
[0029]3、既包括了对课程画像指标及权重的设计,也包括对平台的设计,即将在线课程与画像形成映射,动态收集线上数据并修改在线课程画像,更好地为学习者提供服务。
[0030]4、通过收集并分析在线教育课程数据,从更丰富、更深层的维度,能够发展基于课程画像的课程评价,更精准地评价在线教育平台上的课程。
附图说明
[0031]图1是本专利技术的一种基于特征工程的在线课程画像的构建方法的方法流程图;
[0032]图2是课程画像系统功能结构图;
[0033]图3是课程画像系统框架图;
[0034]图4是课程介绍文本预处理流程图;
[0035]图5是课程大纲知识点抽取流程图。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]一种基于特征工程的在线课程画像的构建方法,所述构建方法包括以下步骤:
[0038]S100、进行课程画像相关特征抽取,所述相关特征包括课程难度;
[0039]S200、进行课程画像数据融合;
[0040]S300、进行课程画像相关特征权重确立;
[0041]S400、进行课程画像数据存储及绘制。
[0042]具体的,通过上述S100

S400能够利用收集的课程文本数据信息、课程大纲数据信息和统计得出的课程相关信息生成课程画像,解决目前在线教育平台的在线课程数量过多及质量良莠不齐的情况,进而通过课程画像与学习者画像匹配的方法,让平台中学习者的选课过程不再盲目且更加个性化。下面对上述各步骤进行详细说明。
[0043]其中,S100、对预先存储的若干条课程介绍文本进行结巴分词处理并提取分词数据信息。其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征工程的在线课程画像的构建方法,其特征在于,所述构建方法包括以下步骤:S100、进行课程画像相关特征抽取,所述相关特征包括课程难度;S200、进行课程画像数据融合;S300、进行课程画像相关特征权重确立;S400、进行课程画像数据存储及绘制。2.根据权利要求1所述的一种基于特征工程的在线课程画像的构建方法,其特征在于,在S100中,具体包括以下步骤:S101、对预先存储的课程介绍文本数据信息进行结巴分词处理并提取分词数据信息;S102、采用TF

IDF特征提取方法从非结构化文本中抽取出特征值,量化地表示课程文本信息;S103、采用FastText文本分类算法对向量化的课程介绍文本进行文本分类,得到课程画像课程难度特征的分类结果并存储于数据库中;S104、对预先存储的课程大纲数据信息进行结巴分词并提取分词数据信息;S105、基于分词数据信息,根据正则表达式匹配找出对应课程知识点并存储于数据库中;S106、采用Jaccard相似度方法找出同类课程名的不同课程进行聚类,计算出该类课程的知识点全集并存储于数据库中;S107、计算每门课程相较于同名课程全集的知识点覆盖度并存储于数据库中。3.根据权利要求2所述的一种基于特征工...

【专利技术属性】
技术研发人员:李全龙刘吴颖
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1