一种基于多模态数据的网络学习资源质量评估方法及系统技术方案

技术编号:38365462 阅读:13 留言:0更新日期:2023-08-05 17:32
本发明专利技术公开了一种基于多模态数据的网络学习资源质量评估方法及系统,包括网络学习资源质量核心要素项特征提取模块、网络学习资源语义特征表示模块、学习资源质量预测评分模块、网络学习资源评价维度分类模块、网络学习资源质量分析报告生成模块,分别采用学习资源信息门控循环单元、三级Transformer动态注意力网络、循环信息差神经网络RIDNN、BERT预训练模型和TextCNN模型对网络学习资源进行处理;然后通过LSTM Transformer网络生成网络学习资源质量分析报告。本发明专利技术可以实现网络学习资源质量的智能评价,帮助资源建设者多维度掌握资源内容质量,促进网络学习资源内容及时更新优化。优化。优化。

【技术实现步骤摘要】
一种基于多模态数据的网络学习资源质量评估方法及系统


[0001]本专利技术属于计算机科学与技术应用领域,具体地说是一种面向开放知识社区中的协同编辑型文档类资源内容的质量智能评估方法,可用于开放知识社区资源质量的评估、预警和优化。

技术介绍

[0002]网络学习资源是“互联网”+教育体系的核心要素。近年来,开放知识社区以“共建、共享、开放、联通”的特性吸引了各知识领域的专家、研究者和爱好者参与到知识协同构建社区。典型的开放知识社区有维基百科(Wikipedia)、Google Knol、Github、百度百科、学习元平台、语雀平台等。该类社区在大量用户的协同编辑中生成了知识共享文档,促进了知识的传承、流通、创作和进化。然而,开放知识社区也因用户群体的知识水平不平衡性和复杂性,致使协同编辑生成的网络学习资源存在一定的质量问题。爆炸性增长的网络学习资源质量良莠不齐,不利于知识的创作和传播。
[0003]针对开放知识社区中的网络学习资源质量的可靠性问题,各平台主要采用人工审核及参与用户协同共管的方式实现对资源内容质量的保障。例如,维基百科采用“人在回路、参与者审核、管理权限等级划分”的资源质量管控模式,同时利用约束规则实现内容编辑的规范性,达到保障网络学习资源高质量的目的。网络学习资源质量保障相关技术包括:面向学习元平台的审核技术、基于语义基因和信任评估的内容协同编辑的可信度计算、内容进化智能控制模型技术、资源内容协同编辑技术和版本控制技术。但是,现有的技术忽视了用户群体协同编辑的行为数据,未能有效利用网络学习资源共享传播过程中产生的交互行为数据,而且忽略了网络学习资源不同版本之间内容本身的变化,同时市面也比较缺乏该类资源质量的分析报告自动生成技术。
[0004]指数级增长的网络学习资源和用户群体,使得资源内容的审核工作变得繁重。传统依靠人工审核和机器学习技术的方法不可持续,给知识的创作者、建设者和管理者带来了较大的工作负担。因此,可以结合目前较为前沿的人工智能技术,探索一种可以有效减轻开放知识社区中网络学习资源质量评估任务的智能化方法。

技术实现思路

[0005]专利技术目的:本专利技术要解决的技术问题是:开放知识社区中网络学习资源质量智能化评估的问题。本方法提供了一种可以从资源的编辑行为数据、用户交互行为数据、内容数据和评论数据等多个方面的信息综合生成资源质量评估分析报告的方法,以实现帮助资源内容建设者和管理者减轻网络学习资源内容编辑和审核的负担。
[0006]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0007]一种基于多模态数据的网络学习资源质量评估方法,基于网络学习资源的编辑、更新、访问等离散型外显行为数据,提取网络学习资源质量核心要素项的特征向量。以网络学习资源不同版本内容的文本型数据为关键信息抽取节点,对网络学习资源的标题、摘要、
关键词等语义信息进行特征抽取。再将上述两种特征作为学习资源评分预测的特征输入,通过本专利技术设计的评分预测算法进行评分预测;以网络学习资源的相关评论信息为资源质量评价的参考依据,对评论数据进行情感倾向分析和评价归类。以网络学习资源的不同版本为时间节点,提取该时间段内的评论关键信息,结合上述计算结果,生成网络学习资源质量的分析报告。本专利技术的网络学习资源质量评估方法,可以实现网络学习资源质量的智能评价,帮助资源建设者多维度掌握资源内容质量,促进网络学习资源内容及时更新优化,具体包括以下步骤:
[0008]步骤1,采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取,得到网络学习资源质量核心要素项特征。
[0009]步骤2,采用三级Transformer动态注意力网络对网络学习资源进行评估得到网络学习资源语义特征表示。
[0010]步骤3:采用循环信息差神经网络RIDNN对步骤1得到的网络学习资源质量核心要素项特征和步骤2得到的网络学习资源语义特征表示进行网络学习资源质量评分预测,得到学习资源质量预测评分。
[0011]步骤4,通过BERT预训练模型和TextCNN模型对评论数据进行处理,得到网络学习资源评价维度分类。
[0012]步骤5:根据步骤1得到的网络学习资源质量核心要素项特征、步骤2得到的网络学习资源语义特征表示、步骤3得到的学习资源质量预测评分以及步骤4得到的网络学习资源评价维度分类通过LSTM Transformer网络生成网络学习资源质量分析报告。
[0013]优选的:步骤1中采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取的方法,包括以下步骤:
[0014]步骤11,将网络学习资源质量核心要素项编码作为循环网络的输入X
t
,X
t
表示第t版本的网络学习资源质量核心要素项输入。
[0015]步骤12,计算f
t
,f
t
用于保留第t

1版和第t版学习资源核心要素项的增益信息。
[0016]f
t
=sigmoid(X
t

X
t
‑1)
[0017]其中,f
t
表示不同版本学习资源要素项增益信息特征,sigmoid表示神经网络非线性激活函数,X
t
表示第t版学习资源要素项特征。
[0018]步骤13,计算o
t
,o
t
用于第t版学习资源核心要素项信息过滤。
[0019]o
t
=(1

sigmoid(W
ho
h
t
‑1+W
xo
X
t
))

tanh(W
ho
h
t
‑1+W
xo
X
t
)
[0020]其中,o
t
表示当前核心要素项经过信息过滤后保留重要信息的特征,W
ho
表示隐藏层参数,h
t
‑1表示隐藏向量,W
xo
表示输入层参数,

表示矩阵点积。
[0021]步骤14,计算m
t
,m
t
用于保留当前学习资源特征X
t
和历史特征h
t
‑1提取中的有效信息。
[0022]m
t
=sigmoid(W
ho
h
t
‑1+W
xo
X
t
)
[0023]其中,m
t
表示从当前学习资源特征X
t
和历史特征h
t
‑1提取的特征向量。
[0024]步骤15,计算C
t
,C
t
用于将历史数据信息作为下一个网络单元输入,以实现历史多个版本重要信息的留存。...

【技术保护点】

【技术特征摘要】
1.一种基于多模态数据的网络学习资源质量评估方法,其特征在于,包括以下步骤:步骤1,采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取,得到网络学习资源质量核心要素项特征;步骤2,采用三级Transformer动态注意力网络对网络学习资源进行评估得到网络学习资源语义特征表示;步骤3:采用循环信息差神经网络RIDNN对步骤1得到的网络学习资源质量核心要素项特征和步骤2得到的网络学习资源语义特征表示进行网络学习资源质量评分预测,得到学习资源质量预测评分;步骤4,通过BERT预训练模型和TextCNN模型对评论数据进行处理,得到网络学习资源评价维度分类;步骤5:根据步骤1得到的网络学习资源质量核心要素项特征、步骤2得到的网络学习资源语义特征表示、步骤3得到的学习资源质量预测评分以及步骤4得到的网络学习资源评价维度分类通过LSTM Transformer网络生成网络学习资源质量分析报告。2.根据权利要求1所述基于多模态数据的网络学习资源质量评估方法,其特征在于:步骤1中采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取的方法,包括以下步骤:步骤11,将网络学习资源质量核心要素项编码作为循环网络的输入X
t
,X
t
表示第t版本的网络学习资源质量核心要素项输入;步骤12,计算f
t
,f
t
用于保留第t

1版和第t版学习资源核心要素项的增益信息;f
t
=sigmoid(X
t

X
t
‑1)其中,f
t
表示不同版本学习资源要素项增益信息特征,sigmoid表示神经网络非线性激活函数,X
t
表示第t版学习资源要素项特征;步骤13,计算o
t
,o
t
用于第t版学习资源核心要素项信息过滤;o
t
=(1

sigmoid(W
ho
h
t
‑1+W
xo
X
t
))

tanh(W
ho
h
t
‑1+W
xo
X
t
)其中,o
t
表示当前核心要素项经过信息过滤后保留重要信息的特征,W
ho
表示隐藏层参数,h
t
‑1表示隐藏向量,W
xo
表示输入层参数,

表示矩阵点积;步骤14,计算m
t
,m
t
用于保留当前学习资源特征X
t
和历史特征h
t
‑1提取中的有效信息;m
t
=sigmoid(W
ho
h
t
‑1+W
xo
X
t
)其中,m
t
表示从当前学习资源特征X
t
和历史特征h
t
‑1提取的特征向量;步骤15,计算C
t
,C
t
用于将历史数据信息作为下一个网络单元输入,以实现历史多个版本重要信息的留存;C
t
=C
t
‑1⊙
f
t
+o
t
其中,C
t
表示从历史数据信息中保留的第t版本时的重要信息特征;步骤16,计算h
t
,h
t
为当前版本学习资源信息和历史版本学习资源信息提取所得的隐藏层特征;h
t
=tanh(C
t
)

m
t
其中,h
t
表示当前版本学习资源信息和历史版本学习资源信息提取的隐藏层特征,C
t
表示第t版本时的重要信息特征,tanh表示双曲正切函数;步骤17,计算y
t
,y
t
为第t版学习资源核心要素项的特征表示,该特征提取是由隐藏向量
h
t
经过前馈神经网络计算所得,将得到的y
t
作为资源质量评分预测算法的输入;y
t
=W
hy
h
t
+b
ty
其中,y
t
表示第t版本学习资源的评分预测,W
hy
表示前馈神经网络的隐藏层参数,h
t
表示前馈神经网络的隐藏层向量,b
ty
表示前馈神经网络的偏置项。3.根据权利要求2所述基于多模态数据的网络学习资源质量评估方法,其特征在于:步骤2中采用三级Transformer动态注意力网络对网络学习资源进行评估得到网络学习资源语义特征表示的方法,包括以下步骤:步骤21:将网络学习资源的标题、关键词和摘要通过已经预训练好的词向量将相关内容表示为输入特征矩阵X
t1
;步骤22:将t

1时刻的输出向量表示y

t
‑1作为t

1版本的有效信息与t版本的特征进行有效融合,其计算公式为:步骤23:将X

t1
作为输入向量,输入到Transformer Encoder架构中进行第一级的特征计算,其计算公式表示为:h
t1
=TransformEncoder(X

t1
);步骤24:将第一级计算所得隐藏层向量h
t1
输入第二级Transformer Encoder结构中,以实现关联章节目录信息,其计算公式表示为:其中X

t2
表示章节目录内容经过预训练词向量嵌入后的输入;步...

【专利技术属性】
技术研发人员:杨现民李康康
申请(专利权)人:江苏师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1