【技术实现步骤摘要】
一种基于多模态数据的网络学习资源质量评估方法及系统
[0001]本专利技术属于计算机科学与技术应用领域,具体地说是一种面向开放知识社区中的协同编辑型文档类资源内容的质量智能评估方法,可用于开放知识社区资源质量的评估、预警和优化。
技术介绍
[0002]网络学习资源是“互联网”+教育体系的核心要素。近年来,开放知识社区以“共建、共享、开放、联通”的特性吸引了各知识领域的专家、研究者和爱好者参与到知识协同构建社区。典型的开放知识社区有维基百科(Wikipedia)、Google Knol、Github、百度百科、学习元平台、语雀平台等。该类社区在大量用户的协同编辑中生成了知识共享文档,促进了知识的传承、流通、创作和进化。然而,开放知识社区也因用户群体的知识水平不平衡性和复杂性,致使协同编辑生成的网络学习资源存在一定的质量问题。爆炸性增长的网络学习资源质量良莠不齐,不利于知识的创作和传播。
[0003]针对开放知识社区中的网络学习资源质量的可靠性问题,各平台主要采用人工审核及参与用户协同共管的方式实现对资源内容质量的保障。例如,维基百科采用“人在回路、参与者审核、管理权限等级划分”的资源质量管控模式,同时利用约束规则实现内容编辑的规范性,达到保障网络学习资源高质量的目的。网络学习资源质量保障相关技术包括:面向学习元平台的审核技术、基于语义基因和信任评估的内容协同编辑的可信度计算、内容进化智能控制模型技术、资源内容协同编辑技术和版本控制技术。但是,现有的技术忽视了用户群体协同编辑的行为数据,未能有效利用网络学习资源共
【技术保护点】
【技术特征摘要】
1.一种基于多模态数据的网络学习资源质量评估方法,其特征在于,包括以下步骤:步骤1,采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取,得到网络学习资源质量核心要素项特征;步骤2,采用三级Transformer动态注意力网络对网络学习资源进行评估得到网络学习资源语义特征表示;步骤3:采用循环信息差神经网络RIDNN对步骤1得到的网络学习资源质量核心要素项特征和步骤2得到的网络学习资源语义特征表示进行网络学习资源质量评分预测,得到学习资源质量预测评分;步骤4,通过BERT预训练模型和TextCNN模型对评论数据进行处理,得到网络学习资源评价维度分类;步骤5:根据步骤1得到的网络学习资源质量核心要素项特征、步骤2得到的网络学习资源语义特征表示、步骤3得到的学习资源质量预测评分以及步骤4得到的网络学习资源评价维度分类通过LSTM Transformer网络生成网络学习资源质量分析报告。2.根据权利要求1所述基于多模态数据的网络学习资源质量评估方法,其特征在于:步骤1中采用学习资源信息门控循环单元对网络学习资源质量核心要素项特征进行提取的方法,包括以下步骤:步骤11,将网络学习资源质量核心要素项编码作为循环网络的输入X
t
,X
t
表示第t版本的网络学习资源质量核心要素项输入;步骤12,计算f
t
,f
t
用于保留第t
‑
1版和第t版学习资源核心要素项的增益信息;f
t
=sigmoid(X
t
‑
X
t
‑1)其中,f
t
表示不同版本学习资源要素项增益信息特征,sigmoid表示神经网络非线性激活函数,X
t
表示第t版学习资源要素项特征;步骤13,计算o
t
,o
t
用于第t版学习资源核心要素项信息过滤;o
t
=(1
‑
sigmoid(W
ho
h
t
‑1+W
xo
X
t
))
⊙
tanh(W
ho
h
t
‑1+W
xo
X
t
)其中,o
t
表示当前核心要素项经过信息过滤后保留重要信息的特征,W
ho
表示隐藏层参数,h
t
‑1表示隐藏向量,W
xo
表示输入层参数,
⊙
表示矩阵点积;步骤14,计算m
t
,m
t
用于保留当前学习资源特征X
t
和历史特征h
t
‑1提取中的有效信息;m
t
=sigmoid(W
ho
h
t
‑1+W
xo
X
t
)其中,m
t
表示从当前学习资源特征X
t
和历史特征h
t
‑1提取的特征向量;步骤15,计算C
t
,C
t
用于将历史数据信息作为下一个网络单元输入,以实现历史多个版本重要信息的留存;C
t
=C
t
‑1⊙
f
t
+o
t
其中,C
t
表示从历史数据信息中保留的第t版本时的重要信息特征;步骤16,计算h
t
,h
t
为当前版本学习资源信息和历史版本学习资源信息提取所得的隐藏层特征;h
t
=tanh(C
t
)
⊙
m
t
其中,h
t
表示当前版本学习资源信息和历史版本学习资源信息提取的隐藏层特征,C
t
表示第t版本时的重要信息特征,tanh表示双曲正切函数;步骤17,计算y
t
,y
t
为第t版学习资源核心要素项的特征表示,该特征提取是由隐藏向量
h
t
经过前馈神经网络计算所得,将得到的y
t
作为资源质量评分预测算法的输入;y
t
=W
hy
h
t
+b
ty
其中,y
t
表示第t版本学习资源的评分预测,W
hy
表示前馈神经网络的隐藏层参数,h
t
表示前馈神经网络的隐藏层向量,b
ty
表示前馈神经网络的偏置项。3.根据权利要求2所述基于多模态数据的网络学习资源质量评估方法,其特征在于:步骤2中采用三级Transformer动态注意力网络对网络学习资源进行评估得到网络学习资源语义特征表示的方法,包括以下步骤:步骤21:将网络学习资源的标题、关键词和摘要通过已经预训练好的词向量将相关内容表示为输入特征矩阵X
t1
;步骤22:将t
‑
1时刻的输出向量表示y
′
t
‑1作为t
‑
1版本的有效信息与t版本的特征进行有效融合,其计算公式为:步骤23:将X
′
t1
作为输入向量,输入到Transformer Encoder架构中进行第一级的特征计算,其计算公式表示为:h
t1
=TransformEncoder(X
′
t1
);步骤24:将第一级计算所得隐藏层向量h
t1
输入第二级Transformer Encoder结构中,以实现关联章节目录信息,其计算公式表示为:其中X
′
t2
表示章节目录内容经过预训练词向量嵌入后的输入;步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。