一种线上课程评价内容中的建设性意见提取方法及装置制造方法及图纸

技术编号:37411712 阅读:30 留言:0更新日期:2023-04-30 09:36
本发明专利技术公开了一种线上课程评价内容中的建设性意见提取方法,以及用于实现该方法的装置。该方法首先通过BERT编码层和全连接层得到目标词的预测概率,然后基于启发式多跨度解码算法改进筛选算法,解决了原算法去冗余方面的不足,并引入了目标描述细腻程度系数,来获取课程评论针对的实体目标。再将实体目标输入带注意力机制的Bi

【技术实现步骤摘要】
一种线上课程评价内容中的建设性意见提取方法及装置


[0001]本专利技术属于移动学习
,涉及基于深度学习的数据分析,具体涉及一种线上课程评价内容中的建设性意见提取方法及装置。

技术介绍

[0002]随着网络带宽的发展,慕课逐渐流行了起来。高校的教学模式逐渐发展成为“在线开放课程”与“课堂教学”相结合,称为翻转课堂。这种新兴的教学方式不仅使得学生的理论学习突破了时空限制,而且极大地提高了学生的学习积极性。
[0003]线上课程的反馈和质量评价是提高翻转课堂教学质量的重要环节。目前主要集中在分析学生的课后学习行为数据,例如研究分析学生观看视频的行为数据,基于视频吸引力模型来评价在线课程质量;或者运用正态分布检测方法和回归分析方法,分析学生考试成绩的分布特征,从而判断学生的理论知识掌握情况等。这些方法虽然能够在一定程度上反映学生对于线上课程的接受程度,但是无法关注到学生对于视频内容的具体想法。
[0004]在线学习平台通常会在每个课程下提供留言评论的功能,因此平台上堆积了大量的学生评论数据。部分评论中存在学生在完成线上学习课程后对课程的视频内容发表的想法或建议,这些内容可以更加直观得反映学生的想法。如果对评论区中的数据进行管理与分析,提取其中的关键性内容,可以快速总结出线上课程内容的改进方向。
[0005]现有技术中,在面对大量评价数据的分析工作时,通常在预设了几个关键目标,然后通过相似度匹配等方式,将评价数据进行分类。但是这种方法只能得到预设的结果,不适用于在线课程评价体系中。
专利
技术实现思路

[0006]针对现有技术的不足,本专利技术提出了一种线上课程评价内容中的建设性意见提取方法及装置,针对评论内容提取目标词,再将目标词作为先验信息,提取评论内容中的建设性意见,解决在线学习平台的评价数据分析难的问题。
[0007]一种线上课程评价内容中的建设性意见提取方法,具体包括以下步骤:
[0008]步骤1、目标词提取
[0009]目标词提取的过程是从一条评论中提取出所有意见的目标,具体步骤如下:
[0010]步骤1.1、将针对线上课程的评论c输入BERT编码层,首先得到评论c中每个词对应的词向量,然后再针对词向量进行BERT编码得到每个词对应的上下文语境特征表示t
i
,拼接后得到评论c的上下文语境特征表示T
c
={t
i
,i=1,2,...,m},m表示评论c中的词数量。
[0011]步骤1.2、使用两个参数不共享的全连接层,输入评论c的上下文语境特征表示T
c
,经过映射后分别得到集合和其中,和分别表示评论c中第i个词是目标词的起始位置和终止位置的预测值。将集合中的预测值输入Softmax层中,得到对应的概率分布P
s
和P
e

[0012][0013][0014]其中,W
s
、W
e
为两个全连接层的参数。
[0015]步骤1.3、对评论c进行人工标注,得到目标词起始位置的真实值集合和终止位置的真实值集合
[0016][0017][0018]通过最小化全连接层的损失函数L(W
s
,W
e
),训练全连接层的参数W
s
和W
e

[0019][0020]步骤2、目标词筛选
[0021]在确定全连接层的参数后,根据全连接层输出的概率值,筛选目标词,具体步骤如下:
[0022]步骤2.1、分别从集合和中选择M个概率值最高的词,放入集合S和集合E。集合S中的任意一个元素s
i
都可以作为起始位置,与集合E中的任意一个元素e
j
对应的终止位置组合成一个目标词(s
i
,e
j
)。其中i、j分别表示该词在评论c中的位置,且i≠j。
[0023]步骤2.2、对于组合(s
i
,e
j
),如果i<j,且s
i
和e
j
对应的预测值之和大于设定阈值γ,则将其放入集合P中,否则丢弃。
[0024]步骤2.3、针对集合P中的组合计算其目标分值g,并按照目标分值由大到小放入集合G中:
[0025][0026]其中α用于控制目标细腻程度,α=0表示目标描述越简短越好,α=1,表示目标描述越细腻越好。
[0027]步骤2.4、对于集合P中任意两个组合,如果存在相同的元素,则从集合G中取出位置在前的那个组合存入集合O中,并将另一个组合从集合P中删除。
[0028]步骤2.5、重复步骤2.4直至集合O中的元素数量大于q或集合P为空集,完成目标词筛选。
[0029]步骤3、意见提取
[0030]根据步骤2筛选后的目标词,从评论中提取相关意见,具体步骤如下:
[0031]步骤3.1、将评论c中的每个词转换为词向量I0,再依次输入Bi

LSTM模型,得到评论c对应的特征表示I
L

[0032][0033][0033]表示评论c中第i个词对应的特征表示,是
Bi

LSTM模型的参数。
[0034]步骤3.2、使用注意力机制为每一个词赋予一个初始权重a
i
,然后按照以下方法调整为β
i

[0035][0036][0037][0038]其中,p
e
和p
s
分别表示目标词的起始位置和终止位置。再使用Softmax函数对β
i
进行归一化处理,得到第i个词的最终权重γ
i

[0039]γ
i
=Softmax(β
i
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0040]步骤3.3、根据权重γ
i
对Bi

LSTM模型的输出结果进行加权求和,得到融入了上下文含义的词特征表示cr
i

[0041][0042]进而得到评论c的特征表示H
c
={cr
i
,i=1,2,...,m}。将cr
i
输入全连接层和Softmax层,计算预测向量
[0043]pd
i
=Softmax(W
f
cr
i
+b
f
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0044]其中W
f
和b
f
分别是全连接层的参数矩阵以及偏置。预测向量给出了第i个词的标签y
i
∈{B,I,O}的概率,O=0,B=1,I=2。
[0045]步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种线上课程评价内容中的建设性意见提取方法,其特征在于:具体包括以下步骤:步骤1、目标提取将收集的评论数据输入BERT编码层进行编码,向两个参数不共享的全连接层输入编码结果,预测句子中每个词作为目标词起始位置与终止位置的概率值;步骤2、目标词筛选步骤2.1、选择M个作为目标词起始位置概率值最高的词放入集合S,再选择M个作为目标词终止位置概率值最高的词放入集合E;将集合S中的s
i
与集合E中的元素e
j
进行组合,得到可能的目标词(s
i
,e
j
);其中i、j分别表示该词在评论c中的位置,且i≠j;步骤2.2、对于可能的目标词(s
i
,e
j
),如果i<j,且s
i
和e
j
对应的概率值之和大于设定阈值γ,则将其放入集合P中,否则丢弃;步骤2.3、针对集合P中的组合计算其目标分值g,并按照目标分值由大到小放入集合G中:其中α表示目标描述细腻程度系数;步骤2.4、对于集合P中任意两个组合,如果存在相同的元素,则从集合G中取出位置在前的那个组合存入集合O中,并将另一个组合从集合P中删除;步骤2.5、重复步骤1.4直至集合O中的元素数量大于q或集合P为空集,完成目标词筛选;步骤3、意见提取步骤3.1、将评论c中的每个词转换为词向量I0,再依次输入Bi

LSTM模型,得到评论c对应的特征表示应的特征表示表示评论c中第i个词对应的特征表示,m表示评论c中的词数量,θ
BiLSTM
是Bi

LSTM模型的参数;步骤3.2、使用注意力机制为每一个词赋予一个初始权重a
i
,然后按照以下方法调整为β
i
:::其中,p
e
和p
s
分别表示目标词的起始位置和终止位置;步骤3.3、使用Softmax函数对β
i
进行归一化处理,得到第i个词的最终权重γ
i
;根据权重γ
i
对Bi

LSTM模型的输出结果进行加权求和,得到融入了上下文含义的词特征表示cr
i

将cr
i
输入全连接层和Softmax层,计算预测向量输入全连接层和Softmax层,计算预测向量其中W
f
和b
f...

【专利技术属性】
技术研发人员:高志刚岑伟鹏吴丁杰张耀谭敏
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1