一种基于众智的视频学习资源提取及知识标注方法及系统技术方案

技术编号:27514402 阅读:26 留言:0更新日期:2021-03-02 18:46
本发明专利技术公开了一种基于众智的视频学习资源提取及知识标注方法及系统。该方法包括步骤:S1,获取多个用户对视频学习资源中知识点的标注信息,标注信息包括知识点在视频学习资源中的位置标注信息和内容标注信息;S2,根据位置标注信息将标注信息分类,构建标注信息集合,计算标注信息集合的综合置信度,若标注信息集合的综合置信度达到预设阈值,则根据标注信息集合从视频学习资源中提取视频片段,并且对标注信息集合的标注信息进行融合处理,获得视频片段的融合标注信息。本发明专利技术通过判断标注信息集合的置信度,降低了某些用户随意标注视频对标注结果的影响,提高了众智标注的质量和可信度。可信度。可信度。

【技术实现步骤摘要】
一种基于众智的视频学习资源提取及知识标注方法及系统


[0001]本专利技术属于教育信息
,更具体地,涉及一种基于众智的视频学习资源提取及知识标注方法及系统。

技术介绍

[0002]随着互联网技术的发展,互联网上视频资源也呈知识增长趋势,其中越来越多的视频资源包含有大量的知识价值,这些具有知识价值的视频片段都可应用到教育教学过程中,既能直观展示教学内容,又可吸引学生的注意力。对于这些具有知识价值的视频片段,如何挖掘其中所包含的隐性知识点,并将视频片段与知识点关联起来,使学习者快速高效地获取个性化的学习资源是当前研究的热点。
[0003]目前进行视频学习资源提取的方法分为专家手动标注和机器自动标注,依靠少数不同领域中的专家对视频片段进行手动标记,则需要耗费巨大的人力、财力和时间成本;使用机器学习的方法可实现自动标注,但是对于具有隐性知识点的视频片段的提取,机器学习难以实现自动处理,单纯靠机器学习来实现具有隐性知识点的视频片段的提取比较困难。

技术实现思路

[0004]针对现有技术的至少一个缺陷或改进需求,本专利技术提供了一种基于众智的视频学习资源提取及知识标注方法及系统,一种基于众智的视频学习资源提取及知识标注方法,可以提升提高了众智标注的质量和可信度。
[0005]为实现上述目的,按照本专利技术的第一方面,提供了一种基于众智的视频学习资源提取及知识标注方法,包括步骤:
[0006]S1,获取多个用户对视频学习资源中知识点的标注信息,标注信息包括知识点在视频学习资源中的位置标注信息和内容标注信息;
[0007]S2,根据位置标注信息将标注信息分类,构建标注信息集合,计算标注信息集合的综合置信度,若标注信息集合的综合置信度达到预设阈值,则根据标注信息集合从视频学习资源中提取视频片段,并且对标注信息集合的标注信息进行融合处理,获得视频片段的融合标注信息。
[0008]优选的,所述S2包括步骤:
[0009]S21,初始化片段分割位置容差和用户学科领域置信度,根据位置标注信息和片段分割位置容差将标注信息分类,构建标注信息集合,根据用户学科领域置信度和标注信息,计算标注信息集合的综合置信度;
[0010]S22,对于综合置信度达到预设阈值的标注信息集合,根据用户学科领域置信度和位置标注信息进行视频片段提取,获得标注信息集合对应的视频片段;
[0011]S23,对于综合置信度达到预设阈值的标注信息集合,基于用户学科置信度对标注信息集合的多个标注信息进行融合和标准化处理,获得标注信息集合对应的视频片段的融
合标注信息,融合标注信息包括融合内容标注信息和融合位置标注信息;
[0012]S24,计算每个内容标注信息和融合标注信息的内容标注相似度,更新每条标注信息对应的用户学科领域置信度;
[0013]S25,计算每个内容标注信息和融合内容标注信息的内容标注差异,计算每个位置标注信息和融合位置标注信息的位置差,根据标注差异与位置差的关系,更新片段分割位置容差。
[0014]优选的,所述步骤S24中,若标注信息和融合标注信息的相似度大,则增加用户学科领域置信度,否则,则减小用户学科领域置信度,更新用户学科领域置信度的计算公式为:
[0015][0016]subjectCredit

K
表示更新后的用户在第K个学科的用户学科领域置信度,subjectCredit
K
表示更新前的用户在第K个学科的用户学科领域置信度,Sim()表示内容标注相似度,SIM0表示预设调整阈值,η表示预设调整步长,表示融合标注信息,Mark
i
为第i个标注信息。
[0017]优选的,所述步骤S25中包括步骤:设置片段分割位置容差更新周期,根据上一更新周期平均值,调整片段分割位置容差,并且若标注与最后融合结果差异度不随位置差变化,调大片段分割位置容差,否则减小片段分割位置容差,更新片段分割位置容差的计算公式为:
[0018][0019][0020][0021]E
f,k
为第k个视频片段的标注差异与位置差的关系,N为第k个视频片段的标注信息总数量,,M为上一更新周期的融合标注信息的数量,为M个E
f,k
的平均值,Cov()表示相关性,Difference()表示内容标注差异,Distance()表示位置差,Mark
i,k
表示第k个视频片段的第i个标注信息,表示融合汇聚最终得到的第k个视频片段,E
f0
为预设的片段分割位置容差调整参考值,Δ

P
为更新后的片段分割位置容差值,Δ
P
为更新前的片段分割位置容差值。
[0022]优选的,所述S21包括步骤:
[0023]S211,初始化片段分割位置容差和用户学科领域置信度;
[0024]S212,遍历标注信息,根据位置标注信息和片段分割位置容差将标注信息分类,将位置标注信息间的位置差在片段分割位置容差内的所有标注信息归为一个集合内,获得标
注信息集合;
[0025]S213,根据标注信息集合中的所有标注信息,获得标注信息集合的所属学科领域;
[0026]S214,获取标注信息集合中每个标注信息对应用户在该标注信息集合所属学科领域的用户学科领域置信度,计算标注信息集合的综合置信度,综合置信度的计算公式为:
[0027][0028]其中,SetCredit为标注信息集合的综合置信度,SubjectCredit
K,i
表示标注信息集合中第i个标注信息对应用户在该标注信息集合所属学科领域的用户学科领域置信度,N为标注信息集合中标注信息的总数量。
[0029]优选的,所述S22中,所述视频片段提取采用基于用户置信度的加权投票方法实现。
[0030]优选的,内容标注信息中包括知识点,所述S23包括步骤:
[0031]S231,根据标注信息集合中标注信息的知识点,将一个标注信息集合中的标注信息进行分类,获得视频片段中每个知识点的所有标注信息;
[0032]S231,将视频片段中每个知识点的所有标注信息进行融合和标准化,获得视频片段中每个知识点的融合标注信息。
[0033]优选的,所述步骤S231包括步骤:
[0034]获取视频片段中每个知识点的所有标注信息、每个知识点的每条标注信息对应的用户标识和用户学科领域置信度,将视频片段中每个知识点的每条标注信息进行向量化处理,获得向量化文本数据;
[0035]将向量化文本数据输入第一长短期记忆人工神经网络中,获得文本分布式表达数据;
[0036]将文本分布式表达数据输入第二长短期记忆人工神经网络中,输出预测的摘要分布式表达数据,并且基于用户学科置信度使用注意力机制,调整输入值对输出预测值的影响程度;
[0037]将摘要分布式表达数据转换成文本形式,获得视频片段中每个知识点的融合标注本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于众智的视频学习资源提取及知识标注方法,其特征在于,包括步骤:S1,获取多个用户对视频学习资源中知识点的标注信息,标注信息包括知识点在视频学习资源中的位置标注信息和内容标注信息;S2,根据位置标注信息将标注信息分类,构建标注信息集合,计算标注信息集合的综合置信度,若标注信息集合的综合置信度达到预设阈值,则根据标注信息集合从视频学习资源中提取视频片段,并且对标注信息集合的标注信息进行融合处理,获得视频片段的融合标注信息。2.如权利要求1所述的基于众智的视频学习资源提取及知识标注方法,其特征在于,所述S2包括步骤:S21,初始化片段分割位置容差和用户学科领域置信度,根据位置标注信息和片段分割位置容差将标注信息分类,构建标注信息集合,根据用户学科领域置信度和标注信息,计算标注信息集合的综合置信度;S22,对于综合置信度达到预设阈值的标注信息集合,根据用户学科领域置信度和位置标注信息进行视频片段提取,获得标注信息集合对应的视频片段;S23,对于综合置信度达到预设阈值的标注信息集合,基于用户学科置信度对标注信息集合的多个标注信息进行融合和标准化处理,获得标注信息集合对应的视频片段的融合标注信息,融合标注信息包括融合内容标注信息和融合位置标注信息;S24,计算每个内容标注信息和融合标注信息的内容标注相似度,更新每条标注信息对应的用户学科领域置信度;S25,计算每个内容标注信息和融合内容标注信息的内容标注差异,计算每个位置标注信息和融合位置标注信息的位置差,根据标注差异与位置差的关系,更新片段分割位置容差。3.如权利要求2所述的基于众智的视频学习资源提取及知识标注方法,其特征在于,所述步骤S24中,若标注信息和融合标注信息的相似度大,则增加用户学科领域置信度,否则,则减小用户学科领域置信度,更新用户学科领域置信度的计算公式为:subjectCredit

K
表示更新后的用户在第K个学科的用户学科领域置信度,subjectCredit
K
表示更新前的用户在第K个学科的用户学科领域置信度,Sim()表示内容标注相似度,SIM0表示预设调整阈值,η表示预设调整步长,表示融合标注信息,Mark
i
为第i个标注信息。4.如权利要求2所述的基于众智的视频学习资源提取及知识标注方法,其特征在于,所述步骤S25中包括步骤:设置片段分割位置容差更新周期,根据上一更新周期平均值,调整片段分割位置容差,并且若标注与最后融合结果差异度不随位置差变化,调大片段分割位置容差,否则减小片段分割位置容差,更新片段分割位置容差的计算公式为:
E
f,k
为第k个视频片段的标注差异与位置差的关系,N为第k个视频片段的标注信息总数量,,M为上一更新周期的融合标注信息的数量,为M个E
f,k
的平均值,Cov()表示相关性,Difference()表示内容标注差异,Distance()表示位置差,Mark
i,k
表示第k个视频片段的第i个标注信息,表示融合汇聚最终得到的第k个视频片段,E
f0
为预设的片段分割位置容差调整参考值,Δ...

【专利技术属性】
技术研发人员:杜旭李浩班倩茹杨娟
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1