计算机课程填空题自动生成方法技术

技术编号：33143599 阅读：85 留言：0更新日期：2022-04-22 13:54

本发明专利技术公开了计算机课程填空题自动生成方法，包括从教材大纲中选择文本作为训练集；将训练集中的文本送入TextRank算法中提取关键句；从出题文本集中抽取若干条数据，并将其标记为三元组形式，将标记后的数据放入TPLinker模型中，采用Handshaking tagging scheme方法进行词汇标注，完成TPLinker模型训练；将关键句输入训练后的TPLinker模型中，将输出的实体关系依据TF

全部详细技术资料下载

【技术实现步骤摘要】
计算机课程填空题自动生成方法

[0001]本专利技术属于出题方法
，涉及一种计算机课程填空题自动生成方法。

技术介绍

[0002]近年来随着多种实体关系抽取和文本关键句提取的模型的提出与落地，自然语言处理领域在深度学习方向也得到了广阔的应用前景的进展，对于问题生成方面的问题，使用人力从海量文本中查找知识点提出问题仍是目前主流的出题方式，该种方法效率较低，对不同时期不同人员参与时问题生成的风格差别较大，需要一种统一的问题生成范式来减轻人力工作的负担。
[0003]目前，对于计算机科学与工程相关领域的实体识别和实体关系抽取的研究正处于起步阶段，没有针对计算机科学规范文本对应的公开权威的语料库。根本原因在于，规范中的内容涉及专业多，名词术语与日常用词有所重叠，不同专业之间名词关联复杂，使得专业领域人员和具备自然语言处理技术的人都无法单独展开工作。进而导致机器关键语句抽取的实体关系识别的能力较低，无法达到机器生成问题的目的。

技术实现思路

[0004]本专利技术的目的是提供一种计算机课程填空题自动生成方法，解决了现有技术中存在的无法达到机器生成问题的目的的问题。
[0005]本专利技术所采用的技术方案是，计算机课程填空题自动生成方法，包括以下步骤：
[0006]步骤1、从教材大纲中选择文本作为训练集；
[0007]步骤2、将训练集中的文本送入TextRank算法中提取关键句；
[0008]步骤3、从出题文本集中抽取若干条数据，并将其标记为三元组形式，将标记后的数据...

【技术保护点】

【技术特征摘要】
1.计算机课程填空题自动生成方法，其特征在于，包括以下步骤：步骤1、从教材大纲中选择文本作为训练集；步骤2、将所述训练集中的文本送入TextRank算法中提取关键句；步骤3、从出题文本集中抽取若干条数据，并将其标记为三元组形式，将标记后的数据放入TPLinker模型中，采用Handshaking tagging scheme方法进行词汇标注，完成TPLinker模型训练；步骤4、将步骤2得到的关键句输入步骤3得到的TPLinker模型中，将输出的实体关系依据TF
‑
IDF算法操作筛选出高频师徒关系，并依照规则生成出对应的问题。2.根据权利要求1所述的计算机课程填空题自动生成方法，其特征在于，步骤2具体包括以下步骤：步骤2.1、将所述训练集中的文本分割成单个句子；步骤2.2、对全部所述句子的噪声数据进行剔除操作，得到预备基准句；步骤2.3、将每个所述预备基准句的所有词embedding操作，然后使用word2vec自然语言处理模型生成词向量，得到训练集的词向量；同时取这些词向量的平均值，并以句子的合并向量作为句子的特征向量；步骤2.4、创建一个N阶方阵，N为所有预备基准句的个数，将其所有元素置零，并用句子的余弦相似度填充；步骤2.5、将N阶方阵视为余弦相似度矩阵M，先假设一个初始的TextRank分布矩阵R，通过迭代，不断...

【专利技术属性】
技术研发人员：朱磊，杨子梁，黑新宏，张梓恒，晁冰，王一川，姜琨，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人