System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能的语言阅读理解系统技术方案_技高网

一种基于人工智能的语言阅读理解系统技术方案

技术编号:44336491 阅读:1 留言:0更新日期:2025-02-18 20:46
本发明专利技术属于自然语言处理技术领域,本发明专利技术公开了一种基于人工智能的语言阅读理解系统,包括数据采集模块,用于采集语言阅读文本数据和阅读理解题数据;数据处理模块,用于对采集的语言阅读文本数据和阅读理解题数据进行预处理得到文本特征数据和理解题特征数据;基于文本特征数据解答阅读理解题,得到阅读理解题分数;分析理解题特征数据对解答阅读理解题产生的影响,得到影响特征数据;将理解题特征数据、影响特征数据和文本特征数据进行融合得到综合特征数据集;模型训练模块,用于构建理解题答案误差预测模型,将综合特征数据集输入理解题答案误差预测模型中,预测得到解题答案误差;有助于学习者快速识别自己的不足,从而调整学习策略。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,更具体地说,本专利技术涉及一种基于人工智能的语言阅读理解系统


技术介绍

1、随着人工智能技术的发展,特别是自然语言处理的进步,智能教育系统在个性化教学和自动化评估中发挥了越来越重要的作用;然而,现有的语言阅读理解系统在准确性和灵活性方面仍存在不足,难以有效适应不同年龄段和阅读水平的学生需求。

2、专利公开号为cn111326040a的专利公开了一种语言阅读理解智能测试和智能辅导系统和方法。其中,该系统是互联网、人工智能等新兴技术在语言阅读理解教学和评价领域的运用,包括基于语言阅读理解能力模型的智能选题子系统,基于人工智能的语言阅读理解自动评价子系统,针对语言阅读理解的个性化、层次化辅导子系统,基于数据挖掘的语言阅读理解教学辅助子系统。该系统能够根据学习者的阅读能力进行智能选题,并能够对语言阅读理解题,包括主观题进行自动评分和评价;而在准确掌握每个学习者阅读理解具体学情的基础上,进一步实施针对性、个别化智能辅导,从而实现语言阅读理解的因材施教。此外,系统也可以通过生成的数据为线下教学提供辅助。

3、现有的语言阅读理解系统仅依靠单一特征来评估答案,可能会忽略其他重要信息,导致评估结果不够全面和准确;忽略多语言特征的综合考虑可能使得评估系统无法准确捕捉答案中的深层含义和逻辑关系;仅依据单一特征对候选答案进行排序,会导致排序结果不够合理,甚至误导用户或系统选择错误的答案;未考虑每个学生都有自己独特的学习习惯和强项弱项,无法为学生提供针对性的学习建议和策略,导致学生可能在学习上走弯路,浪费时间和精力;未利用解题顺序影响模型来指导学生调整解题顺序,学生可能会按照不合理的顺序解题,导致在较难的题目上花费过多时间,而在较容易的题目上却匆匆作答,从而影响整体学习效率;

4、现有技术中,未考虑收集和理解偏差、主旨错误、细节理解错误、推理错误等多种类型的错误回答文本数据,没有细粒度的错误分析,教师可能只能笼统地了解学生存在错误,但无法精确到具体的错误类型和原因;会导致诊断的准确性不足,难以制定有效的改进措施;没有针对性地改进措施,学生可能无法有效地解决自身存在的问题,导致在已经掌握的内容上浪费时间和精力,同时在未掌握的内容上也无法取得实质性进展。

5、鉴于此,本专利技术提出一种基于人工智能的语言阅读理解系统以解决上述问题。


技术实现思路

1、为了克服现有技术的上述缺陷,为实现上述目的,本专利技术提供如下技术方案:一种基于人工智能的语言阅读理解系统,包括:

2、数据采集模块,用于采集语言阅读文本数据和阅读理解题数据;

3、数据处理模块,用于对采集的语言阅读文本数据和阅读理解题数据进行预处理得到文本特征数据和理解题特征数据;基于文本特征数据解答阅读理解题,得到阅读理解题分数;

4、分析理解题特征数据对解答阅读理解题产生的影响,得到影响特征数据;将理解题特征数据、影响特征数据和文本特征数据进行融合得到综合特征数据集;

5、模型训练模块,用于构建理解题答案误差预测模型,将综合特征数据集输入理解题答案误差预测模型中,预测得到解题答案误差;

6、误差评估模块,用于将预测的解题答案误差与预设的解题答案误差阈值进行对比,判断学生的阅读理解题分数是否合格;

7、学习反馈模块,若学生的阅读理解题分数合格,给出进一步的学习建议;若学生的阅读理解题分数不合格,将提供针对性反馈,指出学生不足之处并提供改进措施;各个模块之间通过有线和/或无线的方式进行连接。

8、进一步地,所述语言阅读文本数据包括词法数据、句法数据、语义数据和文本结构数据;阅读理解题数据包括选择题、判断题、填空题和简答题。

9、进一步地,所述对采集的语言阅读文本数据和阅读理解题数据进行预处理得到文本特征数据和理解题特征数据的方法包括:

10、通过密度聚类算法检测和剔除语言阅读文本数据和阅读理解题数据中的异常数据,得到处理后的文本特征数据和理解题特征数据,将文本特征数据和理解题特征数据进行归一化处理,转换为标准正态分布,得到归一化后的文本特征数据和理解题特征数据。

11、进一步地,所述基于文本特征数据解答阅读理解题,得到阅读理解题分数的方法包括:

12、对文本特征数据进行特征提取,利用自然语言处理库nltk中的词性标注工具提取词性标注和词形还原信息,通过词干提取工具porter stemmer提取词干信息,通过哈希表创建一个从词性标签到整数索引的映射,对于文本中的每个单词,根据其词性标签、词形还原结果和词干提取结果,在特征向量中相应的位置上进行标记,通过哈希函数对词性标签、词形还原结果和词干提取结果进行量化,构建词法特征向量;

13、将句子分割成单词或词素;为每个单词分配词性标签,词性标签包括名词、动词、形容词、副词、介词、连词和代词;使用nltk自然语言处理库中的依存句法分析器,将预处理后的句子输入到分析器中,得到句子的依存句法树;

14、利用依存句法分析来提取句子的句法结构,并形成句法特征向量:

15、s41、遍历依存句法树,从句子的核心动词开始,遍历整棵树;

16、s42、识别主谓宾关系,找到指向动词并标记为主语关系的节点,找到由动词指向并标记为宾语的节点;

17、s43、识别修饰关系:识别表示定语与中心词之间的关系和表示状语与中心词之间的关系;

18、s44、构建句法特征向量,定义特征空间:根据任务需求,定义一组句法特征包括主语类型、谓语类型、宾语类型和主要修饰关系类型;

19、s45、对于每个关系类型使用one-hot编码来表示;对于涉及特定单词或词性的关系类型,将该关系类型纳入句法特征向量中;

20、s46、将提取的所有关系类型的特征组合成一个完整的句法特征向量;

21、通过预训练的bert模型获取词嵌入,并利用语义角色标注srl提取谓词-论元结构,结合所有关系类型,构建语义特征向量;根据文本的具体内容和结构,确定需要提取的特征维度,对于每个特征维度,提取相应的特征值,将提取的特征值按照一定的顺序排列,构建成文本结构特征向量;

22、候选答案和预设标准答案分别由文本特征数据和理解题特征数据组成;计算候选答案和预设标准答案的相似度,根据相似度得分进行排序,通过候选答案的排序和相似度得分,计算得到阅读理解题分数。

23、进一步地,所述计算候选答案和预设标准答案的相似度,根据相似度得分进行排序,通过候选答案的排序和相似度得分,计算得到阅读理解题分数的方法包括:

24、定义一个综合相似度函数来度量候选答案与预设标准答案的相似度;所述综合相似度函数为:

25、

26、其中,osim(a,a*)为候选答案与预设标准答案的相似度;为词法特征向量与预设标准词法特征向量的相似度;为句法特征向量与预设标准句法特征向量的相似度;为语义特征向量与预设本文档来自技高网...

【技术保护点】

1.一种基于人工智能的语言阅读理解系统,其特征在于,包括:

2.根据权利要求1所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述语言阅读文本数据包括词法数据、句法数据、语义数据和文本结构数据;阅读理解题数据包括选择题、判断题、填空题和简答题。

3.根据权利要求2所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述对采集的语言阅读文本数据和阅读理解题数据进行预处理得到文本特征数据和理解题特征数据的方法包括:

4.根据权利要求3所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述基于文本特征数据解答阅读理解题,得到阅读理解题分数的方法包括:

5.根据权利要求4所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述计算候选答案和预设标准答案的相似度,根据相似度得分进行排序,通过候选答案的排序和相似度得分,计算得到阅读理解题分数的方法包括:

6.根据权利要求5所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述分析理解题特征数据对解答阅读理解题产生的影响,并融合文本特征数据得到综合特征数据集的方法包括:

7.根据权利要求6所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述理解题答案误差预测模型的训练方法包括:

8.根据权利要求7所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述对模型的超参数进行调优的方法包括:

9.根据权利要求8所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述将预测的解题答案误差与预设的解题答案误差阈值进行对比,判断学生的阅读理解题分数是否合格的方法包括:

10.根据权利要求9所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述若学生的阅读理解题分数不合格,将提供针对性反馈,指出学生不足之处并提供改进措施的方法包括:

...

【技术特征摘要】

1.一种基于人工智能的语言阅读理解系统,其特征在于,包括:

2.根据权利要求1所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述语言阅读文本数据包括词法数据、句法数据、语义数据和文本结构数据;阅读理解题数据包括选择题、判断题、填空题和简答题。

3.根据权利要求2所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述对采集的语言阅读文本数据和阅读理解题数据进行预处理得到文本特征数据和理解题特征数据的方法包括:

4.根据权利要求3所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述基于文本特征数据解答阅读理解题,得到阅读理解题分数的方法包括:

5.根据权利要求4所述的一种基于人工智能的语言阅读理解系统,其特征在于,所述计算候选答案和预设标准答案的相似度,根据相似度得分进行排序,通过候选答案的排序和相似度得分,计算得到阅读理解题分数的方法包...

【专利技术属性】
技术研发人员:李培生杨海庆刘向玉于磊
申请(专利权)人:山东科技职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1