一种英语教材分析方法技术

技术编号:38854867 阅读:14 留言:0更新日期:2023-09-17 10:00
本发明专利技术涉及英语教材分析技术领域,公开了一种英语教材分析方法,包括以下步骤:步骤11,提取英语教材使用知识图谱;步骤12,对英语教材中的实体进行矢量化,生成第一实体矢量;步骤13,将英语教材使用知识图谱中的实体映射为节点,以节点为中心随机游走为实体生成实体顶点集;步骤14,为所有实体对应的节点生成第二实体矢量;步骤16,通过训练的图神经网络以及分类器对所有以学生传播的融合文化知识表示的实体的类型进行判别;本发明专利技术借助网络数据获取的手段来发现融合文化知识的信息,并构建学生、英语教材、融合文化知识的知识图谱,结合其与英语教材和学生的关系来评价英语教材的跨文化能力培养。文化能力培养。文化能力培养。

【技术实现步骤摘要】
一种英语教材分析方法


[0001]本专利技术涉及英语教材分析
,更具体地说,它涉及一种英语教材分析方法。

技术介绍

[0002]尽管大学英语教材历年来培养学生的综合语言能力方面有着很大建树,但其中的文化呈现却仍出现失衡的现象,主要表现为文化呈现内容和文化呈现方式两个方面的失衡,这也就意味着为了响应国家推进本国国际传播力的建设,大学教材中的文化呈现方式仍需改进。为助力高校通识教育、进一步精进大学英语教材的编写,培养拥有国际传播力人才以及强化其跨文化交流能力,满足“中国情怀”与“国际视野”并重的人才素质培养要求,现阶段对大学英语教材中的文化呈现进行分析显得尤为重要,但是对于英语教材的跨文化能力培养的分析本质上还是要分析其对于学生的影响,但是这部分数据需要采访学生来获取,来源较为困难。

技术实现思路

[0003]本专利技术提供一种英语教材分析方法,解决相关技术中对于英语教材的跨文化能力培养的分析的数据来源困难导致无法准确分析的技术问题。
[0004]本专利技术提供了一种英语教材分析方法,包括以下步骤:
[0005]步骤11,提取英语教材使用知识图谱;
[0006]步骤12,对英语教材中的实体进行矢量化,生成第一实体矢量;
[0007]步骤13,将英语教材使用知识图谱中的实体映射为节点,以节点为中心随机游走为实体生成实体顶点集;
[0008]步骤14,为所有实体对应的节点生成第二实体矢量,对于其中一个节点v,首先计算节点v在实体顶点集的1层的多个中间矢量,将这些中间矢量标记为中心矢量;计算节点v在第2

N层的中间矢量,并标记为非中心矢量,N为图结构的最大层数;
[0009]步骤15,以中心矢量为中心对非中心矢量进行聚类生成多个聚类簇,为每个聚类簇生成一个簇中心,基于所有的簇中心计算节点v第二实体矢量;
[0010]节点v的第二实体矢量V
z
的计算公式如下:
[0011][0012]其中,C
y
表示第y个簇中心,Y表示簇中心的数量,W表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示节点v对应的第一实体矢量。
[0013]节点v在第h层的第i个中间矢量的计算公式如下:
[0014][0015][0016][0017]其中,W表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示中的第i个随机子集,表示节点v在图结构的第h层与其连接的节点的集合,表示节点e的第一实体矢量,表示节点v的第一实体矢量,ρ表示伸缩系数,缺省值为0.2或第一实体矢量的分量数的倒数;
[0018]节点v在第h层的第i个中间矢量和节点v的第二实体矢量分别由图神经网络的第一隐藏层和第二隐藏层进行计算,图神经网络训练时输出连接分类器,分类器输入节点的第二实体矢量,以学生传播的融合文化知识表示的实体的节点的第二实体矢量输入分类器,对应的实体类型包括源于英语教材的指导和不源于英语教材的指导;
[0019]步骤16,通过训练的图神经网络以及分类器对所有以学生传播的融合文化知识表示的实体的类型进行判别。
[0020]进一步地,英语教材使用知识图谱中的实体包括:英语教材、学生、融合文化知识。
[0021]进一步地,文本类型的实体,通过词向量生成的方法来进行向量化表示。
[0022]进一步地,图片类型的实体,通过卷积神经网络进行向量化表示。
[0023]进一步地,以节点为中心随机游走为实体生成实体顶点集的方法包括:
[0024]步骤21,以当前待建立实体顶点集的节点为中心开始进行随机游走,直至游走的步数达到步数阈值;
[0025]步骤22,将游走的节点加入实体顶点集内,如果游走的次数小于设定的次数阈值,则对游走的次数累加一次之后返回步骤21,否则结束步骤。
[0026]进一步地,实体顶点集内存在连接的两个顶点对应同一次游走中的两次相邻的步数。
[0027]进一步地,实体顶点集划分为多层,分别为第0

N层,其中N为次数阈值,第0层的节点为实体顶点集的中心节点。
[0028]进一步地,训练时以已知对应的实体类型的节点作为样本来构建损失函数。
[0029]进一步地,统计英语教材所关联的类型为源于英语教材的指导的融合文化知识的数量来评价英语教材培养跨文化能力的影响,数量越大影响越大。
[0030]本专利技术的有益效果在于:
[0031]本专利技术借助网络数据获取的手段来发现融合文化知识的信息,并构建学生、英语教材、融合文化知识的知识图谱,并基于知识图谱的分析结合采访学生来获取的少量数据来训练图神经网络,通过训练的图神经网络来对融合文化知识进行分类,结合其与英语教材和学生的关系来评价英语教材的跨文化能力培养。
附图说明
[0032]图1是本专利技术的一种英语教材分析方法的流程图;
[0033]图2是本专利技术的生成实体顶点集的流程图。
具体实施方式
[0034]现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其他例子中也可以进行组合。
[0035]如图1

图2所示,一种英语教材分析方法,包括以下步骤:
[0036]步骤11,提取英语教材使用知识图谱;
[0037]英语教材使用知识图谱中的实体包括:英语教材、学生、融合文化知识等,为了分析目的语文化与母语文化的融合研究,构建的知识图谱中包含了融合文化知识的实体,该实体的含义是以目的语为表现的母语文化,例如以英语为表现的唐朝简介知识。
[0038]知识图谱可以来源于学生的社交网络,通过学生传播的内容来进行实体识别与知识图谱的构建。
[0039]在知晓知识图谱实体内容的情况下,本领域技术人员可以通过现有的知识图谱的构建方法来对英语教材使用知识图谱进行构建。
[0040]步骤12,对英语教材中的实体进行矢量化,生成第一实体矢量;
[0041]对于文本类型的实体,可以通过词向量生成的方法来进行向量化表示。
[0042]对于图片类型的实体,可以通过卷积神经网络进行向量化表示。
[0043]初始向量化之后通过线性层映射到同一维度。
[0044]步骤13,将英语教材使用知识图谱中的实体映射为节点,以节点为中心随机游走为实体生成实体顶点集;
[0045]以节点为中心随机游走为实体生成实体顶点集的方法包括:
[0046]步骤21,以当前待建立实体顶点集的节点为中心开始进行随机游走,直至游走的步数达到步数阈值;
[0047]步骤22,将游走的节点加入实体顶点集内,如果游走的次数小于设定的次数阈值,则对游本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种英语教材分析方法,其特征在于,包括以下步骤:步骤11,提取英语教材使用知识图谱;步骤12,对英语教材中的实体进行矢量化,生成第一实体矢量;步骤13,将英语教材使用知识图谱中的实体映射为节点,以节点为中心随机游走为实体生成实体顶点集;步骤14,为所有实体对应的节点生成第二实体矢量,对于其中一个节点v,首先计算节点v在实体顶点集的1层的多个中间矢量,将这些中间矢量标记为中心矢量;计算节点v在第2

N层的中间矢量,并标记为非中心矢量,N为图结构的最大层数;步骤15,以中心矢量为中心对非中心矢量进行聚类生成多个聚类簇,为每个聚类簇生成一个簇中心,基于所有的簇中心计算节点v第二实体矢量;节点v的第二实体矢量V
z
的计算公式如下:其中,C
y
表示第y个簇中心,Y表示簇中心的数量,W表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示节点v对应的第一实体矢量。节点v在第h层的第i个中间矢量的计算公式如下:的计算公式如下:的计算公式如下:其中,W表示变换权值,b表示变换偏置,σ表示sigmod激活函数,表示中的第i个随机子集,表示节点v在图结构的第h层与其连接的节点的集合,表示节点e的第一实体矢量,表示节点v的第一实体矢量,ρ表示伸缩系数,缺省值为0.2或第一实体矢量的分量数的倒数;节点v在第h层的第i个中间矢量和节点v的第二实体矢量分别由图神经网络的第一隐藏层和第二隐藏层进行计算,图神经网络训练时输出连接分类器,分类器输入节点的第二实体矢量,以学生传播的融合文化知识表示的实体的节点的第二实体矢量输入分类器,对应的实体类型包...

【专利技术属性】
技术研发人员:刘婧萱陈燕琴李巧
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1