基于迁移学习的跨领域语义解析方法技术

技术编号:39829798 阅读:20 留言:0更新日期:2023-12-29 16:07
本发明专利技术涉及语义解析技术领域,尤其涉及一种基于迁移学习的跨领域语义解析方法

【技术实现步骤摘要】
基于迁移学习的跨领域语义解析方法


[0001]本申请涉及语义解析
,特别涉及基于迁移学习的跨领域语义解析方法


技术介绍

[0002]依存分析是各种自然语言处理系统中的重要组成部分,如语义角色标注

关系抽取

机器翻译等

依存分析有两种主要方法:基于图的方法和基于转移的方法

[0003]相关技术中,在进行依存分析的过程当中,通常会基于领域对于依存分析的样本进行划分,并对应建立不同的模型,以实现不同领域的语义依存分析

[0004]然而,针对不同领域建立模型并重新训练的方式,会使得模型的建立过程成本较高且时间冗长,降低了跨领域语义解析的效率


技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足与缺陷,提供了一种基于迁移学习的跨领域语义解析方法,提高了跨领域语义解析的效率和准确率,该技术方案应用于计算机设备中,该方法包括:获取与对应的源域样本集合,源域样本集合中包括至少两个语段样本,每个语段样本中包括至少两个语素,语段样本标注有样本语素识别结果以及样本语素关联关系结果;样本语素识别结果用于指示语段样本中包括的语素以及语素内容,样本语素关联关系结果用于指示语素的性质以及关联关系,源域样本集合为基于通用语言数据库提取获得的样本集合;获取初始语义解析模型,初始语义解析模型配置有初始参数,初始语义解析模型为基于机器学习的神经网络模型;通过源域样本集合对初始语义解析模型进行训练,得到源域语义解析模型;确定目标域以及与目标域对应的目标域样本集合,目标域样本集合中包括至少两个语段样本,目标域样本集合中的语段样本指示的内容与目标域相关联,语段样本标注有语素识别结果以及语素关联关系结果;通过目标域样本集合对源域语义解析模型进行训练,得到语义解析模型;将待测语段输入语义解析模型,输出得到语义解析结果,语义解析结果包括语素结果以及语素关联关系结果,待测语段的语段内容属于至少一个目标域

[0006]在一个可选的实施例中,初始语义解析模型包括文本表示层

自注意力层以及堆栈指针网络层

[0007]在一个可选的实施例中,通过源域样本集合对初始语义解析模型进行训练,得到源域语义解析模型,包括:将源域语段样本集合输入初始语义解析模型;通过文本表示层对源域样本集合中的语段样本进行文本表示分析,输出得到与语段样本对应的文本特征向量;
将文本特征向量输入堆栈指针网络层,输出得到与源域样本集合对应的预测语义解析结果,预测语义解析结果包括预测语素识别结果以及预测语素关联关系结果;确定预测语素识别结果与样本语素识别结果的差异,并确定预测语素关联关系结果与样本语素关联关系结果的差异;基于预测语素识别结果与样本语素识别结果的差异以及预测语素关联关系结果与样本语素关联关系结果的差异对初始语义解析模型的参数进行训练,得到源域语义解析模型,并通过自注意力层生成与源域语义解析模型对应的自注意力参数

[0008]在一个可选的实施例中,文本特征向量的形式包括词性嵌入向量以及单词嵌入向量;单词嵌入向量用于表征源域样本集合中的语段样本的单词语素;词性嵌入向量用于与单词嵌入向量串联

[0009]在一个可选的实施例中,自注意力参数实现字符序列形式

[0010]在一个可选的实施例中,通过目标域样本集合对源域语义解析模型进行训练,得到语义解析模型,包括:保留自注意力参数;通过目标域样本集合对源域语义解析模型进行训练,得到与目标域对应的目标域参数集合;基于目标域参数集合对源域语义解析模型进行调整,得到语义解析模型

[0011]在一个可选的实施例中,目标域样本集合中包括至少两个目标域语段样本;通过目标域样本集合对源域语义解析模型进行训练,得到与目标域对应的目标域参数集合,包括:将目标域语段样本输入源域语义解析模型中,输出得到目标域预测语素识别结果;结合目标域预测语素识别结果与目标域语段样本对应的样本目标域预测语素识别结果,确定目标域预测语素识别结果与样本目标域预测语素识别结果的差异;基于目标域预测语素识别结果与样本目标域预测语素识别结果的差异,确定与目标域对应的目标域参数集合,目标域参数集合实现为参数形式

[0012]在一个可选的实施例中,目标域样本集合中的样本数量与源域样本集合中的样本数量比值为1:
10。
[0013]在一个可选的实施例中,目标域的数量为至少两个

[0014]在一个可选的实施例中,该方法还包括:基于语义解析结果生成可视化语义解析界面,在可视化语义解析界面中,包括待测语段的语段内容

与语素结果对应的语素分析列表,以及与语素关联关系结果对应的语素关联关系分析列表

[0015]本申请至少包括如下有益效果:在进行跨领域语义解析的过程当中,首先针对源域,对初始语义解析模型进行训练,以得到适配源域的解析模型,在确定目标域后,通过的结合目标域的样本对于源域解析模型进行再次训练,以得到适配目标域解析的语义解析模型,并通过语义解析模型对于待测语段进行语义解析,最终得到准确的语义解析结果

在进行语义解析的过程当中,针对源
域和目标域之间的语义区别,在通过源域对应的样本训练模型后,通过目标域样本对于模型进行微调,在花费较少样本成本的情况下,使得语义解析模型能够对于源域及目标域内的样本进行语义分析以及识别,提高了跨领域语义解析的效率和准确率

附图说明
[0016]附图是用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术,但并不构成对本专利技术的限制

[0017]图1示出了本申请一个示例性实施例提供的一种基于迁移学习的跨领域语义解析方法的流程示意图

[0018]图2示出了本申请一个示例性实施例提供的另一种基于迁移学习的跨领域语义解析方法的流程示意图

具体实施方式
[0019]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互结合

下面将参考附图并结合实施例来详细说明本专利技术

[0020]为了使本领域技术人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围

[0021]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序

应该理解这样使用的数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于迁移学习的跨领域语义解析方法,其特征在于,所述方法应用于计算机设备中,所述方法包括:获取与对应的源域样本集合,所述源域样本集合中包括至少两个语段样本,每个语段样本中包括至少两个语素,所述语段样本标注有样本语素识别结果以及样本语素关联关系结果,所述样本语素识别结果用于指示所述语段样本中包括的语素以及语素内容,所述样本语素关联关系结果用于指示所述语素的性质以及关联关系,所述源域样本集合为基于通用语言数据库提取获得的语段样本的集合;获取初始语义解析模型,所述初始语义解析模型配置有初始参数,所述初始语义解析模型为基于机器学习的神经网络模型,所述初始语义解析模型包括文本表示层

自注意力层以及堆栈指针网络层,其中,所述文本表示层为文本特征的提取层,所述自注意力层为参数的生成层,所述堆栈指针网络层为结果输出层;通过所述源域样本集合对所述初始语义解析模型进行训练,得到源域语义解析模型;确定目标域以及与所述目标域对应的目标域样本集合,所述目标域样本集合中包括至少两个所述语段样本,所述目标域样本集合中的语段样本指示的内容与所述目标域相关联,所述语段样本标注有所述语素识别结果以及所述语素关联关系结果;通过所述目标域样本集合对所述源域语义解析模型进行训练,得到语义解析模型;将待测语段输入所述语义解析模型,输出得到语义解析结果,所述语义解析结果包括语素结果以及语素关联关系结果,所述待测语段的语段内容属于至少一个所述目标域;其中,所述通过所述源域样本集合对所述初始语义解析模型进行训练,得到源域语义解析模型,包括:将所述源域样本集合输入所述初始语义解析模型;通过所述文本表示层对所述源域样本集合中的语段样本进行文本表示分析,输出得到与所述语段样本对应的文本特征向量;将所述文本特征向量输入所述堆栈指针网络层,输出得到与所述源域样本集合对应的预测语义解析结果,所述预测语义解析结果包括预测语素识别结果以及预测语素关联关系结果;确定所述预测语素识别结果与所述样本语素识别结果的差异,并确定所述预测语素关联关系结果与所述样本语素关联关系结果的差异;基于所述预测语素识别结果与所述样本语素识别结果的差异以及所述预测语素关联关系结果与所述样本语素关联关系结果的差异对所述初始语义...

【专利技术属性】
技术研发人员:夏振涛李艳谈辉
申请(专利权)人:永中软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1