【技术实现步骤摘要】
基于迁移学习的跨领域语义解析方法
[0001]本申请涉及语义解析
,特别涉及基于迁移学习的跨领域语义解析方法
。
技术介绍
[0002]依存分析是各种自然语言处理系统中的重要组成部分,如语义角色标注
、
关系抽取
、
机器翻译等
。
依存分析有两种主要方法:基于图的方法和基于转移的方法
。
[0003]相关技术中,在进行依存分析的过程当中,通常会基于领域对于依存分析的样本进行划分,并对应建立不同的模型,以实现不同领域的语义依存分析
。
[0004]然而,针对不同领域建立模型并重新训练的方式,会使得模型的建立过程成本较高且时间冗长,降低了跨领域语义解析的效率
。
技术实现思路
[0005]本专利技术的目的在于克服现有技术的不足与缺陷,提供了一种基于迁移学习的跨领域语义解析方法,提高了跨领域语义解析的效率和准确率,该技术方案应用于计算机设备中,该方法包括:获取与对应的源域样本集合,源域样本集合中包括至少两个语段样本,每个语段样本中包括至少两个语素,语段样本标注有样本语素识别结果以及样本语素关联关系结果;样本语素识别结果用于指示语段样本中包括的语素以及语素内容,样本语素关联关系结果用于指示语素的性质以及关联关系,源域样本集合为基于通用语言数据库提取获得的样本集合;获取初始语义解析模型,初始语义解析模型配置有初始参数,初始语义解析模型为基于机器学习的神经网络模型;通过源域样本集合对初始语义解析模型进行训练,得 ...
【技术保护点】
【技术特征摘要】
1.
一种基于迁移学习的跨领域语义解析方法,其特征在于,所述方法应用于计算机设备中,所述方法包括:获取与对应的源域样本集合,所述源域样本集合中包括至少两个语段样本,每个语段样本中包括至少两个语素,所述语段样本标注有样本语素识别结果以及样本语素关联关系结果,所述样本语素识别结果用于指示所述语段样本中包括的语素以及语素内容,所述样本语素关联关系结果用于指示所述语素的性质以及关联关系,所述源域样本集合为基于通用语言数据库提取获得的语段样本的集合;获取初始语义解析模型,所述初始语义解析模型配置有初始参数,所述初始语义解析模型为基于机器学习的神经网络模型,所述初始语义解析模型包括文本表示层
、
自注意力层以及堆栈指针网络层,其中,所述文本表示层为文本特征的提取层,所述自注意力层为参数的生成层,所述堆栈指针网络层为结果输出层;通过所述源域样本集合对所述初始语义解析模型进行训练,得到源域语义解析模型;确定目标域以及与所述目标域对应的目标域样本集合,所述目标域样本集合中包括至少两个所述语段样本,所述目标域样本集合中的语段样本指示的内容与所述目标域相关联,所述语段样本标注有所述语素识别结果以及所述语素关联关系结果;通过所述目标域样本集合对所述源域语义解析模型进行训练,得到语义解析模型;将待测语段输入所述语义解析模型,输出得到语义解析结果,所述语义解析结果包括语素结果以及语素关联关系结果,所述待测语段的语段内容属于至少一个所述目标域;其中,所述通过所述源域样本集合对所述初始语义解析模型进行训练,得到源域语义解析模型,包括:将所述源域样本集合输入所述初始语义解析模型;通过所述文本表示层对所述源域样本集合中的语段样本进行文本表示分析,输出得到与所述语段样本对应的文本特征向量;将所述文本特征向量输入所述堆栈指针网络层,输出得到与所述源域样本集合对应的预测语义解析结果,所述预测语义解析结果包括预测语素识别结果以及预测语素关联关系结果;确定所述预测语素识别结果与所述样本语素识别结果的差异,并确定所述预测语素关联关系结果与所述样本语素关联关系结果的差异;基于所述预测语素识别结果与所述样本语素识别结果的差异以及所述预测语素关联关系结果与所述样本语素关联关系结果的差异对所述初始语义...
【专利技术属性】
技术研发人员:夏振涛,李艳,谈辉,
申请(专利权)人:永中软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。