【技术实现步骤摘要】
一种基于图卷积网络的多人对话语篇分析方法
[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于图卷积网络的多人对话语篇分析方法。
技术介绍
[0002]语篇分析的任务是研究自然语言文本之间的内在结构以及分析文本单元之间存在的语义关系,其中,文本单元可以是句子、从句或整个段落。语篇分析的结果有利于下游任务的进行,包括问答系统、对话系统、文本摘要等等。
[0003]现有的语篇分析的工作都是基于修辞结构理论(Rhetorical Structure Theory,RST)的模型,基于RST的模型最终会将文本中的语篇关系构造成二叉树的结构。而多人对话中的语篇关系更加复杂,其中的语篇关系构造成图结构,因此基于RST的模型不适用于多人对话的语篇分析。
[0004]现有的多人对话语篇分析的工作只考虑了单个句子之间的关系,不能完整地捕捉整个对话中句子间存在的语义关系,然而语篇分析是需要对全局的对话信息进行分析的。
[0005]因此,需要寻找一种提高多人对话语篇分析性能的方法。
技术实现思路
[0006]本专利技术的目的在于克服现有技术的不足,提供一种基于图卷积网络的多人对话语篇分析方法,该方法利用图卷积网络捕捉多人对话的句子间存在的语义关系,从而提高语篇分析的性能。
[0007]本专利技术的目的能够通过以下技术方案实现:一种基于图卷积网络的多人对话语篇分析方法,包括以下步骤:
[0008]S1、通过句子编码模块将对话中的每个句子映射为局部句子向量H
i />;
[0009]S2、通过图卷积网络捕捉句子之间的语义关系,输出全局句子向量
[0010]S3、通过拼接局部句子向量H
i
和、目标局部句子向量H
j
和全局句子向量得到特征向量,并输入到语义连接预测模块预测连接的目标句子o
i,j
;其中,目标局部句子向量H
j
为所有与第i个句子有语义连接的句子的局部句子向量;
[0011]S4、通过拼接局部句子向量H
i
和目标局部句子向量H
j
、全局句子向量得到特征向量,并输入到语义分类模块预测获取两个句子的语义关系;
[0012]S5、通过模型联合训练语义连接预测和语义关系分类任务,获取模型参数;
[0013]S6、模型联合训练完毕后,输入整个对话的句子,模型输出句子间存在的语义连接及其对应的语义关系,完成多人对话的语篇分析。
[0014]本专利技术与现有技术相比,具有如下优点和有益效果:利用图卷积网络捕捉多人对话中存在的语义连接关系,通过加入语义连接关系提高整个对话的语篇分析性能。
附图说明
[0015]图1是本专利技术语篇分析方法流程图。
具体实施方式
[0016]下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。
[0017]实施例
[0018]如图1所示,本实施例一种基于图卷积网络的多人对话语篇分析方法,主要包括以下步骤:
[0019]步骤S1、通过句子编码模块将对话中的每个句子映射为局部句子向量。
[0020]本实施例中,将多人对话中的每个句子输入句子编码模块中,获取每句话的句子向量,句子用表示,其中i表示对话中的第i个句子;T表示一句话有T个词。将句子中的文本映射为词嵌入句子向量中,再输入到句子编码器中获取局部句子向量,具体公式如下:
[0021][0022][0023][0024]其中,是将单词映射到对应的词嵌入矩阵,1≤t≤T,预训练的词嵌入向量采用的是GloVe预训练的词向量;是将上一时刻的前向GRU(Gated Recurrent Unit,门控循环单元)输出的隐含层向量和当前单词的词嵌入向量输入到前向GRU中;和分别是前向GRU和后向GRU的输出隐含层向量;H
i
是第i个句子的局部句子向量,通过拼接该句子中最后一个单词的前后向隐含层向量得到;代表向量拼接。
[0025]步骤S2、将步骤S1中获取的局部句子向量输入到图卷积网络GCN中,通过图卷积网络捕捉句子之间存在的语义连接关系,输出全局句子向量计算过程如下:
[0026][0027]其中,N
i
是所有与第i个句子有语义连接的句子;H
j
是所有与第i个句子有语义连接的句子的局部句子向量,即目标局部句子向量;j是目标句子;W和b是模型的参数;ReLU是激活函数;是第i个句子的图卷积网络输出,即全局句子向量。
[0028]步骤S3、通过拼接局部句子向量H
i
、H
j
和全局句子向量得到特征向量,再输入到语义连接预测模块,预测获取与当前句子连接的目标句子j,;对于第i个句子,语义连接预测就是预测其与目标句子j有语义连接,其中j<i,代表目标句子j在当前句子之前。首先,进行句子向量的拼接,即通过拼接当前句子的局部句子向量H
i
和目标局部句子向量H
j
、
全局句子向量获取特征向量H
i,j
:
[0029][0030]获取特征向量H
i,j
后,进行线性变换,并预测连接的目标句子,具体公式如下:
[0031]o
i,j
=fc
Link
(H
i,j
)
[0032][0033][0034]其中,o
i,j
是语义连接预测模块中对特征向量H
i,j
进行线性变换后获取的向量,包含两个句子之间语义连接预测的信息;fc
Link
是全连接层,其作用是对特征向量H
i,j
进行线性变换;p
i
是与当前句子连接的父句子;u
j
是当前对话中的第j个目标句子;P是当前句子与对话中的第j个目标句子连接的概率;k是在当前句子之前的所有句子;H
i,<i
是第i个句子与在第i个句子之前的句子的拼接特征向量;对所有候选目标句子j与当前句子的特征向量H
i,j
进行完线性变换后,通过指数归一化,选择连接概率最大的候选目标句子j进行连接。
[0035]步骤S4、通过拼接当前句子的局部句子向量H
i
和、目标局部句子向量H
j
和全局句子向量得到特征向量,并输入到语义分类模块中,预测获取两个句子之间的语义关系,设预测与第i个句子连接的是目标句子j,两者的语义关系预测公式如下:
[0036]L
i,j
=fc
rela
(H
i,j
)
[0037]P(r
ij
|H
i,j
)=softmax(W
rel
H
i,j
+b
rel
)
[0038]其中,fc...
【技术保护点】
【技术特征摘要】
1.一种基于图卷积网络的多人对话语篇分析方法,其特征在于,包括以下步骤:S1、通过句子编码模块将对话中的每个句子映射为局部句子向量H
i
;S2、通过图卷积网络捕捉句子之间的语义关系,输出全局句子向量S3、通过拼接局部句子向量H
i
和、目标局部句子向量H
j
和全局句子向量得到特征向量,并输入到语义连接预测模块预测连接的目标句子o
i,j
;其中,目标局部句子向量H
j
为所有与第i个句子有语义连接的句子的局部句子向量;S4、通过拼接局部句子向量H
i
和目标局部句子向量H
j
、全局句子向量得到特征向量,并输入到语义分类模块预测获取两个句子的语义关系;S5、通过模型联合训练语义连接预测和语义关系分类任务,获取模型参数;S6、模型联合训练完毕后,输入整个对话的句子,模型输出句子间存在的语义连接及其对应的语义关系,完成多人对话的语篇分析。2.根据权利要求1所述的基于图卷积网络的多人对话语篇分析方法,其特征在于,步骤S1将多人对话中的每个句子输入句子编码模块中,获取每句话的句子向量,句子用表示,其中i是对话中的第i个句子;T是一句话有T个词。3.根据权利要求2所述的基于图卷积网络的多人对话语篇分析方法,其特征在于,将句子中的文本映射为词嵌入句子向量中,再输入到句子编码器中获取局部句子向量,具体公式如下:式如下:式如下:其中,是将单词映射到对应的词嵌入矩阵,1≤t≤T;是将上一时刻的前向GRU输出的隐含层向量和当前单词的词嵌入向量输入到前向GRU中;和分别是前向GRU和后向GRU的输出隐含层向量;H
i
是第i个句子的局部句子向量,通过拼接该句子中最后一个单词的前后向隐含层向量得到;代表向量拼接。4.根据权利要求1所述的基于图卷积网络的多人对话语篇分析方法,其特征在于,步骤S2中全局句子向量计算过程如下:其中,N
i
是所有与第i个句子有语义连接的句子;是所有与第个句子有语义连接的句子的局部句子向量,即目标局部句子向量;j是目标句子;W和b是模型的参数;ReLU是激活函数;是第i个句子的图卷积网络输出,即全局句子向量。5.根据权利要求1所述的基于图卷积网络的多人对话语篇分析方法,其特征在于,步骤S3中语义连接预测为预测其与目标句子j有语义连接,其中j<i,表示目标句子j在当前句子之前。
6.根据权利要求1所述的基于图卷积网络的多人对话语篇分析方法,其特征在于,步骤S3中的拼接方式如下:其中,H
i,j
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。