【技术实现步骤摘要】
领域自适应的槽位填充方法、装置、设备及存储介质
[0001]本申请涉及自然语言处理领域,特别涉及一种领域自适应槽位填充方法、装置、设备及存储介质。
技术介绍
[0002]口语语言理解(Spoken Language Understanding,SLU)是自然语言处理(Natural Language Processing,NLP)领域中任务型对话系统的一项重要功能。
[0003]槽位填充是面向任务的对话系统,在进行口语语言理解过程时的重要任务。随着任务型对话系统日益增加的应用场景,任务型对话系统涉及的领域也越来越广泛。槽位填充通常根据相似含义的槽位具有相似描述的特点,对用户输入的每个词分配一个标签,即采用序列标注方法。在处理一个新的槽位类型时,通过序列标注方法对已知领域槽位进行训练来识别相似的未知领域槽位。
[0004]然而这种方法简单的使用序列标注信息匹配槽位实体,要求已知领域槽位与未知领域槽位之间具有相似性。在面对新领域的槽位填充任务时,极大限制了槽位填充系统的性能。
技术实现思路
[0005]本申请提供了一种领域自适应槽位填充方法、装置、设备及存储介质,将槽位填充问题转化为机器阅读理解(Machine Reading Comprehension,MRC)问题,利用通用的机器阅读理解模型对不同领域的语料都具有较好理解能力的特性,可以实现跨领域的槽位填充能力。所述技术方案如下:
[0006]根据本申请的一方面,提供了一种领域自适应的槽位填充方法,所述方法包括:
[00 ...
【技术保护点】
【技术特征摘要】
1.一种领域自适应的槽位填充方法,其特征在于,所述方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼接为用户输入句对;调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息,所述答案位置信息用于指示所述问句的答案在所述用户输入语句中的位置;根据所述答案位置信息,将所述问句的答案作为槽位实体,填充在所述目标槽位中。2.根据权利要求1所述的方法,其特征在于,所述机器阅读理解模型包括编码网络和预测网络,所述编码网络是基于预训练模型的编码网络,所述预训练模型是基于通用领域的机器阅读理解语料库进行预训练得到的语言表征模型;所述调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息,包括:生成所述用户输入句对中每个字符的嵌入向量;调用所述编码网络对所述用户输入句对的嵌入向量进行编码,得到所述用户输入句对中每个字符的隐层向量表示;调用所述预测网络基于所述用户输入句对中每个字符的隐层向量表示进行所述答案位置信息的预测,得到所述问句的答案开始位置和答案结束位置。3.根据权利要求2所述的方法,其特征在于,所述生成所述用户输入句对中每个字符的嵌入向量,包括:分别生成与所述用户输入句对中每个字符对应的词嵌入向量、分段嵌入向量和位置嵌入向量,其中,所述词嵌入向量中包括所述用户输入句对中每个字符的词向量,所述分段嵌入向量中包括所述用户输入句对中每个字符所属的分段信息,所述位置嵌入向量中包括所述用户输入句对中每个字符的位置信息;对每个字符的所述词嵌入向量、所述分段嵌入向量和所述位置嵌入向量进行叠加,生成所述用户输入句对中每个字符对应的嵌入向量。4.根据权利要求2所述的方法,其特征在于,所述调用所述预测网络基于所述用户输入句对中每个字符的隐层向量表示进行所述答案位置信息的预测,得到所述问句的答案开始位置和答案结束位置,包括:调用所述预测网络基于所述用户输入句对中每个字符的隐层向量表示进行所述答案开始位置的预测,得到所述每个字符作为所述答案开始位置的第一概率;调用所述预测网络基于所述用户输入句对中每个字符的隐层向量表示进行所述答案结束位置的预测,得到所述每个字符作为所述答案结束位置的第二概率;以第一候选字符的第一概率和第二候选字符的第二概率确定候选答案区间概率,所述第一候选字符的字符位置不晚于所述第二候选字符的字符位置;将概率在前k高的所述候选答案区间中的第一候选字符确定为所述问句的候选答案开始位置,将概率在前k高的所述候选答案区间中的第二候选字符确定为所述问句的候选答案结束位置;将所述候选答案开始位置与所述候选答案结束位置一一进行拼接,并将所述第一概率和所述第二概率相加得到候选答案区间概率,从所述候选答案区间概率中选取概率最高的
前t个不重叠的区间作为答案区间;所述参数t和所述参数k的取值为大于...
【专利技术属性】
技术研发人员:徐金安,于梦诗,陈钰枫,刘健,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。