一种基于自适应专家系统的智能问答方法技术方案

技术编号：35542047 阅读：15 留言：0更新日期：2022-11-09 15:10

本发明专利技术涉及自然语言理解技术领域，公开了一种基于自适应专家系统的智能问答方法，对任意的输入实例，基于模型的梯度来计算一个嵌入表示，并用这个基于梯度的嵌入表示来自适应地对专家进行调制；以这种方式，自适应专家系统将能充分适应于输入的实例，捕捉实例的特性，从而数据集的特性也隐式地进行了表达。从而数据集的特性也隐式地进行了表达。从而数据集的特性也隐式地进行了表达。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应专家系统的智能问答方法

[0001]本专利技术涉及自然语言理解
，具体涉及一种基于自适应专家系统的智能问答方法。

技术介绍

[0002]机器阅读理解使得机器能够阅读一段文本并回答给定问题，是机器迈向更高级智能的重要步骤。过去几年，随着深度学习技术的发展，尤其是预训练语言模型，机器阅读理解已经取得了长足的进步。日渐增加的机器阅读理解数据集也带来了一个问题：是否能结合多个数据集建立一个模型，使得其不仅能够在训练分布上表现得好，而且也能很好地泛化迁移到新的分布上。
[0003]最直接的解决办法就是同时在多个数据集上进行训练，使模型能够建模跨数据集的规律。然而这种多数据集训练的方法可能会在不同的数据集上过拟合或欠拟合，并且迁移泛化的效果可能不如直接在与测试分布更相似的单个源数据集上进行训练。
[0004]为了解决多数据集训练的问题，最近有方法提出在预训练模型上训练一组专家系统分别学习建模不同数据集特性，但是这种多专家系统范式存在着一些缺点，首先，每个数据集都需分配一个专家，因此专家数量会随着数据集增加而增加；更重要的是，对于未见过的数据集的专家参数将由训练数据集的专家参数的平均来估计，这在实际场景中并不合理，因为并不总能假设新的分布可以被训练分布的加权平均所简单描述。

技术实现思路

[0005]为解决上述技术问题，本专利技术提供一种基于自适应专家系统的智能问答方法，训练单个专家，可以自动适应于来自所有数据集的每个实例。
[0006]为解决上述技术问题，本专利技术采用...

【技术保护点】

【技术特征摘要】
1.一种基于自适应专家系统的智能问答方法，其特征在于：自适应专家系统包括：基本模型（θ,α），包括基于Transformer的问答模块θ和瓶颈结构适配器α；基于Transformer的问答模块θ包括预训练Transformer编码器，Transformer编码器包括多个Transformer层；在每一个Transformer层中插入两个所述的瓶颈结构适配器α；瓶颈结构适配器α包括依次设置的下投影层、GeLU非线性层、上投影层；调制层β，添加至各瓶颈结构适配器α的下投影层之后以及上投影层之后，用于通过实例级别调制信号来调节上投影层和下投影层的输出；基于梯度的调制器γ，用于产生所述的实例级别调制信号；自适应专家系统的训练方法包括两个阶段：第一阶段，训练基本模型（θ,α）：通过在所有源数据集D
S
上计算交叉熵损失一对基本模型（θ,α）进行训练：其中表示给定问题q和上下文c情况下得到真实回答a的概率，为基本模型中回答开始位置概率和回答结束位置概率的乘积，和分别表示回答a的开始位置标记和结束位置标记；第二阶段，冻结基本模型（θ,α），在所有的源数据集D
S
上调试调制层β和调制器γ：给定一个训练实例，首先用基本模型（θ,α）来提取梯度，然后将训练实例和提取的梯度输入至自适应专家系统（θ,α,β,γ）对回答进行预测，采用交叉熵损失二调制β和γ：其中，用来标记自适应专家系统预测得到回答a的概率；为自适应专家系统中回答开始位置概率，为自适应专家系统中回答结束位置概率；自适应专家系统（θ,α,β,γ）完成训练后，将待回答的实例输入基本模型（θ,α）中提取梯度，然后将待回答的实例和梯度输入自适应专家系统（θ,α,β,γ）对回答进行预测。2.根据权利要求1所述的基于自适应专家系统的智能问答方法，其特征在于：下投影层后的调制层为第一调制层，上投影层后的调制层为第二调制层；调制层β通过实例级别调制信号来调节上投影层和下投影层的输出时，过程如下：第一调制层的输出第二调制层的输出第二调制层的输出其中分别为瓶颈结构适配器的m维输入和输出，MLP为用于维度映射
的多层感知机，分别是下投影层和上投影层的参数，分别是第一调制层所用到的实例级别调...

【专利技术属性】
技术研发人员：毛震东，张勇东，王泉，彭奕兴，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人