【技术实现步骤摘要】
用于解释开放域问答模型的可视分析系统
[0001]本专利技术属于开放域问答模型分析
,具体涉及用于解释开放域问答模型的可视分析系统。
技术介绍
[0002]问答(QA)是信息检索(IR)和自然语言处理(NLP)的一个领域,其重点是建立一个自动回答人类以自然语言格式提出的问题的模型。开放域问答(OpenQA)允许机器在没有给定上下文的情况下为用户的问题提供准确的答案,并被认为是QA研究的最终目标。在该技术支持下,现代搜索引擎,如谷歌和必应,不仅可以根据用户查询返回相关片段或超链接列表作为问题,还可以生成这些问题的适当答案,以协调搜索结果。这些搜索引擎利用查询作为OpenQA模型的输入,并将模型的输出作为直接答案,从而提高用户体验和效率。例如,向搜索引擎提问“谁是第一个踏上月球的人”,会得到答案“尼尔
·
阿姆斯特朗”,以及进一步阅读的链接。
[0003]OpenQA的现代方法由两部分组成:检索器和阅读器。给定一个问题,检索器从大型非结构化语料库中搜索相关段落作为前k个段落,读者从这些段落中生成答案。随着深度学习技术的发展,阅读器基于神经机器阅读理解模型,如BERT,来推断答案。同时,检索器可以被认为是一个IR系统,可以由基于Transformer的模块实现并检索段落。考虑到OpenQA模型的多样性,本专利技术讨论采用BERT作为检索器和阅读器的基本架构的模型。
[0004]尽管OpenQA进展很快,但现有的体系结构仍然可以改进。例如,模型的检索效率,即将给定问题的相关段落与无关段落 ...
【技术保护点】
【技术特征摘要】
1.一种解释开放域问答模型的可视分析系统,其特征在于,包含解释引擎模块、流程分析模块以及视图模块;其中:所述解释引擎模块,使用归因方法对OpenQA模型的每个模块的最终输出和隐式输出在全局和局部级别进行归因,包括特征归因解释器与层归因解释器;其中:所述特征归因解释器,采用显著性方法和归因方法来解释OpenQA模型中的模块,即评估每个输入特征对模块输出的贡献和每个层此对模块输出的贡献;所述层归因解释器,采用归因方法来解释模块,即评估每个层对模块输出的贡献;具体使用树生成算法来捕获抽象的语义信息并探索层信息流;使用层聚合来计算各层的重要性,以解释层功能;解释引擎模块帮助专家通过分析模块响应和实例来理解OpenQA模型的决策;所述流程分析模块,把VEQA中的模型信息、数据以及经由解释引擎生成的可解释性数据被可视化为用户分析界面的各个视图,用户按照线性工作流,以数据集、子集、单个实例、单个段落的顺序进行多层次探索;其中:数据集与子集层次:在用户面板中选择某个数据集与模型后,用户在摘要视图中依据模块每个部分的统计信息和重要性的数据选择一个子集,其具体数据被呈现在上下文视图中;实例层次:用户在上下文视图中选择该子集中单个感兴趣的实例,该实例在模型中各个模块的解释性数据被可视化于实例视图;段落层次:用户在实例视图中选择感兴趣的候选段落,细节信息被进一步展现于树视图中;所述视图模块,视图即上述可视化于用户分析界面的各个视图;用户面板可以显示初始选择模型与数据集等,视图包括:摘要视图、上下文视图、实例视图和树视图;四个视图用于可视化分析与探索;其中:摘要视图:使用问题的开头两个单词作为标签,将数据集划分为不同的问题类型,并计算每个子集的性能指标;它与层归因中得到的各层重要性一起提供模块和数据集的概述,以指导专家探索子集中的实例;上下文视图:展示数据集或选定子集中的所有问题实例和每个实例的预测结果,并在某个阶段显示选定段落的热图;它显示特征归因解释器中获得的所有词的特征重要性与原文,是对其他视图的补充;实例视图:使用特征归因解释器来总结不同模块中每个候选段落的重点单词,并在包含上下文的排名可视化的新颖流图中显示它们的分布,这旨在帮助专家了解模块间决策流的相似性和差异性;树视图:基于层归因解释器生成的归因树,设计可对比的树可视化来表达层之间的语义变化。2.根据权利要求1所述的解释开放域问答模型的可视分析系统,其特征在于,所述解释引擎模块中,所述特征归因解释器,采用显著性方法和归因方法来解释OpenQA模型中的模块,即评估每个输入特征对模块输出的贡献和每个层此对模块输出的贡献,具体地:考虑到OpenQA模型中使用多个模块,并且单个模块可以承载多个任务;故使用(M,T)表示承载任务T的模块M,完整的OpenQA模型由四个(M,T)组成,它们决定最终预测:检索器中
的两个独立编码器,即问题编码器(Q,E)和段落编码器(P,E),以及阅读器中的两个模块,其充当重新排序器(R,R)和答案提取器(R,S);使用F
(M,T)
表示作为归因目标的(M,T)的最终输出;对于具有给定任务T的给定模块M,长度为L的输入嵌入e中每个词e
i
通过积分梯度被分配显著性分数Sal
(M,T)
(e
i
):公式(1)中,b表示作为基线的重复[MASK]向量,m表示在积分的黎曼近似中执行的步骤数,一般默认设置,确保精度和速度之间的平衡;表示F
(M,T)
相对词e
i
的梯度,公式(1)是关于沿着从给定基线到输入的路径的输入的梯度积分的黎曼近似。3.根据权利要求2所述的解释开放域问答模型的可视分析系统,其特征在于,所述解释引擎模块中,所述层归因解释器,采用归因方法来解释模块,即评估每个层对模块输出的贡献;具体使用树生成算法来捕获抽象的语义信息并探索层信息流;使用层聚合来计算各层的重要性,以解释层功能;具体为:利用层电导方法,获得任务T的模块M中第l层的任务无关输出的归因分数,即其大小与相同:公式(2)中,,m与公式(1)中情形相同;在任务T的条件下,模块M中第l层的输出,即嵌入和第h个头部注意力矩阵表示为和公式2近似为层中神经元的梯度积分流;在此基础上,对归因分数进行进一步的处理,以探索层级信息流并解释层功能。4.根据权利要求3所述的解释开放域问答模型的可视分析系统,其特征在于,所述解释引擎模块中,所述探索层级信息流,是采用树生成算法来显示模块内部的信息流;树的生成基于导出的注意力归因,即通过公式(1)将多层原始注意力(A)细化为注意力归因(B),然后从上到下选择具有高归因得分的单词和单词对作为节点和边缘来构建树(C)具体地:首先,使用L2范数总结第l层中每个注意力头部的归因得分,记为其次,使用L2范数计算...
【专利技术属性】
技术研发人员:陈思明,邵则开,孙姝然,赵宇恒,魏忠钰,王思远,桂韬,
申请(专利权)人:复旦大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。