基于量子测量与自注意力机制的问答任务匹配模型及方法技术

技术编号：30156242 阅读：13 留言：0更新日期：2021-09-25 15:07

本发明专利技术公开一种基于量子测量与自注意力机制的问答任务匹配模型，使用one

全部详细技术资料下载

【技术实现步骤摘要】
基于量子测量与自注意力机制的问答任务匹配模型及方法

[0001]本专利技术涉及属于量子计算和深度学习领域，特别是涉及一种基于量子测量的问答任务匹配模型及方法。

技术介绍

[0002]从2010年开始到现在的十年间，飞速发展的人工智能领域就一直走在计算机科学技术的最前沿，向量空间模型在人工智能领域的决定性地位也在这一时期逐渐开始确立了。与此同时，量子理论的发展对计算机科学的影响也变得越来越多，有关量子理论的重大进展的消息经常出现在日常新闻中。这两个领域背后的数学基础的共同点比人们想象的要多很多，对量子理论公理化的核心数学基础就是向量空间，而这种采用向量空间对量子理论公理化的做法，是用向量空间的线性几何推导量子逻辑和量子概率的关键动机。微小物理粒子之间的量子作用是用张量积建模的，而张量积也被用来表示神经网络中对象和操作。受其启发，一部分科研工作者开始探索用量子理论的数学框架来建模人工智能领域的问题，尝试解决人工智能领域中的不可解释的问题，其中在自然语言处理领域已有不少有趣的模型成果展现。
[0003]线性向量空间在信息检索中使用最早可以追溯到20世纪60年代[1]，而对量子理论进行形式化建模则在量子理论发展的早期就被认识到了，之后这个两个领域均有着蓬勃的发展但互不相交。直到Van Rijsbergen[2]意识到量子力学的希尔伯特空间公理化和信息检索的向量空间模型有很多共通甚至是相同之处，这种创造性的思想为后续理解和利用量子理论发展信息检索铺平了道路。第一个真正应用量子理论的数学框架建模信息检索模型的是Sordo...

【技术保护点】

【技术特征摘要】
1.一种基于量子测量与自注意力机制的问答任务匹配模型，其特征在于，所述任务匹配模型包括端到端的量子语言系统；所述量子语言系统由语言编码器、测量矩阵编码器、问答匹配模块构成；其中问答句子中单个词被认为是语言最小单位语义的叠加；不同词之间能够相互关联；句子被视为混合状态的物理系统，由不同的单词组合而成，并且通过权重衡量单词组合之间关系；形式上，单词建模为多维希尔伯特空间中的单位向量，并由纯态密度矩阵表示，句子是权重被归一化的纯态密度矩阵的叠加；在问答匹配任务中，句子的密度矩阵由一组正交的测量向量投影到投影平面，结果的长度对应于句子的密度矩阵被投影到平面的概率。2.根据权利要求1所述的一种基于量子测量与自注意力机制的问答任务匹配模型，其特征在于，所述语言编码器包括嵌入层和混合层；其中：所述嵌入层是初始化单词编码；每个词向量都由实部和虚部组成，在数学定义上，问答任务匹配模型将语义定义为正交的基态集合作为语言的最小单位，其中e
j
为one
‑
hot向量；单词作为语义的叠加态由定义，其中满足是实值非负的振幅，对应于词向量的长度，类似量子理论中粒子波函数的表示方式；所述混合层是将单词编码进行计算，使用自注意力机制获得词嵌入混合的权重，每个句子在训练中获得自身的语义权重，并对每个单词的复向量做外积得到单词纯态的密度矩阵表示，再将纯态密度矩阵加权相加得到单词组合的混合态密度矩阵，每个单词组合的密度矩阵表示为其中p(w
j
)是由自注意力层获取的权重π(w
i
)并经过softmax归一化，权重p(w
j
)满足描述了语义单元相对重要性的概率分布，|w
j
><w
j
|是上文提到的语义叠加态做外积；所述语言编码器对...

【专利技术属性】
技术研发人员：宋世凯，宫秀军，侯越先，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人