一种基于量子计算的模型训练方法及装置制造方法及图纸

技术编号:30651226 阅读:20 留言:0更新日期:2021-11-04 01:11
本发明专利技术实施例提供了一种基于量子计算的模型训练方法,该方法包括:获取第一模型的训练数据集和第一模型的初始参数;针对训练数据集和初始参数,根据牛顿方法设置量子线路;运行量子线路,得到第一模型的优化参数。得到第一模型的优化参数。得到第一模型的优化参数。

【技术实现步骤摘要】
一种基于量子计算的模型训练方法及装置


[0001]本专利技术涉及量子计算领域,尤其涉及一种基于量子计算的模型训练方法及装置。

技术介绍

[0002]在很多业务领域中需要用到推荐系统。例如,用户产品推荐,包括电商产品推荐、短视频推送等,是几乎所有资源整合型网络平台的核心任务。在推荐系统中使用机器学习模型进行推荐产品的选取是现在业界常使用的技术手段。其中的一些方案,例如使用分解机模型,在用户与产品的历史相互作用信息呈现稀疏特征时具有极好的作用效果。然而,由于例如为分解机模型的优化训练过程的复杂度是与其参数维度呈线性关系的,随着用户和产品信息的丰富,其训练任务越来越难以完成。
[0003]因此,需要一种更好的模型训练方法。

技术实现思路

[0004]本专利技术的实施例提供一种基于量子计算的模型训练及装置,相较于基于经典计算机的模型训练方法,可以大大减少消耗的计算资源。
[0005]本专利技术为解决上述技术问题采用的技术方案为,一方面提供一种基于量子计算的模型训练方法,包括:
[0006]获取第一模型的训练数据集和所述第一模型的初始参数;
[0007]针对所述训练数据集和所述初始参数,根据牛顿方法设置量子线路;
[0008]运行所述量子线路,得到所述第一模型的优化参数。
[0009]优选地,所述针对所述训练数据集和所述初始参数,根据牛顿方法设置量子线路包括:
[0010]根据所述训练数据集,确定第一矩阵;
[0011]根据所述第一矩阵和所述初始参数,确定用于训练所述第一模型的损失函数;
[0012]根据所述损失函数,基于牛顿方法设置所述量子线路。
[0013]优选地,所述量子线路至少包括第一模块和第二模块,所述第一模块用于实现对所述损失函数的等效梯度,所述第二模块用于实现对所述损失函数的二阶导数的逆。
[0014]优选地,运行所述量子线路,得到所述第一模型的优化参数包括,运行所述量子线路,将表示所述初始参数的第一量子态演化为表示所述优化参数第二量子态。优选地,所述方法还包括,
[0015]对所述第二量子态进行投影测量,确定所述第二量子态是否达到预定精度,在达到预定精度的情况中,结束对所述第一模型的训练。
[0016]优选地,所述量子线路包括,第一单比特量子寄存器up、第二单比特量子寄存器d、第三单比特量子寄存器h,以及第一多比特量子寄存器e和第二多比特量子寄存器v;
[0017]运行所述量子线路,将第一量子态演化为第二量子态,包括:
[0018]将up、d、h均置于量子态|0>,将e置于量子态将v置于第一量子态|X>,其中,
χ为比特数;
[0019]对up执行绕y轴且角度为η的旋转操作后,在e和v上做关于等效梯度算符的量子相位估计操作;
[0020]对d做由寄存器up和e控制的旋转操作;
[0021]对e和v做所述等效梯度算符的量子相位估计操作的逆操作;
[0022]对e和v做等效Hessian算符的量子相位估计操作;
[0023]对h做由寄存器up和e控制的旋转操作;
[0024]对e和v做所述等效Hessian算符的量子相位估计操作的逆操作;
[0025]对up做绕y轴且角度为η的旋转操作后,从v获取第二量子态。
[0026]优选地,所述第一模型为分解机模型。
[0027]第二方面提供一种基于量子计算的模型训练装置,所述装置包括:
[0028]训练数据和初始参数获取单元,配置为,获取第一模型的训练数据集和所述第一模型的初始参数;
[0029]量子线路设置单元,配置为,针对所述训练数据集和所述初始参数,根据牛顿方法设置量子线路;
[0030]模型训练单元,配置为,运行所述量子线路,得到所述第一模型的优化参数。
[0031]第三方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。
[0032]第四方面提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。
附图说明
[0033]为了更清楚说明本专利技术实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1为本专利技术实施例提供的一种基于量子计算的模型训练方法的流程图;
[0035]图2为本专利技术实施例提供的一种基于量子计算的模型训练方法、以及利用该模型进行预测的整体流程图;
[0036]图3为本专利技术实施例提供的一种牛顿优化量子线路的示意图;
[0037]图4为本专利技术实施例提供的一种基于量子计算的模型训练装置的结构图。
具体实施方式
[0038]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0039]如前所述,在进行一些例如为分解机模型的机器学习模型的训练时,由于这些模型的优化过程(通常即训练过程)的复杂度是与其参数维度呈线性关系,因此其训练过程的复杂度会随着因为处理数据维度变大而提高很快,可能导致消耗过多的计算资源。量子计
算机具有潜在的强大的计算能力,利用量子处理器来进行数据处理,在很多情况下相比于经典方法具有明显的加速优势。本专利技术实施例提供的一种基于量子计算的模型训练方法,该方法的核心思路是基于量子处理器,通过对应于量子牛顿方法的量子线路来训练机器学习模型。通过该方法进行模型训练,在模型训练的变量迭代更新过程中所需要的量子比特资源、计算复杂度均关于参数维度成对数相关,即相对于经典训练,可以实现指数级加速。这在以分解机为代表的一系列机器学习模型的训练中具有巨大优势。目前还有一些技术方案在模型训练利用了量子梯度方法,相对于这些方案,本说明书实施例提供的方法,在训练中具有更快的收敛速率,也就是说具有更快的训练速度。
[0040]图1为本专利技术实施例提供的一种基于量子计算的模型训练方法的流程图。如图所示,该方法的流程至少包括:
[0041]步骤11,获取第一模型的训练数据集和所述第一模型的初始参数。
[0042]该步骤中,获取用于训练待训练模型的数据集,以及待训练模型的初始参数。在一个实施例中,初始参数可以是随机的。在另一个实施例中,初始参数可以根据经验确定。
[0043]在一个实施例中,第一模型可以为分解机模型。在其他实施例中,第一模型还可以是其他可以以牛顿法优化模型参数的机器学本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于量子计算的模型训练方法,包括:获取第一模型的训练数据集和所述第一模型的初始参数;针对所述训练数据集和所述初始参数,根据牛顿方法设置量子线路;运行所述量子线路,得到所述第一模型的优化参数。2.根据权利要求1所述的方法,其中,所述针对所述训练数据集和所述初始参数,根据牛顿方法设置量子线路包括:根据所述训练数据集,确定第一矩阵;根据所述第一矩阵和所述初始参数,确定用于训练所述第一模型的损失函数;根据所述损失函数,基于牛顿方法设置所述量子线路。3.根据权利要求2所述的方法,其中,所述量子线路至少包括第一模块和第二模块,所述第一模块用于实现对所述损失函数的等效梯度,所述第二模块用于实现对所述损失函数的二阶导数的逆。4.根据权利要求2所述的方法,其中,运行所述量子线路,得到所述第一模型的优化参数包括,运行所述量子线路,将表示所述初始参数的第一量子态演化为表示所述优化参数第二量子态。5.根据权利要求4所述的方法,还包括,对所述第二量子态进行投影测量,确定所述第二量子态是否达到预定精度,在达到预定精度的情况中,结束对所述第一模型的训练。6.根据权利要求4所述的方法,其中,所述量子线路包括,第一单比特量子寄存器up、第二单比特量子寄存器d、第三单比特量子寄存器h,以及第一多比特量子寄存器e和第二多比特量子寄存器v;运行所述量子线路,将第一量子态演化为第二量子态,包括:将up、d、h均置于量子态|0>,将e置于量子态将v置于第一量子态|X>,其中,χ为比特数;对up...

【专利技术属性】
技术研发人员:龙桂鲁高攀
申请(专利权)人:北京量子信息科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1