可变模型的训练方法和芯片产品技术

技术编号:39732836 阅读:5 留言:0更新日期:2023-12-17 23:35
本发明专利技术公开一种可变模型的训练方法和芯片产品,可变模型和芯片产品包括:输入部分用于模型和芯片产品接收输入信号;输出部分用于模型和芯片产品输出信号;状态输入部分用于模型和芯片产品接收状态输入信号;状态设定部分用于模型和芯片产品接收设定的目标状态信号;根据输入信号和状态信号控制状态信号尽快达到目标状态。方法为:初始化n个可变模型和n个变化规律模型,每个可变模型包括一个变化规律模型,随机选择一个训练任务,利用每个可变模型驱动任务执行,根据每个可变模型的适应度和演化算法重新生成n个可变模型和其变化规律模型,继续训练,直至满足训练终止条件,由此可变模型和芯片产品可实现智力,实现真正意义上的人工智能模型。人工智能模型。人工智能模型。

【技术实现步骤摘要】
可变模型的训练方法和芯片产品


[0001]本专利技术涉及人工智能、类脑智能、机器人、仿生芯片、仿生计算机等多个领域,尤其涉及一种可变模型的训练方法和芯片产品。

技术介绍

[0002]可学习模型和芯片产品被应用在工农业自动化领域和广义机器人领域。但在实现这类模型和产品的方法中,没有对具体的模型加以限制,即任意的模型,只要满足可学习模型和芯片产品所描述的功能,都被认为是实现可学习模型和芯片产品的范畴。
[0003]有一类特殊的被称作可变模型的人工智能模型,更适合用于实现可学习模型和芯片产品。这类模型不再关注模型的静态参数,而是关注模型参数的变化规律。人类的大脑就是这类模型的一个典型实例。大脑神经元的突触,会随着信息的处理进行变化,所以也是可变模型的一种。但业界一直致力于对大脑模型进行模仿,没有将内在的原理一般化,更没有对这类技术进行产品化。

技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种可变模型的训练方法和芯片产品,由可变模型的训练方法训练出来的可变模型和芯片产品中的参数可以自主变化,由此实现智力,实现真正意义上的人工智能模型。
[0005]为达到上述目的,本专利技术第一方面实施例提出一种可变模型的训练方法,所述方法包括:构建训练任务池,其中,所述训练任务池包括多个训练任务;初始化可变模型,并拷贝所述可变模型得到n个所述可变模型;初始化n个变化规律模型,其中,每个所述可变模型包括一个所述变化规律模型,且所述可变模型的参数由所述变化规律模型确定;随机从所述训练任务池中选择一个训练任务,并拷贝所选择的训练任务得到n个训练任务,以及将n个所述训练任务的输入和输出分别作为n个所述可变模型的输入和输出;分别利用每个所述可变模型,驱动对应训练任务执行,直至满足任务结束条件;记录每个可变模型的适应度,根据所述适应度和演化算法重新生成n个可变模型和对应的n个变化规律模型;返回初始化n个所述变化规律模型的步骤,直至满足训练终止条件。
[0006]另外,根据本专利技术上述实施例提出的可变模型的训练方法还可以具有如下附加的技术特征:
[0007]根据本专利技术的一个实施例,所述根据所述适应度和演化算法重新生成n个可变模型,其中,重新生成的n个所述可变模型的参数相同。
[0008]根据本专利技术的一个实施例,所述训练终止条件包括训练次数达到预设次数。
[0009]根据本专利技术的一个实施例,所述记录每个可变模型的适应度,包括:计算每个所述可变模型对应训练任务的实际状态和目标状态的距离;将所述距离作为每个所述可变模型的适应度。
[0010]根据本专利技术的一个实施例,所述变化规律模型包括循环神经网络RNN模型。
[0011]根据本专利技术的一个实施例,所述方法还包括:构建测试任务池,其中,所述测试任务池包括多个测试任务;利用所述测试任务对训练得到的可变模型进行测试,得到最终的可变模型。
[0012]根据本专利技术的一个实施例,所述利用所述测试任务对训练得到的可变模型进行测试,得到最终的可变模型,包括:随机从所述测试任务池中抽取测试任务,测试训练得到的可变模型的学习能力;如果所述学习能力达到期望,则将当前的可变模型作为最终的可变模型,否则返回至所述随机从所述训练任务池中获取一个训练任务的步骤。
[0013]根据本专利技术的一个实施例,所述可变模型的参数还包括输入维度、输出维度和阈值范围,其中,所述训练任务池和所述测试任务池中各任务的输入维度小于或等于所述可变模型的输入维度,所述训练任务池和所述测试任务池中各任务的输出维度小于或等于所述可变模型的输出维度,所述训练任务池和所述测试任务池中各任务的阈值范围小于或等于所述可变模型的阈值范围。
[0014]本专利技术实施例的可变模型的训练方法,首先构建训练任务池,初始化n个可变模型,构建n个可变模型的变化规律模型,其中,每个可变模型包括一个变化规律模型,且可变模型的参数由变化规律模型确定,随机从训练任务池中选择一个训练任务,并拷贝所选择的训练任务得到n个训练任务,以及将n个训练任务的输入和输出分别作为n个可变模型的输入和输出,利用每个可变模型,驱动对应训练任务执行,直至满足任务结束条件;记录每个可变模型的适应度,作为判断变化规律模型的好坏的标准,依据演化算法重新生成n个可变模型和对应的n个变化规律模型,在对n个变化规律模型初始化,继续驱动任务执行,直至满足训练终止条件。本专利技术的可变模型中的变化规律是输入信息的函数,且输入信息有助于可变模型的性能在可变模型使用周期中获得提升,可变模型就具备了可学习能力,且可变模型的参数是一直变化的,可变模型实现智力,实现真正意义上的人工智能模型。
[0015]为达到上述目的,本专利技术第二方面实施例提出了一种芯片产品,所述芯片产品封装有上述的可变模型的训练方法得到的可变模型,所述芯片产品用于控制任务执行者执行目标任务。
[0016]根据本专利技术的一个实施例,所述芯片产品包括:输入信号接收引脚,用于输入所述目标任务的输入信号;状态信号接收引脚,用于输入所述目标任务的状态信号;目标状态接收引脚,用于输入所述目标任务的目标状态;输出信号引脚,用于输出控制信号;其中,所述芯片产品用于利用所述可变模型根据所述输入信号、所述状态信号生成控制信号,并根据所述控制信号对所述任务执行者进行控制,直至所述状态信号达到所述目标状态。
[0017]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0018]图1是本专利技术一个实施例的可变模型的训练方法的流程图;
[0019]图2是本专利技术一个实施例的训练任务的示意图;
[0020]图3是本专利技术一个实施例的记录可变模型适应度的流程图;
[0021]图4是本专利技术另一个实施例的可变模型的训练方法的流程图;
[0022]图5是本专利技术一个实施例的对可变模型的进行测试的流程图;
[0023]图6是本专利技术一个实施例的芯片产品的示意图;
[0024]图7是本专利技术一个实施例的可学习自动控制器的示意图;
[0025]图8是本专利技术一个实施例的可学习随动控制器的示意图;
[0026]图9是本专利技术另一个实施例的芯片产品的示意图;
[0027]图10是本专利技术一个实施例的基于可变模型的可学习模型的架构示意图。
具体实施方式
[0028]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0029]下面将结合说明书附图以及具体的实施方式对本专利技术实施例的可变模型的训练方法和芯片产品进行详细地说明。
[0030]图1是本专利技术一个实施例的可变模型的训练方法。
[0031]在本专利技术的一个实施例中,如图1所示,可变模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可变模型的训练方法,其特征在于,所述方法包括:构建训练任务池,其中,所述训练任务池包括多个训练任务;初始化可变模型,并拷贝所述可变模型得到n个所述可变模型;初始化n个变化规律模型,其中,每个所述可变模型包括一个所述变化规律模型,且所述可变模型的参数由所述变化规律模型确定;随机从所述训练任务池中选择一个训练任务,并拷贝所选择的训练任务得到n个训练任务,以及将n个所述训练任务的输入和输出分别作为n个所述可变模型的输入和输出;分别利用每个所述可变模型,驱动对应训练任务执行,直至满足任务结束条件;记录每个可变模型的适应度,根据所述适应度和演化算法重新生成n个可变模型和对应的n个变化规律模型;返回初始化n个所述变化规律模型的步骤,直至满足训练终止条件。2.根据权利要求1所述的可变模型的训练方法,其特征在于,所述根据所述适应度和演化算法重新生成n个可变模型,其中,重新生成的n个所述可变模型的参数相同。3.根据权利要求1所述的可变模型的训练方法,其特征在于,所述训练终止条件包括训练次数达到预设次数。4.根据权利要求1所述的可变模型的训练方法,其特征在于,所述记录每个可变模型的适应度,包括:计算每个所述可变模型对应训练任务的实际状态和目标状态的距离;将所述距离作为每个所述可变模型的适应度。5.根据权利要求1所述的可变模型的训练方法,其特征在于,所述变化规律模型包括循环神经网络RNN模型。6.根据权利要求1所述的可变模型的训练方法,其特征在于,所述方法还包括:构建测试任务池,其中,所述测试任务池包括多个测试任务;利用所述测试任务对训练得到...

【专利技术属性】
技术研发人员:朱宝
申请(专利权)人:合肥自然秩序科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1