自主学习方法、装置、电子设备及机器可读存储介质制造方法及图纸

技术编号:33350696 阅读:19 留言:0更新日期:2022-05-08 09:55
本申请提供一种自主学习方法、装置、电子设备及机器可读存储介质,该方法包括:当确定满足自主学习触发条件时,收集当期训练数据;依据所述当期训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,得到第二模型;依据所述第二模型对所述第一模型进行更新。该方法可以实现模型的持续进化,并在保证模型对新数据的处理性能的情况下,有效缓解模型对旧知识的遗忘。有效缓解模型对旧知识的遗忘。有效缓解模型对旧知识的遗忘。

【技术实现步骤摘要】
自主学习方法、装置、电子设备及机器可读存储介质


[0001]本申请涉及机器学习
,尤其涉及一种自主学习方法、装置、电子设备及机器可读存储介质。

技术介绍

[0002]视频监控中的智能分析自主学习系统是指能够使用用户现场的无标签数据进行自主学习,持续提升线上模型场景泛化能力的智能系统。
[0003]传统的自主学习系统一般不具备持续学习能力,一方面导致端侧硬件训练资源的浪费,另一方面,无法应对线上分布的持续变化,导致一次自主学习过后,性能出现逐渐退化的现象。

技术实现思路

[0004]有鉴于此,本申请提供一种自主学习方法、装置、电子设备及机器可读存储介质,以应对线上数据分布的持续变化,优化模型性能。
[0005]具体地,本申请是通过如下技术方案实现的:
[0006]根据本申请实施例的第一方面,提供一种自主学习方法,包括:
[0007]当确定满足自主学习触发条件时,收集当期训练数据;所述当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据,和/或,目标时间点之后的第二预设时长内产生的无标签数据;所述目标时间点为确定满足自主学习触发条件的时间点;
[0008]依据所述当期训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,得到第二模型;其中,所述第一模型为当前使用的模型,所述历史高价值样本为当前使用的模型的历史自主学习过程中,在自主学习前后的模型上的输出结果差异大于预设阈值的样本;
[0009]依据所述第二模型对所述第一模型进行更新。
[0010]根据本申请实施例的第二方面,提供一种自主学习装置,包括:
[0011]确定单元,用于确定是否满足自主学习触发条件;
[0012]数据收集单元,用于当所述确定单元确定满足自主学习触发条件时,收集当期训练数据;所述当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据,和/或,目标时间点之后的第二预设时长内产生的无标签数据;所述目标时间点为确定满足自主学习触发条件的时间点;
[0013]训练单元,用于依据所述当期训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,得到第二模型;其中,所述第一模型为当前使用的模型,所述历史高价值样本为当前使用的模型的历史自主学习过程中,在自主学习前后的模型上的输出结果差异大于预设阈值的样本;
[0014]更新单元,用于依据所述第二模型对所述第一模型进行更新。
[0015]根据本申请实施例的第三方面,提供一种电子设备,包括处理器和存储器,所述存
储器存储有能够被所述处理器执行的机器可执行指令,所述处理器用于执行机器可执行指令,以实现第一方面提供的方法。
[0016]根据本申请实施例的第四方面,提供一种机器可读存储介质,所述机器可读存储介质内存储有机器可执行指令,所述机器可执行指令被处理器执行时实现第一方面提供的方法。
[0017]本申请提供的技术方案至少可以带来以下有益效果:
[0018]通过在确定满足自主学习触发条件的情况下,收集当前时间点之前的第一预设时长内产生的无标签数据,和/或,当前时间点之后的第二预设时长的内产生的无标签数据,并以收集到的无标签数据为当期训练数据,依据该当前训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,并依据训练得到的第二模型更新第一模型,实现了模型的持续进化,并在保证模型对新数据的处理性能的情况下,有效缓解模型对旧知识的遗忘。
附图说明
[0019]图1是本申请示例性实施例示出的一种自主学习方法的流程示意图;
[0020]图2是本申请示例性实施例示出的一种自主学习的完整流程示意图;
[0021]图3是本申请示例性实施例示出的一种自主学习装置的结构示意图;
[0022]图4是本申请示例性实施例示出的一种电子设备的硬件结构示意图。
具体实施方式
[0023]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0024]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0025]为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。
[0026]请参见图1,为本申请实施例提供的一种自主学习方法的流程示意图,如图1所示,该自主学习方法可以包括以下步骤:
[0027]需要说明的是,本申请实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
[0028]步骤S100、当确定满足自主学习触发条件时,收集当期训练数据;该当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据,和/或,目标时间点之后的第二预设时长内产生的无标签数据;目标时间点为确定满足自主学习触发条件的时间点。
[0029]本申请实施例中,为了提升线上模型场景泛化能力,应对线上数据分布的持续变
化,在确定满足自主学习触发条件的情况下,可以收集当前时间(即确定满足自主学习触发条件的时间点,本文中称为目标时间点)之前的预设时长(本文中称为第一预设时长)内产生的无标签数据,和/或,目标时间点之后的预设时长(本文中称为第二预设时长)内产生的无标签数据(本文中称为当期训练数据),以用于对当前使用的模型(本文中称为第一模型)进行自主学习训练。
[0030]示例性的,当期训练数据可以为第一模型处理后的数据,其可以包括报警数据(即触发了报警的数据)和非报警数据(即未触发报警的数据)。
[0031]示例性的,第一预设时长和第二预设时长可以相同,也可以不同。
[0032]示例性的,第一预设时长和第二预设时长中可以一个为0,即可以仅收集目标时间点之前的无标签数据作为当期训练数据,或,仅收集目标时间点之后的无标签数据作为当前训练数据。
[0033]示例性的,在当期训练数据包括目标时间点之后的第二预设时长内产生的无标签数据的情况下,可以在当前训练数据收集完成的情况下,开始模型的更新。
[0034]步骤S110、依据当前训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,得到第二模型。
[0035]本申请实施例中,为了保证自主学习训练得到的模型的准确性,在对第一模型进行自主学习训练的过程中,除了可以使用步骤S100中获取到的当期训练数据之外本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自主学习方法,其特征在于,包括:当确定满足自主学习触发条件时,收集当期训练数据;所述当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据,和/或,目标时间点之后的第二预设时长内产生的无标签数据;所述目标时间点为确定满足自主学习触发条件的时间点;依据所述当期训练数据、历史高价值样本,以及获取到的有标签数据,对第一模型进行在线训练,得到第二模型;其中,所述第一模型为当前使用的模型,所述历史高价值样本为当前使用的模型的历史自主学习过程中,在自主学习前后的模型上的输出结果差异大于预设阈值的样本;依据所述第二模型对所述第一模型进行更新。2.根据权利要求1所述的方法,其特征在于,所述满足自主学习触发条件,包括:所述第一模型的在线推理结果的准确率低于预设准确率阈值;和/或,检测到自主学习触发指令;和/或,达到预设自主学习时间点。3.根据权利要求1所述的方法,其特征在于,用于在线训练的高价值历史样本库中的高价值历史样本通过以下方式筛选得到:当完成第t次自主学习时,获取在所述模型M
t
上的输出结果与M
t+1
上的输出结果的差异大于预设阈值的第一样本;所述M
t
为第t次自主学习前的模型,所述M
t+1
为第t次自主学习后的模型,t≥1;利用聚类方式,对所述第一样本进行去相似处理,得到第二样本,并将所述第二样本加入到所述高价值历史样本库。4.根据权利要求3所述的方法,其特征在于,所述将所述第二样本加入到所述高价值历史样本库,包括:对于任一第二样本,当将该第二样本加入到所述高价值历史样本库之前,所述高价值历史样本库中的高价值历史样本的数量达到预设最大数量时,删除所述高价值历史样本库中加入时间最早的高价值历史样本,并将该第二样本加入到所述高价值历史样本库。5.根据权利要求1所述的方法,其特征在于,所述依据所述第二模型对所述第一模型进行更新,包括:对所述第二模型进行在线量化,并使用量化后的第二模型替换所述第一模型。6.一种自主学习装置,其特征在于,包括:确定单元,用于确定是否满足自主学习触发条件;数据收集单元,用于当所述确定单元确定满足自主学习触发条件时,收集当期训练数据;所述当期训练数据包括目标时间点之前的第一预设时长内...

【专利技术属性】
技术研发人员:王金
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1