自主学习方法、装置、电子设备及机器可读存储介质制造方法及图纸

技术编号：33350696 阅读：19 留言：0更新日期：2022-05-08 09:55

本申请提供一种自主学习方法、装置、电子设备及机器可读存储介质，该方法包括：当确定满足自主学习触发条件时，收集当期训练数据；依据所述当期训练数据、历史高价值样本，以及获取到的有标签数据，对第一模型进行在线训练，得到第二模型；依据所述第二模型对所述第一模型进行更新。该方法可以实现模型的持续进化，并在保证模型对新数据的处理性能的情况下，有效缓解模型对旧知识的遗忘。有效缓解模型对旧知识的遗忘。有效缓解模型对旧知识的遗忘。

全部详细技术资料下载

【技术实现步骤摘要】
自主学习方法、装置、电子设备及机器可读存储介质

[0001]本申请涉及机器学习
，尤其涉及一种自主学习方法、装置、电子设备及机器可读存储介质。

技术介绍

[0002]视频监控中的智能分析自主学习系统是指能够使用用户现场的无标签数据进行自主学习，持续提升线上模型场景泛化能力的智能系统。
[0003]传统的自主学习系统一般不具备持续学习能力，一方面导致端侧硬件训练资源的浪费，另一方面，无法应对线上分布的持续变化，导致一次自主学习过后，性能出现逐渐退化的现象。

技术实现思路

[0004]有鉴于此，本申请提供一种自主学习方法、装置、电子设备及机器可读存储介质，以应对线上数据分布的持续变化，优化模型性能。
[0005]具体地，本申请是通过如下技术方案实现的：
[0006]根据本申请实施例的第一方面，提供一种自主学习方法，包括：
[0007]当确定满足自主学习触发条件时，收集当期训练数据；所述当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据，和/或，目标时间点之后的第二预设时长内产生的无标签数据；所述目标时间点为确定满足自主学习触发条件的时间点；
[0008]依据所述当期训练数据、历史高价值样本，以及获取到的有标签数据，对第一模型进行在线训练，得到第二模型；其中，所述第一模型为当前使用的模型，所述历史高价值样本为当前使用的模型的历史自主学习过程中，在自主学习前后的模型上的输出结果差异大于预设阈值的样本；
[0009]依据所述第二模型对所述第一模型...

【技术保护点】

【技术特征摘要】
1.一种自主学习方法，其特征在于，包括：当确定满足自主学习触发条件时，收集当期训练数据；所述当期训练数据包括目标时间点之前的第一预设时长内产生的无标签数据，和/或，目标时间点之后的第二预设时长内产生的无标签数据；所述目标时间点为确定满足自主学习触发条件的时间点；依据所述当期训练数据、历史高价值样本，以及获取到的有标签数据，对第一模型进行在线训练，得到第二模型；其中，所述第一模型为当前使用的模型，所述历史高价值样本为当前使用的模型的历史自主学习过程中，在自主学习前后的模型上的输出结果差异大于预设阈值的样本；依据所述第二模型对所述第一模型进行更新。2.根据权利要求1所述的方法，其特征在于，所述满足自主学习触发条件，包括：所述第一模型的在线推理结果的准确率低于预设准确率阈值；和/或，检测到自主学习触发指令；和/或，达到预设自主学习时间点。3.根据权利要求1所述的方法，其特征在于，用于在线训练的高价值历史样本库中的高价值历史样本通过以下方式筛选得到：当完成第t次自主学习时，获取在所述模型M
t
上的输出结果与M
t+1
上的输出结果的差异大于预设阈值的第一样本；所述M
t
为第t次自主学习前的模型，所述M
t+1
为第t次自主学习后的模型，t≥1；利用聚类方式，对所述第一样本进行去相似处理，得到第二样本，并将所述第二样本加入到所述高价值历史样本库。4.根据权利要求3所述的方法，其特征在于，所述将所述第二样本加入到所述高价值历史样本库，包括：对于任一第二样本，当将该第二样本加入到所述高价值历史样本库之前，所述高价值历史样本库中的高价值历史样本的数量达到预设最大数量时，删除所述高价值历史样本库中加入时间最早的高价值历史样本，并将该第二样本加入到所述高价值历史样本库。5.根据权利要求1所述的方法，其特征在于，所述依据所述第二模型对所述第一模型进行更新，包括：对所述第二模型进行在线量化，并使用量化后的第二模型替换所述第一模型。6.一种自主学习装置，其特征在于，包括：确定单元，用于确定是否满足自主学习触发条件；数据收集单元，用于当所述确定单元确定满足自主学习触发条件时，收集当期训练数据；所述当期训练数据包括目标时间点之前的第一预设时长内...

【专利技术属性】
技术研发人员：王金，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人