产生影像辨识模型的方法及使用所述方法的电子装置制造方法及图纸

技术编号:33701142 阅读:21 留言:0更新日期:2022-06-06 08:10
本发明专利技术提出一种产生影像辨识模型的方法及使用所述方法的电子装置。方法包含:取得来源影像;自来源影像的第一区域剪下第一影像,以产生经剪裁的来源影像;以及根据特征数据以及标签数据以预训练初始影像辨识模型,其中特征数据关联于经剪裁的来源影像,并且标签数据关联于第一影像;以及对初始影像辨识模型进行微调以产生影像辨识模型。本发明专利技术提出的产生影像辨识模型的方法及电子装置具有正确地还原输入影像的功效。输入影像的功效。输入影像的功效。

【技术实现步骤摘要】
产生影像辨识模型的方法及使用所述方法的电子装置


[0001]本专利技术是有关于一种产生影像辨识模型的方法及使用所述方法的电子装置。

技术介绍

[0002]在影像辨识及机器学习(machine learning)的领域中,迁移式学习(transfer learning)逐渐成为训练影像辨识模型的重要方法之一。标准的迁移式学习的流程可包含预训练(pre

training)模型以及微调(fine

tuning)模型等步骤。在预训练模型的步骤中,以含有大量数据的源数据(source data)对模型进行预训练,找出适当的特征数据以建立初步影像辨识模型,再以特定的目标数据(target data)对模型进行微调。。若预训练模型的过程中无法找到适当的特征数据,即使再以特定的目标数据对模型进行微调也无法拥有良好的效能。适当的特征数据的取得对人脸辨识技术特别重要,尤其是在人脸信息不完整情况下的辨识(例如刘海、眼镜、口罩等遮蔽)。因此,开发出一种取得适当的特征数据的方法是本领域技术人员致力的目标。

技术实现思路

[0003]本专利技术提供一种产生影像辨识模型的方法和使用所述方法的电子装置,可产生用于预训练以及微调的特征数据。
[0004]本专利技术的一种产生影像辨识模型的方法,包含:取得来源影像;自来源影像的第一区域剪下第一影像,以产生经剪裁的来源影像;根据第一特征数据以及第一标签数据以预训练初始影像辨识模型而产生一经预训练的初始影像辨识模型,其中第一特征数据关联于经剪裁的来源影像,并且第一标签数据关联于第一影像;以及对经预训练的初始影像辨识模型进行微调以产生影像辨识模型。
[0005]本专利技术的一种用于产生影像辨识模型的电子装置,包含处理器以及收发器。收发器取得来源影像。处理器耦接收发器,并且经配置以执行:自来源影像的第一区域剪下第一影像以产生经剪裁的来源影像;根据第一特征数据以及第二标签数据以预训练初始影像辨识模型,而产生经预训练的初始影像辨识模型,其中第一特征数据关联于经剪裁的来源影像,并且第一标签数据关联于第一影像;以及对经预训练的初始影像辨识模型进行微调以产生影像辨识模型。
[0006]基于上述,本专利技术可对来源影像或目标影像进行裁切。裁切过的来源影像或目标影像将可用于影像辨识模型的预训练以及微调。
[0007]为让本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
【附图说明】
[0008]图1根据本专利技术的一实施例图示一种产生影像辨识模型的电子装置的示意图。
[0009]图2根据本专利技术的一实施例图示对来源影像进行剪裁的示意图。
[0010]图3根据本专利技术的一实施例图示预训练初始影像辨识模型的示意图。
[0011]图4根据本专利技术的一实施例图示在来源影像添加噪声的示意图。
[0012]图5根据本专利技术的一实施例图示对目标影像进行剪裁的示意图。
[0013]图6根据本专利技术的一实施例图示在目标影像添加噪声的示意图。
[0014]图7根据本专利技术的一实施例图示利用影像辨识模型辨识输入影像及结果的示意图。
[0015]图8根据本专利技术的一实施例图示一种产生影像辨识模型的方法的流程图。
[0016]【符号说明】
[0017]100:电子装置
[0018]110:处理器
[0019]120:储存介质
[0020]130:收发器
[0021]200:来源影像
[0022]21、51:其他区域
[0023]210:经剪裁的来源影像
[0024]211:经处理的来源影像
[0025]22:第一区域
[0026]220:第一影像
[0027]300:初始影像辨识模型
[0028]301:特征萃取层
[0029]302、303:层
[0030]304:softmax层
[0031]310:预训练后的初始影像辨识模型
[0032]311、312:加法器
[0033]306:输出影像
[0034]320:影像辨识模型
[0035]400:损失函数计算模型
[0036]500:目标影像
[0037]510:经剪裁的目标影像
[0038]511:经处理的目标影像
[0039]52:第二区域
[0040]520:第二影像
[0041]71:原始影像
[0042]72:输入影像
[0043]73:输出影像
[0044]A1:第一特征数据
[0045]A2:相关性矩阵
[0046]A3、A4、A5:矩阵
[0047]B1:第一标签数据
[0048]C1:第二特征数据
[0049]D1:第二标签数据
[0050]LF:损失函数
[0051]S801、S802、S803、S804:步骤。
【具体实施方式】
[0052]为了使本专利技术的内容可以被更容易明了,以下特举实施例作为本专利技术确实能够据以实施的范例。另外,凡可能之处,在附图及具体实施方式中使用相同标号的元件/构件/步骤,代表相同或类似部件。
[0053]图1根据本专利技术的一实施例图示一种产生影像辨识模型的电子装置的示意图。电子装置100可包含处理器110、储存介质120以及收发器130。电子装置100可执行预训练以产生初始影像辨识模型,并可对初始影像辨识模型进行微调以产生影像辨识模型。
[0054]处理器110例如是中央处理单元(central processing unit,CPU),或是其他可编程的通用或专用的微控制单元(micro control unit,MCU)、微处理器(microprocessor)、数字信号处理器(digital signal processor,DSP)、可编程控制器、专用集成电路(application specific integrated circuit,ASIC)、图形处理器(graphics processing unit,GPU)、影像信号处理器(image signal processor,ISP)、图像处理单元(image processing unit,IPU)、算术逻辑单元(arithmetic logic unit,ALU)、复杂可编程逻辑器件(complex programmable logic device,CPLD)、现场可编程逻辑门阵列(field programmable gate array,FPGA)或其他类似元件或上述元件的组合。处理器110可耦接至储存介质120以及收发器130,并且存取和执行储存于储存介质120中的多个模块和各种应用程序,例如执行产生影像辨识模型,处理器110例如可读取储存介质120的模块或应用程序的各步骤(或运算层)或流程并进行运算,再将运算结果输出至储存介质120对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产生影像辨识模型的方法,其特征在于,所述方法包括:取得来源影像;自所述来源影像的第一区域剪下第一影像,以产生经剪裁的来源影像;根据第一特征数据以及第一标签数据以预训练初始影像辨识模型而产生经预训练的初始影像辨识模型,其中所述第一特征数据关联于所述经剪裁的来源影像,并且所述第一标签数据关联于所述第一影像;以及对所述经预训练的初始影像辨识模型进行微调以产生所述影像辨识模型。2.根据权利要求1所述的方法,其特征在于,对所述经预训练的初始影像辨识模型进行微调以产生所述影像辨识模型的步骤包括:取得目标影像;自所述目标影像的第二区域剪下第二影像,以产生经剪裁的目标影像;以及根据第二特征数据以及第二标签数据来微调所述初始影像辨识模型以产生所述影像辨识模型,其中所述第二特征数据关联于所述经剪裁的目标影像,并且所述第二标签数据关联于所述第二影像。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述经剪裁的来源影像的至少一区域进行编码以产生至少一来源影像内嵌矩阵;以及将所述至少一来源影像内嵌矩阵配置为所述第一特征数据。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述经剪裁的目标影像的至少一区域进行编码以产生至少一目标影像内嵌矩阵;以及将所述至少一目标影像内嵌矩阵配置为所述第二特征数据。5.根据权利要求3所述的方法,其特征在于,对所述经剪裁的来源影像的所述至少一区域进行编码以产生所述至少一来源影像内嵌矩阵的步骤包括:...

【专利技术属性】
技术研发人员:郑景文黄彦钧刘一帆陈奎廷
申请(专利权)人:中强光电股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1