当前位置: 首页 > 专利查询>清华大学专利>正文

模型训练方法、目标检测方法、装置、设备及存储介质制造方法及图纸

技术编号:30551239 阅读:34 留言:0更新日期:2021-10-30 13:31
本发明专利技术实施例公开了一种模型训练方法、目标检测方法、装置、设备及存储介质。其中,该方法包括:将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸;对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。本发明专利技术实施例提供的技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案。有的用于目标检测的神经网络模型的训练方案。有的用于目标检测的神经网络模型的训练方案。

【技术实现步骤摘要】
模型训练方法、目标检测方法、装置、设备及存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及模型训练方法、目标检测方法、装置、设备及存储介质。

技术介绍

[0002]随着深度学习技术的快速发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。神经网络,是一种模拟大脑神经突触联接的结构进行信息处理的模型。在计算机视觉领域,利用神经网络技术可以构建用于目标检测的神经网络模型,相比于传统的混合高斯模型以及隐马尔科夫模型等,具有很多优势。目前,用于目标检测的神经网络模型的训练方案仍不够完善,导致进行目标检测时效果并不理想,容易出现误检、目标检测精度低的情况。

技术实现思路

[0003]本专利技术实施例提供了模型训练方法、目标检测方法、装置、设备及存储介质,可以优化现有的用于目标检测的神经网络模型的训练方案。
[0004]第一方面,本专利技术实施例提供了一种模型训练方法,该方法包括:
[0005]将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
[0006]对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
[0007]将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
[0008]第二方面,本专利技术实施例提供了一种目标检测方法,该方法包括:
[0009]获取待检测目标的图像数据;
[0010]将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用本专利技术实施例提供的模型训练方法训练得到;
[0011]根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
[0012]第三方面,本专利技术实施例提供了一种模型训练装置,该装置包括:
[0013]聚类模块,用于将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;
[0014]缩放模块,用于对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;
[0015]训练模块,用于将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将
所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。
[0016]第四方面,本专利技术实施例提供了一种目标检测装置,该装置包括:
[0017]图像数据获取模块,用于获取待检测目标的图像数据;
[0018]输出结果确定模块,用于将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用本专利技术实施例提供的模型训练方法训练得到;
[0019]检测结果确定模块,用于根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。
[0020]第五方面,本专利技术实施例提供了一种计算机设备,该计算机设备包括:
[0021]一个或多个处理器;
[0022]存储装置,用于存储一个或多个程序;
[0023]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的模型训练方法或者目标检测方法。
[0024]第六方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的模型训练方法或者目标检测方法。
[0025]本专利技术实施例提供了一种模型训练方法、目标检测方法、装置、设备及存储介质,首先将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸,然后对锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,最后将目标锚框尺寸作为预设目标检测算法中的锚框参数,并将数据集中的训练集中包含的样本依次输入至预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型,通过采用上述技术方案,可以优化现有的用于目标检测的神经网络模型的训练方案,有利于提高目标检测结果的准确性。
附图说明
[0026]图1为本专利技术实施例一提供的一种模型训练方法的流程图;
[0027]图2A为本专利技术实施例二提供的一种目标检测方法的流程图;
[0028]图2B为本专利技术提供的训练方法中未对锚框的尺寸进行线性尺度缩放得到第一目标检测模型,并通过第一目标检测模型得到的第一检测结果;
[0029]图2C为本专利技术实施例二提供的方法中通过目标检测模型得到的检测结果;
[0030]图3为本专利技术实施例三提供的一种模型训练装置的结构示意图;
[0031]图4为本专利技术实施例四提供的一种目标检测装置的结构示意图;
[0032]图5为本专利技术实施例五提供的一种计算机设备的结构示意图。
具体实施方式
[0033]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便
于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0034]实施例一
[0035]图1为本专利技术实施例一提供的一种模型训练方法的流程图,本实施例可适用于通过训练得到目标检测模型的情况。本实施例提供的模型训练方法可以由本专利技术实施例提供的模型训练装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的计算机设备中。
[0036]参见图1,本实施例的方法包括但不限于如下步骤:
[0037]S110,将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与待检测目标对应的锚框的尺寸,其中,数据集包括待检测目标对应的矩形框的尺寸。
[0038]其中,待检测目标可以为日常生活中的各物体,例如轮胎或者汽车等,还可以是行人。待检测目标的数据集可以理解为:对待检测目标进行不同角度的拍摄所得到的图像数据进行标注所得到的对应的矩形框的尺寸汇总起来所得到的数据集。预设聚类算法可以为预先设定的聚类方法,例如:K均值聚类方法、基于密度的聚类方法、凝聚层次聚类方法以及图团体检测方法等等,也可以视具体情况而定,本专利技术实施例不做具体限制。预设个数可以为预先设定好的,例如9个类,也可以视具体情况而定,本专利技术实施例不做具体限制。
[0039]现有技术中,用于目标检测的神经网络模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:将待检测目标的数据集划分为预设个数的类,并将每个类中包含的数据按照预设聚类算法进行聚类,得到聚类结果,并将所有聚类结果汇总后作为与所述待检测目标对应的锚框的尺寸,其中,所述数据集包括所述待检测目标对应的矩形框的尺寸;对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸;将所述目标锚框尺寸作为预设目标检测算法中的锚框参数,并将所述数据集中的训练集中包含的样本依次输入至所述预设目标检测算法对应的网络中进行训练,得到对应的目标检测模型。2.根据权利要求1所述的方法,其特征在于,所述对所述锚框的尺寸进行线性尺度缩放,得到对应的目标锚框尺寸,包括:根据所述锚框的尺寸以及对应的所述数据集中的验证集中所述待检测目标对应的矩形框的尺寸,确定各锚框的尺寸分别对应的线性尺度缩放系数;将所述各锚框的尺寸与对应的线性尺度缩放系数相乘,得到对应的目标锚框尺寸。3.根据权利要求1所述的方法,其特征在于,所述待检测目标的数据集通过以下方式得到:通过图像采集设备采集所述待检测目标的图像,得到对应的图像集合;采用标注软件对所述图像集合中的每个图像进行矩形框标注,并汇总所有矩形框的尺寸,得到所述待检测目标的数据集。4.根据权利要求1

3任一项所述的方法,其特征在于,所述预设目标检测算法包括YOLOv4算法。5.一种目标检测方法,其特征在于,包括:获取待检测目标的图像数据;将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,其中,所述目标检测模型采用如权利要求1

4任一所述的方法训练得到;根据所述目标检测模型的输出结果确定所述图像数据中的待检测目标的检测结果。6.根据权利要求5所述的方法,其特征在于,将所述图像数据输入至目标检测模型中,得到所述目标检测模型的输出结果,包括:通过所述目标检测模型将所述待检测目标的图像数据划分成预设规格的网格,其中,每个网格对应预设个数的识别框;获取每个识别框的中心点的坐标、每个识别框的宽度值、每个识别框的高度值以及与每个识别框相交的目标检测框的尺寸值,其中,所述目标检测框与所述待检测目标的图像中的待检测目标相对应;根据所述中心点的坐标、所述宽度值、所述高度值以及所述目标检测框的尺寸...

【专利技术属性】
技术研发人员:兰文博张怡欢曾勇戴一凡
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1