图片标注方法、装置、终端设备及存储介质制造方法及图纸

技术编号:26259408 阅读:19 留言:0更新日期:2020-11-06 17:53
本发明专利技术公开了一种图片标注方法、装置、终端设备及存储介质,该方法包括:通过预先训练好的目标检测模型,对获取到的每一待标注图片进行目标检测,得到与每一待标注图片对应的ROI图片和ROI位置信息;根据每两张ROI图片之间的相似度对所有ROI图片进行分类,得到若干个ROI图片集合;对于每一ROI图片集合,将在预设图片集合中与该ROI图片集合中任意一张图片的相似度满足预设条件的目标图片的标签,作为该ROI图片集合中所有ROI图片的标签;对于每一待标注图片,根据与该待标注图片对应的ROI图片的标签和ROI位置信息,对该待标注图片进行标注,生成标注后的图片。采用本发明专利技术实施例,能够实现图片数据的自动标注。

【技术实现步骤摘要】
图片标注方法、装置、终端设备及存储介质
本专利技术涉及计算机
,尤其涉及一种图片标注方法、装置、终端设备及存储介质。
技术介绍
在计算机视觉领域,图片数据作为最重要的生产原料,对各种深度学习中神经网络模型的精度起着至关重要的作用。但杂乱无章的图片数据绝大多数情况下并不能为神经网络直接使用,大量标注好的、精准的图片数据才能训练出高精度的神经网络。目前,训练神经网络所需的图片数据基本上仍然采用的是人工标注的方式。本专利技术人在实施本专利技术的过程中发现,现有技术中存在以下技术问题:采用人工标注的方式进行图片标注,耗时长,效率低,人工成本高,相对于深度学习模型动辄要求几十甚至上百万的标注数据,图片标注有时候已经成为制约深度学习快速发展的最大的瓶颈,特别是在快消领域,客户往往要求对特定的商品进行快速建模,如1天内建模学习超过200种品类,如果仍然使用传统的人工标注的话基本无法实现。
技术实现思路
本专利技术实施例提供一种图片标注方法、装置、终端设备及存储介质,能有效解决现有技术中因人工标注的方式而导致的图片标注效率低、耗时长的问题。本专利技术一实施例提供一种图片标注方法,包括:获取所有待标注图片;通过预先训练好的目标检测模型,对每一所述待标注图片进行目标检测,得到与每一所述待标注图片对应的ROI图片和ROI位置信息;根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合;对于每一所述ROI图片集合,若判断到在预设图片集合中存在与该ROI图片集合中任意一张图片的相似度满足预设条件的目标图片,则将所述目标图片的标签作为该ROI图片集合中所有ROI图片的标签;对于每一所述待标注图片,若判断到存在与该待标注图片对应的ROI图片的标签,则根据与该待标注图片对应的ROI图片的标签和ROI位置信息,对该待标注图片进行标注,生成标注后的图片。作为上述方案的改进,所述根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合,具体包括:获取每一所述ROI图片的特征向量;根据每两张所述ROI图片的特征向量之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合。作为上述方案的改进,所述获取每一所述ROI图片的特征向量,具体包括:对每一所述ROI图片进行特征提取,得到每一所述ROI图片的高维特征向量;对每一所述ROI图片的高维特征向量进行降维处理,得到每一所述ROI图片的特征向量。作为上述方案的改进,所述根据每两张所述ROI图片的特征向量之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合,具体包括:步骤S01:对于每一所述ROI图片,根据该ROI图片的特征向量建立该ROI图片的索引;步骤S02:根据所有所述ROI图片的索引,建立索引列表;步骤S03:计算所述索引列表中每两条索引之间的相似度;步骤S04:对于所述索引列表中的每一条索引,在所述索引列表中查找与该索引的相似度最高的M条索引,得到相似索引集合,将所述相似索引集合中与该索引的相似度小于K的索引删除,得到更新后的相似索引集合,并根据所述更新后的相似索引集合和该索引,构建子列表;其中,K为预设相似度阈值,M为正整数;步骤S05:将得到的子列表进行组合,生成总列表;步骤S06:将所述总列表中存在交集的子列表合并,得到最终总列表;步骤S07:判断n是否等于预设聚类次数,若是,则进入步骤S08,若否,则令K=K/2,令n=n+1,将所述最终总列表作为所述索引列表,并返回步骤S04;其中,n的初始值为1;步骤S08:根据所述最终总列表,对所有所述ROI图片进行分类,得到若干个ROI图片集合。相应地,本专利技术另一实施例提供一种图片标注装置,包括:待标注图片获取模块,用于获取所有待标注图片;目标检测模块,用于通过预先训练好的目标检测模型,对每一所述待标注图片进行目标检测,得到与每一所述待标注图片对应的ROI图片和ROI位置信息;ROI图片分类模块,用于根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合;图片标签获取模块,用于对于每一所述ROI图片集合,若判断到在预设图片集合中存在与该ROI图片集合中任意一张图片的相似度满足预设条件的目标图片,则将所述目标图片的标签作为该ROI图片集合中所有ROI图片的标签;标注数据生成模块,用于对于每一所述待标注图片,若判断到存在与该待标注图片对应的ROI图片的标签,则根据与该待标注图片对应的ROI图片的标签和ROI位置信息,对该待标注图片进行标注,生成标注后的图片。作为上述方案的改进,所述ROI图片分类模块,具体包括:特征向量获取子模块,用于获取每一所述ROI图片的特征向量;图片集合获取子模块,用于根据每两张所述ROI图片的特征向量之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合。作为上述方案的改进,所述特征向量获取子模块,具体包括:特征提取单元,用于对每一所述ROI图片进行特征提取,得到每一所述ROI图片的高维特征向量;特征降维单元,用于对每一所述ROI图片的高维特征向量进行降维处理,得到每一所述ROI图片的特征向量。作为上述方案的改进,所述图片集合获取子模块,具体包括:图片索引建立单元,用于对于每一所述ROI图片,根据该ROI图片的特征向量建立该ROI图片的索引,并触发索引列表建立单元;所述索引列表建立单元,用于根据所有所述ROI图片的索引,建立索引列表,并触发索引相似度计算单元;所述索引相似度计算单元,用于计算所述索引列表中每两条索引之间的相似度,并触发子列表构建单元;所述子列表构建单元,用于对于所述索引列表中的每一条索引,在所述索引列表中查找与该索引的相似度最高的M条索引,得到相似索引集合,将所述相似索引集合中与该索引的相似度小于K的索引删除,得到更新后的相似索引集合,并根据所述更新后的相似索引集合和该索引,构建子列表;其中,K为预设相似度阈值,M为正整数;所述子列表组合单元,用于将得到的子列表进行组合,生成总列表,并触发子列表合并单元;所述子列表合并单元,用于将所述总列表中存在交集的子列表合并,得到最终总列表,并触发判断单元;所述判断单元,用于判断n是否等于预设聚类次数,若是,则触发图片分类单元,若否,则令K=K/2,令n=n+1,将所述最终总列表作为所述索引列表,并触发所述子列表构建单元;其中,n的初始值为1;所述图片分类单元,用于根据所述最终总列表,对所有所述ROI图片进行分类,得到若干个ROI图片集合。本专利技术另一实施例提供一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的图片标注方本文档来自技高网...

【技术保护点】
1.一种图片标注方法,其特征在于,包括:/n获取所有待标注图片;/n通过预先训练好的目标检测模型,对每一所述待标注图片进行目标检测,得到与每一所述待标注图片对应的ROI图片和ROI位置信息;/n根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合;/n对于每一所述ROI图片集合,若判断到在预设图片集合中存在与该ROI图片集合中任意一张图片的相似度满足预设条件的目标图片,则将所述目标图片的标签作为该ROI图片集合中所有ROI图片的标签;/n对于每一所述待标注图片,若判断到存在与该待标注图片对应的ROI图片的标签,则根据与该待标注图片对应的ROI图片的标签和ROI位置信息,对该待标注图片进行标注,生成标注后的图片。/n

【技术特征摘要】
1.一种图片标注方法,其特征在于,包括:
获取所有待标注图片;
通过预先训练好的目标检测模型,对每一所述待标注图片进行目标检测,得到与每一所述待标注图片对应的ROI图片和ROI位置信息;
根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合;
对于每一所述ROI图片集合,若判断到在预设图片集合中存在与该ROI图片集合中任意一张图片的相似度满足预设条件的目标图片,则将所述目标图片的标签作为该ROI图片集合中所有ROI图片的标签;
对于每一所述待标注图片,若判断到存在与该待标注图片对应的ROI图片的标签,则根据与该待标注图片对应的ROI图片的标签和ROI位置信息,对该待标注图片进行标注,生成标注后的图片。


2.如权利要求1所述的图片标注方法,其特征在于,所述根据每两张所述ROI图片之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合,具体包括:
获取每一所述ROI图片的特征向量;
根据每两张所述ROI图片的特征向量之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合。


3.如权利要求2所述的图片标注方法,其特征在于,所述获取每一所述ROI图片的特征向量,具体包括:
对每一所述ROI图片进行特征提取,得到每一所述ROI图片的高维特征向量;
对每一所述ROI图片的高维特征向量进行降维处理,得到每一所述ROI图片的特征向量。


4.如权利要求2所述的图片标注方法,其特征在于,所述根据每两张所述ROI图片的特征向量之间的相似度,对所有所述ROI图片进行分类,得到若干个ROI图片集合,具体包括:
步骤S01:对于每一所述ROI图片,根据该ROI图片的特征向量建立该ROI图片的索引;
步骤S02:根据所有所述ROI图片的索引,建立索引列表;
步骤S03:计算所述索引列表中每两条索引之间的相似度;
步骤S04:对于所述索引列表中的每一条索引,在所述索引列表中查找与该索引的相似度最高的M条索引,得到相似索引集合,将所述相似索引集合中与该索引的相似度小于K的索引删除,得到更新后的相似索引集合,并根据所述更新后的相似索引集合和该索引,构建子列表;其中,K为预设相似度阈值,M为正整数;
步骤S05:将得到的子列表进行组合,生成总列表;
步骤S06:将所述总列表中存在交集的子列表合并,得到最终总列表;
步骤S07:判断n是否等于预设聚类次数,若是,则进入步骤S08,若否,则令K=K/2,令n=n+1,将所述最终总列表作为所述索引列表,并返回步骤S04;其中,n的初始值为1;
步骤S08:根据所述最终总列表,对所有所述ROI图片进行分类,得到若干个ROI图片集合。


5.一种图片标注装置,其特征在于,包括:
待标注图片获取模块,用于获取所有待标注图片;
目标检测模块,用于通过预先训练好的目标检测模型,对每一所述待标注图片进行目标检测,得到与每一所述待标注图片对应的ROI图片和ROI位置信息;
ROI图片分类模块,用于根据每两张所述ROI图片之间的相似度,对所有所述R...

【专利技术属性】
技术研发人员:陈应文丁明李海荣陈永辉
申请(专利权)人:广州市玄武无线科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1