图片标注方法、装置及设备制造方法及图纸

技术编号:22688937 阅读:17 留言:0更新日期:2019-11-30 03:35
本发明专利技术实施例提供一种图片标注方法、装置及设备。该方法包括:获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;根据标签关系集合确定图片数据集中各个图片的标签。本发明专利技术实施例的方法,提高了图片标注的速度和准确率,解决了现有图片标注方法耗时耗力且准确率较低的问题。

Method, device and equipment of picture annotation

The embodiment of the invention provides a picture annotation method, device and device. The method includes: obtaining the label relationship of the preset number of picture pairs in the picture data set, and the label relationship is used to indicate whether the picture pairs have the same label; determining the label relationship set of the picture data set according to the label relationship of the preset number of picture pairs and the transitivity of the label relationship; determining the labels of each picture in the picture data set according to the label relationship set. The method of the embodiment of the invention improves the speed and accuracy of picture annotation, and solves the problem of time-consuming and low accuracy of the existing picture annotation method.

【技术实现步骤摘要】
图片标注方法、装置及设备
本专利技术实施例涉及数据处理
,具体涉及图片标注方法、装置及设备。
技术介绍
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。近年来,随着人工智能的快速发展,机器学习作为一种实现人工智能的重要方式也获得的飞速的发展。机器学习通过选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策略,运用合适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。为了获得高质量的模型,需要大量的已标注数据作为样本数据,用于对模型进行训练。目前对数据的标注工作通常由人工完成。以图片识别任务为例,为了进行图片识别模型的训练,需要对大量图片进行标注,标注出各个图片对应的标签。通常每个标签需要对应多张图像,才可以进行图片识别模型的训练。在对图片进行标注的过程中,标注用户需要判断每张图片属于哪个标签,从而进行标注。若待标注的图片数据集中对应着大量的标签,由于人的记忆有限,无法准确记忆每个标签的详细信息,故难以对图片进行正确标注,逐一对比又极为耗时。综上所述,现有的图片标注方法不仅耗时耗力,而且标注的准确率较低。
技术实现思路
本专利技术实施例提供一种图片标注方法、装置及设备,用于提高图片标注的速度和准确率,用以解决现有图片标注方法耗时耗力且准确率较低的问题。第一方面,本专利技术实施例提供一种图片标注方法,包括:获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;>根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;根据标签关系集合确定图片数据集中各个图片的标签。第二方面,本专利技术实施例提供一种图片标注装置,包括:获取模块,用于获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;处理模块,用于根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;标注模块,用于根据标签关系集合确定图片数据集中各个图片的标签。第三方面,本专利技术实施例提供一种电子设备,包括:至少一个处理器和存储器;存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面任一项所述的图片标注方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项所述的图片标注方法。本专利技术实施例提供的图片标注方法、装置及设备,通过首先获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签,然后根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合,最后根据标签关系集合确定图片数据集中各个图片的标签,实现了对图片数据集中各图片的标注,减少了人工工作量。通过获取少量图片对的标签关系,充分利用标签关系的传递性,完成对图片的标注,提高了图片标注速度;且借助于可靠的标签关系的传递性,可以提高图片标注的准确性。附图说明图1为本专利技术提供的图片标注方法一实施例的流程图;图2为本专利技术提供的图片标注方法又一实施例的流程图;图3A-3D为本专利技术一实施例提供的图片标注过程示意图;图4为本专利技术提供的图片标注装置一实施例的结构示意图;图5为本专利技术提供的电子设备一实施例的结构示意图。具体实施方式下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。图1为本专利技术提供的图片标注方法一实施例的流程图,如图1所示,本实施例提供的方法可以包括:S101、获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签。本实施例中的图片数据集为待标注的图片数据集,可以由所有待标注图片组成。图片数据集中任意两张图片可以组成一个图片对。对于一个由N张图片组成的图片数据集,其图片对的总数量为本实施例中预设数量的具体取值可以根据图片数据集中含有的图片对的数量确定。例如,当图片数据集中的图片数量较大时,可以将预设数量的取值,设为图片数据集的图片对数量的十分之一。本实施例中的标签关系用于表示图片对是否具有相同标签,标签关系的取值范围可以根据具体需要进行设置。例如,以Rij表示由图片i和图片j组成的图片对的标签关系,Rij=1表示图片i和图片j具有相同的标签,Rij=0表示图片i和图片j具有不同的标签。需要说明的是,本实施例中图片的标签取值需要根据具体的标注任务进行确定,本实施例对此不作限制。以人脸识别为例,图片的标签可以为图片中人物的姓名,例如张三、李四等;以图片类型识别为例,图片的标签例如可以为人物、动物、建筑物、自然风景等。本实施例中采用的是图片对的标签关系,而并非图片对的标签。无论是对于人工标注还是机器标注来说,获得图片对的标签关系都要比获得图片对的标签容易且迅速的多。举例来说,判断两张图片是否属于同一人(图片对的标签关系),要比分别确定这两张图片中的人是谁(图片对的标签)容易且快速的多。S102、根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合。本实施例中在获取到预设数量图片对的标签关系之后,便可以根据所获取到的标签关系以及标签关系的传递性,确定图片数据集中其他相关的图片对的标签关系。本实施例中标签关系的传递性例如可以包括:若第一图片与第二图片具有相同标签,第二图片与第三图片具有相同标签,则第一图片与第三图片具有相同标签;若第四图片与第五图片具有不同标签,第五图片与第六图片具有相同标签,则第四图片与第六图片具有不同标签。标签关系的传递性可以用如下公式进行表示(公式中符号的定义参照步骤S101):本文档来自技高网...

【技术保护点】
1.一种图片标注方法,其特征在于,包括:/n获取图片数据集中预设数量图片对的标签关系,所述标签关系用于表示图片对是否具有相同标签;/n根据所述预设数量图片对的标签关系以及标签关系的传递性,确定所述图片数据集的标签关系集合;/n根据所述标签关系集合确定所述图片数据集中各个图片的标签。/n

【技术特征摘要】
1.一种图片标注方法,其特征在于,包括:
获取图片数据集中预设数量图片对的标签关系,所述标签关系用于表示图片对是否具有相同标签;
根据所述预设数量图片对的标签关系以及标签关系的传递性,确定所述图片数据集的标签关系集合;
根据所述标签关系集合确定所述图片数据集中各个图片的标签。


2.如权利要求1所述的方法,其特征在于,所述标签关系的传递性包括:
若第一图片与第二图片具有相同标签,第二图片与第三图片具有相同标签,则第一图片与第三图片具有相同标签;
若第四图片与第五图片具有不同标签,第五图片与第六图片具有相同标签,则第四图片与第六图片具有不同标签。


3.如权利要求1所述的方法,其特征在于,所述获取图片数据集中预设数量图片对的标签关系包括:
获取所述图片数据集的标签相似度集合,所述标签相似度集合包括所述图片数据集中所有图片对的标签相似度,所述标签相似度用于表示图片对具有相同标签的置信度;
根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系。


4.如权利要求3所述的方法,其特征在于,所述获取所述图片数据集的标签相似度集合,包括:
获取所述图片数据集中每一张图片的特征向量,根据如下公式确定图片对的标签相似度:



其中,Fi表示第i张图片的特征向量,Fj表示第j张图片的特征向量,‖Fi‖表示Fi的模,||Fj||表示Fj的模,Cij表示第i张图片与第j张图片的标签相似度。


5.如权利要求3所述的方法,其特征在于,所述根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系,包括:
根据所述标签相似度集合,按照标签相似度从高到低的顺序,从所述图片数...

【专利技术属性】
技术研发人员:张浩徐明邵新庆刘强宋咏君
申请(专利权)人:深圳力维智联技术有限公司南京中兴力维软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1