一种数据打标签方法、计算机装置及可读存储介质制造方法及图纸

技术编号:26890641 阅读:26 留言:0更新日期:2020-12-29 16:07
本发明专利技术实施例提供了一种数据打标签方法、计算机装置和可读存储介质。数据打标签方法包括:接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件;接收,通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签,所得到的所述训练数据的第二标注文件;比较所述第一标注文件和所述第二标注文件,以得到比较结果。所述数据打标签方法通过比较所述第一标注文件和第二标注文件,可以对第一数据标注算法进行完善或者更新。利用完善或更新后的第一数据标注算法(也即第二数据标注算法)对后续的待标注数据中的多个目标主体的多个对象添加标签,提高了数据标注的效率,减少了耗时和人力成本。

【技术实现步骤摘要】
一种数据打标签方法、计算机装置及可读存储介质
本专利技术属于数据处理
,尤其涉及一种数据打标签方法、计算机装置及计算机可读存储介质。
技术介绍
相关技术中,随着计算机技术的迅速发展,人工智能在机器人学习、图像识别、语音理解、自动驾驶、在线问诊和智能医疗等领域得到了广泛应用。人工智能的规模化、成熟化应用是以海量的数据作为支撑,数据的质量在一定程度上决定了人工智能的“智能化”程度。在对机器学习模型进行训练之前,通常需要准备训练数据,对训练数据进行标注。一般对数据进行标注的方法是人工标注方式。由于涉及的训练数据样本成千上万,有的时候甚至达到百万级或更高,依靠人工去标注这数量级的数据是非常消耗人力和时间的,导致数据标注的耗时长、人力成本高。随后,出现了通过数据标注算法来自动对训练数据进行标注,然而,通过数据标注算法自动对训练数据进行标注常常会导致很多标注错误,因此现有技术中,急需对数据标注算法进行完善或者更新。
技术实现思路
根据本专利技术实施例的第一方面,提供一种数据打标签方法,包括:接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件;接收,通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作,所得到的所述训练数据的第二标注文件;比较所述第一标注文件和所述第二标注文件,以得到比较结果。可选地,所述比较第一标注文件和所述第二标注文件,以得到比较结果的步骤包括:比较所述第一标注文件和所述第二标注文件;如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签匹配,则将所述第一标注文件或者第二标注文件作为所述训练数据的标注文件;或者如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配,则将所述第二标注文件作为所述训练数据的标注文件。可选地,所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配,包括:与所述第二标注文件相比,所述第一标注文件中缺少至少一个所述目标主体的至少一个对象的标签;或者与所述第二标注文件相比,所述第一标注文件中错误添加至少一个所述目标主体的至少一个对象的标签;或者与所述第二标注文件相比,所述第一标注文件中至少一个所述目标主体的至少一个对象的标签的位置坐标值错误。可选地,所述数据打标签方法还包括:基于所述比较结果,对所述第一数据标注算法进行优化调整,以得到第二数据标注算法;以及利用所述第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签。可选地,所述基于比较结果,对所述第一数据标注算法进行优化调整,以得到第二数据标注算法,包括:如果所述第一标注文件和所述第二标注文件中所述多个目标主体的所述多个对象添加的标签匹配,则不对所述第一数据标注算法进行优化调整;或者如果所述第一标注文件和所述第二标注文件中所述多个目标主体的所述多个对象添加的标签不匹配,则根据不匹配信息对所述第一数据标注算法进行优化调整,以得到所述第二数据标注算法。可选地:所述多个目标主体的多个对象包括多个人物的多个服饰对象或多个五官对象;或者所述多个目标主体的多个对象包括多个车辆的多个对象。可选地,所述训练数据包括多个图片,所述数据打标签方法还包括:利用图像分割工具对每个图片进行图像分割,以得到所述图片中每个目标主体的多个对象的多个图像分割文件;将所述图片中每个目标主体的多个对象的多个图像分割文件存储在同一个文件夹。可选地,所述接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件,包括:接收,通过第一数据标注算法对训练数据中的每个目标主体的多个对象的多个图像分割文件添加标签,所得到的所述训练数据的第一标注文件;所述接收,通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签,所得到的所述训练数据的第二标注文件,包括:接收,通过人工方式对训练数据中的每个目标主体的多个对象的多个图像分割文件添加标签,所得到的所述训练数据的第一标注文件。根据本专利技术实施例的第二方面,提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上所述数据打标签方法的步骤。根据本专利技术实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述数据打标签方法的步骤。根据本专利技术实施例的第四方面,提供一种计算机程序产品,包括计算机程序产品,所述计算机程序包括程序指令,当所述程序指令被终端设备执行时,使所述终端设备执行上述数据打标签方法的步骤。本专利技术的实施例提供的技术方案可以至少包括以下有益效果:1)利用第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签。通过第一数据标注算法和人工对同样的训练数据进行数据标注,比较第一标注文件和第二标注文件,根据比较结果,对第一数据标注算法的参数进行调整优化,得到第二数据标注算法,提高了第二数据标注算法的性能参数,进而提高了第二数据标注算法对后续待标注数据标注的准确率。2)当对训练数据的数据标注准确度达到一定准确值后,才能使用第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签。利用第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签,提高了数据标注的效率,减少了耗时和人力成本。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据本专利技术实施例示出的数据打标签方法的流程图。图2是根据本专利技术具体实施例示出的数据打标签方法的流程图。图3是根据一示例性实施例示出的处理器和存储器的结构图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据本专利技术实施例示出的数据打标签方法100的流程图。具体包括以下步骤:步骤S110,接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件。在该步骤中,利用第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,得到该训练数据的第一标注文件。第一数据标注算法是编程人员根据该第一数据标注算法的本文档来自技高网...

【技术保护点】
1.一种数据打标签方法,其特征在于,包括:/n接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件;/n接收,通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作,所得到的所述训练数据的第二标注文件;/n比较所述第一标注文件和所述第二标注文件,以得到比较结果。/n

【技术特征摘要】
1.一种数据打标签方法,其特征在于,包括:
接收,通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签,所得到的所述训练数据的第一标注文件;
接收,通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作,所得到的所述训练数据的第二标注文件;
比较所述第一标注文件和所述第二标注文件,以得到比较结果。


2.根据权利要求1所述的数据打标签方法,其特征在于,所述比较第一标注文件和所述第二标注文件,以得到比较结果的步骤包括:
比较所述第一标注文件和所述第二标注文件;
如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签匹配,则将所述第一标注文件或者第二标注文件作为所述训练数据的标注文件;或者
如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配,则将所述第二标注文件作为所述训练数据的标注文件。


3.根据权利要求2所述的数据打标签方法,其特征在于,所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配,包括:
与所述第二标注文件相比,所述第一标注文件中缺少至少一个所述目标主体的至少一个对象的标签;或者
与所述第二标注文件相比,所述第一标注文件中错误添加至少一个所述目标主体的至少一个对象的标签;或者
与所述第二标注文件相比,所述第一标注文件中至少一个所述目标主体的至少一个对象的标签的位置坐标值错误。


4.根据权利要求1所述的数据打标签方法,其特征在于,所述数据打标签方法还包括:
基于所述比较结果,对所述第一数据标注算法进行优化调整,以得到第二数据标注算法;以及
利用所述第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签。


5.根据权利要求4所述的数据打标签方法,其特征在于,所述基于比较结果,对所述第一数据标注算法进行优化调整,以得...

【专利技术属性】
技术研发人员:刘若鹏栾琳季春霖陈九思
申请(专利权)人:杭州光启人工智能研究院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1