一种数据打标签方法、计算机装置及可读存储介质制造方法及图纸

技术编号：26890641 阅读：26 留言：0更新日期：2020-12-29 16:07

本发明专利技术实施例提供了一种数据打标签方法、计算机装置和可读存储介质。数据打标签方法包括：接收，通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签，所得到的所述训练数据的第一标注文件；接收，通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签，所得到的所述训练数据的第二标注文件；比较所述第一标注文件和所述第二标注文件，以得到比较结果。所述数据打标签方法通过比较所述第一标注文件和第二标注文件，可以对第一数据标注算法进行完善或者更新。利用完善或更新后的第一数据标注算法(也即第二数据标注算法)对后续的待标注数据中的多个目标主体的多个对象添加标签，提高了数据标注的效率，减少了耗时和人力成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据打标签方法、计算机装置及可读存储介质
本专利技术属于数据处理
，尤其涉及一种数据打标签方法、计算机装置及计算机可读存储介质。
技术介绍
相关技术中，随着计算机技术的迅速发展，人工智能在机器人学习、图像识别、语音理解、自动驾驶、在线问诊和智能医疗等领域得到了广泛应用。人工智能的规模化、成熟化应用是以海量的数据作为支撑，数据的质量在一定程度上决定了人工智能的“智能化”程度。在对机器学习模型进行训练之前，通常需要准备训练数据，对训练数据进行标注。一般对数据进行标注的方法是人工标注方式。由于涉及的训练数据样本成千上万，有的时候甚至达到百万级或更高，依靠人工去标注这数量级的数据是非常消耗人力和时间的，导致数据标注的耗时长、人力成本高。随后，出现了通过数据标注算法来自动对训练数据进行标注，然而，通过数据标注算法自动对训练数据进行标注常常会导致很多标注错误，因此现有技术中，急需对数据标注算法进行完善或者更新。
技术实现思路
根据本专利技术实施例的第一方面，提供一种数据打标签方法，包括：接收，通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签，所得到的所述训练数据的第一标注文件；接收，通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作，所得到的所述训练数据的第二标注文件；比较所述第一标注文件和所述第二标注文件，以得到比较结果。可选地，所述比较第一标注文...

【技术保护点】
1.一种数据打标签方法，其特征在于，包括：/n接收，通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签，所得到的所述训练数据的第一标注文件；/n接收，通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作，所得到的所述训练数据的第二标注文件；/n比较所述第一标注文件和所述第二标注文件，以得到比较结果。/n

【技术特征摘要】
1.一种数据打标签方法，其特征在于，包括：
接收，通过第一数据标注算法对训练数据中的多个目标主体的多个对象添加标签，所得到的所述训练数据的第一标注文件；
接收，通过人工方式对所述训练数据中的所述多个目标主体的多个对象添加标签或者通过人工方式对所述第一标注文件中已添加标签的所述多个目标主体的多个对象进行标签修正操作，所得到的所述训练数据的第二标注文件；
比较所述第一标注文件和所述第二标注文件，以得到比较结果。

2.根据权利要求1所述的数据打标签方法，其特征在于，所述比较第一标注文件和所述第二标注文件，以得到比较结果的步骤包括：
比较所述第一标注文件和所述第二标注文件；
如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签匹配，则将所述第一标注文件或者第二标注文件作为所述训练数据的标注文件；或者
如果所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配，则将所述第二标注文件作为所述训练数据的标注文件。

3.根据权利要求2所述的数据打标签方法，其特征在于，所述第一标注文件和所述第二标注文件中多个目标主体的多个对象添加的标签不匹配，包括：
与所述第二标注文件相比，所述第一标注文件中缺少至少一个所述目标主体的至少一个对象的标签；或者
与所述第二标注文件相比，所述第一标注文件中错误添加至少一个所述目标主体的至少一个对象的标签；或者
与所述第二标注文件相比，所述第一标注文件中至少一个所述目标主体的至少一个对象的标签的位置坐标值错误。

4.根据权利要求1所述的数据打标签方法，其特征在于，所述数据打标签方法还包括：
基于所述比较结果，对所述第一数据标注算法进行优化调整，以得到第二数据标注算法；以及
利用所述第二数据标注算法来对后续的待标注数据中的多个目标主体的多个对象添加标签。

5.根据权利要求4所述的数据打标签方法，其特征在于，所述基于比较结果，对所述第一数据标注算法进行优化调整，以得...

【专利技术属性】
技术研发人员：刘若鹏，栾琳，季春霖，陈九思，
申请(专利权)人：杭州光启人工智能研究院，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人