System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据标注方法、装置、设备、介质以及程序产品制造方法及图纸_技高网

数据标注方法、装置、设备、介质以及程序产品制造方法及图纸

技术编号:42868966 阅读:1 留言:0更新日期:2024-09-27 17:30
本说明书实施例提供了数据标注方法、装置、计算设备、计算机可读存储介质以及计算机程序,其中数据标注方法包括:获取待标注的数据样本和数据样本的第一标注信息;第一标注信息是基于第一目标检测模型对数据样本进行识别得到的;第一标注信息用于表示数据样本中包含的待识别对象的识别结果;将数据样本输入至不同于第一目标检测模型的第二目标检测模型,得到数据样本的第二标注信息;将第一标注信息和第二标注信息中不一致的信息确定为第一异常信息;向第一数据标注人员提供数据样本和第一异常信息;获取第一数据标注人员提供的根据第一异常信息对第二标注信息进行查改后得到的第三标注信息。由此,提供了高效且准确性高的数据标注方法。

【技术实现步骤摘要】

本说明书实施例涉及人工智能,特别涉及一种数据标注方法、装置、计算设备、计算机可读存储介质以及计算机程序。


技术介绍

1、数据标注是机器学习和人工智能领域中一个至关重要的过程。数据标注涉及将原始数据与精确的信息标签相结合,从而为训练机器学习模型提供“学习样本”。这些标签后续会被机器学习算法用作学习的依据,以便模型能够识别出未标记数据中的相似模式或特性。数据标注的准确性直接影响到最终机器学习模型的性能。因此,高质量的数据标注对于开发有效的人工智能应用至关重要。

2、传统情况下,数据标注依赖于人工,但是,人工标注存在效率较低的问题。在一些方案中,可以使用机器学习技术进行数据标注,但是,当前依赖机器学习模型做标注的方案存在标注精度低、漏标错标等问题。

3、因此,需要提供高效且准确性高的数据标注方法。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种数据标注方法。本说明书一个或者多个实施例同时涉及一种数据标注装置、一种计算设备、一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种数据标注方法,包括:

3、获取待标注的数据样本和所述数据样本的第一标注信息;所述第一标注信息是基于第一目标检测模型对所述数据样本进行识别得到的;所述第一标注信息用于表示所述数据样本中包含的待识别对象的识别结果;

4、将所述数据样本输入至不同于所述第一目标检测模型的第二目标检测模型,得到所述数据样本的第二标注信息;

5、将所述第一标注信息和所述第二标注信息中不一致的信息确定为第一异常信息;

6、向第一数据标注人员提供所述数据样本和所述第一异常信息;

7、获取所述第一数据标注人员提供的根据所述第一异常信息对所述第二标注信息进行查改后得到的第三标注信息。

8、根据本说明书实施例的第二方面,提供了一种数据标注装置,包括:

9、数据获取模块,用于获取待标注的数据样本和所述数据样本的第一标注信息;所述第一标注信息是基于第一目标检测模型对所述数据样本进行识别得到的;所述第一标注信息用于表示所述数据样本中包含的待识别对象的识别结果;

10、模型检测模块,用于将所述数据样本输入至不同于所述第一目标检测模型的第二目标检测模型,得到所述数据样本的第二标注信息;

11、异常识别模块,用于将所述第一标注信息和所述第二标注信息中不一致的信息确定为第一异常信息;

12、第一交互模块,用于向第一数据标注人员提供所述数据样本和所述第一异常信息;

13、第二交互模块,用于获取所述第一数据标注人员提供的根据所述第一异常信息对所述第二标注信息进行查改后得到的第三标注信息。

14、根据本说明书实施例的第三方面,提供了一种计算设备,包括:

15、存储器和处理器;

16、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述数据标注方法的步骤。

17、根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述数据标注方法的步骤。

18、根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述数据标注方法的步骤。

19、本说明书一个实施例至少能够达到以下有益效果:通过使用两个不同的目标检测模型对数据样本进行对象识别,且针对两模型识别结果存在差异的对象的标注信息进行人工查改,提供了高效且准确性高的数据标注方法。

本文档来自技高网...

【技术保护点】

1.一种数据标注方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,获取所述数据样本的第一标注信息之前,还包括:

3.如权利要求1所述的方法,其特征在于,获取所述数据样本的第一标注信息之前,还包括:

4.如权利要求1所述的方法,其特征在于,所述获取所述第一数据标注人员提供的根据所述第一异常信息对所述第二标注信息进行查改后得到的第三标注信息之后,还包括:

5.如权利要求4所述的方法,其特征在于,所述获取所述第二数据标注人员提供的根据所述第二异常信息对所述第五标注信息进行查改后得到的第六标注信息之后,还包括:

6.如权利要求5所述的方法,其特征在于,所述基于所述第六标注信息和所述第五标注信息,从所述数据样本中确定出识别效果满足第一预设条件的目标数据样本,具体包括:

7.如权利要求5所述的方法,其特征在于,所述获取所述第三数据标注人员提供的在所述第六标注信息的基础上对所述目标数据样本的标注信息进行查改后得到的第七标注信息之后,还包括:

8.如权利要求1所述的方法,其特征在于,所述数据样本包括图像样本。

9.如权利要求8所述的方法,其特征在于,所述图像样本包括用户界面图像;所述待识别对象包括用户界面组件。

10.一种数据标注装置,其特征在于,包括:

11.一种计算设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9中任意一项所述数据标注方法的步骤。

13.一种计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令计算机执行权利要求1至9中任意一项所述数据标注方法的步骤。

...

【技术特征摘要】

1.一种数据标注方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,获取所述数据样本的第一标注信息之前,还包括:

3.如权利要求1所述的方法,其特征在于,获取所述数据样本的第一标注信息之前,还包括:

4.如权利要求1所述的方法,其特征在于,所述获取所述第一数据标注人员提供的根据所述第一异常信息对所述第二标注信息进行查改后得到的第三标注信息之后,还包括:

5.如权利要求4所述的方法,其特征在于,所述获取所述第二数据标注人员提供的根据所述第二异常信息对所述第五标注信息进行查改后得到的第六标注信息之后,还包括:

6.如权利要求5所述的方法,其特征在于,所述基于所述第六标注信息和所述第五标注信息,从所述数据样本中确定出识别效果满足第一预设条件的目标数据样本,具体包括:

7.如权利要求...

【专利技术属性】
技术研发人员:杨帆徐锦玲刘洋吴通通张天宇张林赵薇柳景明
申请(专利权)人:北京看云软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1