实现IA的数据标注方法和装置制造方法及图纸

技术编号:35681000 阅读:43 留言:0更新日期:2022-11-23 14:23
本公开提出一种实现IA的数据标注方法和装置,该方法包括:创建标注待标注数据集的标注任务;其中,标注任务包括标注待标注数据集的目标人工智能AI能力;接收对所述标注任务中所述待标注数据集的标注请求;响应于标注请求,通过第一接口调用目标AI能力对应的标注平台标注待标注数据集,得到标注结果;通过第二接口保存标注结果。采用本公开提供的方法可以简化数据标定过程,提高数据标注效率,提高用户体验。户体验。户体验。

【技术实现步骤摘要】
实现IA的数据标注方法和装置


[0001]本公开涉及人工智能
,尤其涉及一种实现IA的数据标注方法和装置。

技术介绍

[0002]机器人流程自动化(Robotic Process Automation,RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]智能自动化(Intelligent Automation,IA)是一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(Optical Character Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(Machine Learning,ML)、自然语言处理(Natural Language Processing,NLP)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(Computer Vision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据的含义,使用数据来管理和优化业务流程的整个历程。
[0005]相关业务中,机器学习平台标注任务通常需要在第三方标注工具进行。但由于不同的深度学习模型对标注数据的要求通常不同,故而,当需要通过不同AI能力对应的标注工具标注数据时,需要人工先后调用每个AI能力对应的标注工具进行数据标注,如此,会导致数据标注过程较为繁琐,数据标注效率较低。

技术实现思路

[0006]本公开实施例提供一种实现IA的数据标注方法和装置,以解决相关技术存在的问题,技术方案如下:
[0007]第一方面,本公开实施例提供了一种实现IA的数据标注方法,包括:
[0008]创建标注待标注数据集的标注任务;其中,所述标注任务包括标注所述待标注数据集的目标人工智能AI能力;
[0009]接收对所述标注任务中所述待标注数据集的标注请求;
[0010]响应于所述标注请求,通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,得到标注结果;
[0011]通过第二接口保存所述标注结果。
[0012]在一种实施方式中,所述响应于所述标注请求,通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,得到标注结果,包括:
[0013]响应于所述标注请求,通过第一接口从所述待标注数据集中获取第i条待标注数据;其中,i∈(1,I),I为所述待标注数据集中包括的待标注数据的数量;
[0014]通过所述第一接口调用所述目标AI能力标注所述第i条待标注数据,得到所述第i
条待标注数据的标注结果。
[0015]在一种实施方式中,所述方法还包括:
[0016]为所述第i条待标注数据设置标注权限;其中,所述标注权限用于指示所述第i条待标注数据在预设标注时段内,只能被所述标注请求对应的用户标注。
[0017]在一种实施方式中,所述通过所述第一接口调用所述目标AI能力标注所述第i条待标注数据,包括:
[0018]在所述第i条待标注数据包括条目数据时,通过所述第一接口调用所述目标AI能力标注利用第一标注组件标注所述条目数据;其中,所述第一标注组件包括矩形标注组件、多边形框选标注组件中的至少一个;
[0019]在所述第i条待标注数据包括印章数据时,通过所述第一接口调用所述目标AI能力标注利用第二标注组件标注所述印章数据;其中,所述第二标注组件包括椭圆标注组件、线段标注组件中的至少一个;
[0020]在所述第i条待标注数据包括长文本数据时,通过所述第一接口调用所述目标AI能力标注利用第三标注组件标注所述长文本数据;其中,所述第三标注组件包括框选标注组件和划词标注组件。
[0021]在一种实施方式中,所述创建标注待标注数据集的标注任务,包括:
[0022]接收标注所述待标注数据集的标注任务创建请求:其中,所述标注任务创建请求包括所述待标注数据集的数据集标识以及所述目标AI能力;
[0023]响应于所述标注任务创建请求,获取所述数据集标识对应的所述待标注数据集;
[0024]创建通过所述目标AI能力标注所述待标注数据集的标注任务。
[0025]在一种实施方式中,所述方法还包括:
[0026]在创建所述标注任务后,将所述待标注数据集对应的待标注状态下的待标注数据条数设置为I;
[0027]在得到所述第i条待标注数据的标注结果后,获取已标注完成的待标注数据的数量l;
[0028]将所述待标注数据集对应的待标注状态下的待标注数据条数更新为I

l;
[0029]将所述待标注数据集对应的已标注状态下的数据条数更新为l。
[0030]在一种实施方式中,所述通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,包括:
[0031]通过第一接口调用所述目标AI能力对应的标注平台获取创建所述标注任务的第一用户信息;
[0032]确定所述目标AI能力对应的标注平台中是否存在所述用户信息对应的第二用户信息;
[0033]在所述目标AI能力对应的标注平台中不存在所述第二用户信息的情况下,创建所述第二用户信息;
[0034]获取所述第二用户信息对应的鉴权参数;
[0035]基于所述第二用户信息对应的鉴权参数,确定所述第二用户信息是否具有通过所述第一接口调用所述目标AI能力的权限;
[0036]在所述第二用户信息对应的鉴权参数具有通过所述第一接口调用所述目标AI能
力的权限的情况下,通过所述第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集。
[0037]在一种实施方式中,所述通过第二接口保存所述标注结果,包括:
[0038]接收对所述标注任务的提交请求;
[0039]响应于对所述标注任务的提交请求,通过第二接口调用所述目标AI能力对应的标注平台的接口导出所述标注结果;
[0040]保存所述标注结果。
[0041]在一种实施方式中,所述通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,得到标注结果,包括:
[0042]通过所述第一接口调用预设标注模型对所述待标注数据集进行预标注,得到预标注后的待标注数据集;
[0043]通过所述第一接口调用所述目标AI能力对应的标注平台标注所述预标注后的待标注数据集,得到所述标注结果。
[0044]在一种实施方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实现IA的数据标注方法,其特征在于,包括:创建标注待标注数据集的标注任务;其中,所述标注任务包括标注所述待标注数据集的目标人工智能AI能力;接收对所述标注任务中所述待标注数据集的标注请求;响应于所述标注请求,通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,得到标注结果;通过第二接口保存所述标注结果。2.根据权利要求1所述的方法,其特征在于,所述响应于所述标注请求,通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,得到标注结果,包括:响应于所述标注请求,通过第一接口从所述待标注数据集中获取第i条待标注数据;其中,i∈(1,I),I为所述待标注数据集中包括的待标注数据的数量;通过所述第一接口调用所述目标AI能力标注所述第i条待标注数据,得到所述第i条待标注数据的标注结果。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:为所述第i条待标注数据设置标注权限;其中,所述标注权限用于指示所述第i条待标注数据在预设标注时段内,只能被所述标注请求对应的用户标注。4.根据权利要求2所述的方法,其特征在于,所述通过所述第一接口调用所述目标AI能力标注所述第i条待标注数据,包括:在所述第i条待标注数据包括条目数据时,通过所述第一接口调用所述目标AI能力利用第一标注组件标注所述条目数据;其中,所述第一标注组件包括矩形标注组件、多边形框选标注组件中的至少一个;在所述第i条待标注数据包括印章数据时,通过所述第一接口调用所述目标AI能力利用第二标注组件标注所述印章数据;其中,所述第二标注组件包括椭圆标注组件、线段标注组件中的至少一个;在所述第i条待标注数据包括长文本数据时,通过所述第一接口调用所述目标AI能力利用第三标注组件标注所述长文本数据;其中,所述第三标注组件包括框选标注组件和划词标注组件。5.根据权利要求1所述的方法,其特征在于,所述创建标注待标注数据集的标注任务,包括:接收标注所述待标注数据集的标注任务创建请求:其中,所述标注任务创建请求包括所述待标注数据集的数据集标识以及所述目标AI能力;响应于所述标注任务创建请求,获取所述数据集标识对应的所述待标注数据集;创建通过所述目标AI能力标注所述待标注数据集的标注任务。6.根据权利要求2所述的方法,其特征在于,所述方法还包括:在创建所述标注任务后,将所述待标注数据集对应的待标注状态下的待标注数据条数设置为I;在得到所述第i条待标注数据的标注结果后,获取已标注完成的待标注数据的数量l;将所述待标注数据集对应的待标注状态下的待标注数据条数更新为I

l;将所述待标注数据集对应的已标注状态下的数据条数更新为l。
7.根据权利要求1所述的方法,其特征在于,所述通过第一接口调用所述目标AI能力对应的标注平台标注所述待标注数据集,包括:通过第一接口调用所述目标AI能力对应的标注平台获取创建所述标注任务的第一用户信息;确定所述目标AI能力对应的标注平台中是否存在所述第一用户信息对应的第二用户信...

【专利技术属性】
技术研发人员:董梦囡马传佳梁杰刚王建周
申请(专利权)人:来也科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1