一种用于定位界面上元素位置的方法、介质及电子设备技术

技术编号：36189569 阅读：16 留言：0更新日期：2022-12-31 21:01

本申请实施例提供一种用于定位界面上元素位置的方法、介质及电子设备，该方法包括：将待操作界面的图像输入目标检测模型，并通过所述目标检测模型获取所述待操作界面上的所有元素以及元素聚合结果，其中，所述元素聚合结果采用聚合框表征；至少根据所述聚合框的属性信息构建与所述待操作界面对应的元素结构树，以使机器人根据所述元素结构树完成针对所述待操作界面上元素的定位；其中，所述元素结构树包括位于底层的叶节点以及各级父节点，所述底层的叶节点为所述所有元素，所述元素结构树中的一个父节点对应一个聚合框。本申请的实施例采用端到端的检测出搭建结构树所需的所有内容，从而提升根据元素结构树定位界面上元素的效果。的效果。的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于定位界面上元素位置的方法、介质及电子设备

[0001]本申请涉及机器人流程自动化RAP领域，具体而言本申请实施例涉及一种用于定位界面上元素位置的方法、介质及电子设备。

技术介绍

[0002]相关技术在机器人流程自动化RPA(Robotic Process Automation，RPA)的实施过程中，对于一个普通的界面(例如，网页或者app的界面)，软件机器人在点击某一个按钮(作为界面上元素的一个示例)前，需要先精准的识别出这个按钮的位置和语义，这个技术的准确率依赖于目标元素检测模块、模板匹配模块和OCR(Optical Character Recognition，光学字符识别)模块等多个模块共同的准确率。
[0003]由于相关技术的多个模块(例如，目标检测模块、模板匹配模块和OCR模块)是串联工作的，因此每一个模块都依赖与上游模块的准确率，错误率将累乘，这导致了软件机器人在定位待操作界面上元素位置时低效的成功率，同时由于串联的模块个数过多，这也导致了软件机器人实施速度的下降，此外软件机器人对界面中某些元素的寻找，过度依赖于OCR给出的语义信息，因此对语言版本或者颜色形状变换具有较差的鲁棒性。

技术实现思路

[0004]本申请实施例的目的在于提供一种用于定位界面上元素位置的方法、介质及电子设备，本申请的一些实施例将采用“目标检测”的方法，端到端的检测出搭建结构树所需的所有内容，并利用简单的后处理，来实现界面的元素结构树搭建，从而提升根据元素结构树定位界面上元素的效果。
[0005...

【技术保护点】

【技术特征摘要】
1.一种用于定位界面上元素位置的方法，其特征在于，所述方法包括：将待操作界面的图像输入目标检测模型，并通过所述目标检测模型获取所述待操作界面上的所有元素以及元素聚合结果，其中，所述元素聚合结果采用聚合框表征；至少根据所述聚合框的属性信息构建与所述待操作界面对应的元素结构树，以使机器人根据所述元素结构树完成针对所述待操作界面上元素的定位；其中，所述元素结构树包括位于底层的叶节点以及各级父节点，所述底层的叶节点为所述所有元素，所述元素结构树中的一个父节点对应一个聚合框。2.如权利要求1所述的方法，其特征在于，所述通过所述目标检测模型识别所述待操作界面上的所有元素以及元素聚合结果，包括：通过所述目标检测模型得到所述图像上的所有框、所述所有框的类型以及所有框的属性信息，其中，所述所有框的类型包括元素检测框和聚合框，一个元素检测框内包括从所述界面上识别到的一个元素，一个聚合框内包括根据元素位置和逻辑关系聚合后的多个元素，所述属性信息包括相应框的大小和位置中的至少一个；将位于所有所述元素检测框内的元素作为从所述待操作界面上识别的元素，并将位于所述聚合框内的多个元素作为一组可聚合的元素。3.如权利要求2所述的方法，其特征在于，所述至少根据所述聚合框的属性信息构建与所述待操作界面对应的元素结构树，包括：根据所述聚合框的属性信息得到所述各级父节点；根据所述元素检测框的位置信息确定所述底层的叶节点所属的父节点。4.如权利要求3所述的方法，其特征在于，所述属性信息包括各个聚合框的所述位置信息和框的大小信息。5.如权利要求3
‑
4任一项所述的方法，其特征在于，所述多个聚合框包括第一聚合框和第二聚合框，其中，所述根据所述聚合框的属性信息得到所述各级父节点，包括：若根据所述第一聚合框的属性信息和所述第二聚合框的属性信息确定在所述图像上所述第一聚合框包含所述第二聚合框，则确认在所述元素结构树中与所述第一聚合框对应的父节点的层级高于与所述第二聚合框对应的父节点的层级。6.如权利要求3
‑
4任一项所述的方法，其特征在于，所述根据所述聚合框的属性信息得到所述各级父节点，包括：获取多个具有包含关系的聚合框；将所述多个具有包含关系的聚合框按照面积大小排...

【专利技术属性】
技术研发人员：杭天欣，高煜光，张泉，
申请(专利权)人：上海弘玑信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人