一种数据处理方法、装置及设备制造方法及图纸

技术编号:36844933 阅读:16 留言:0更新日期:2023-03-15 16:21
本发明专利技术公开了一种数据处理方法、装置及设备,该方法包括:获取至少三个数据表,并基于初始化样式显示实体文本表;在实体文本表于显示窗口中显示时,基于显示窗口的显示尺寸调整实体文本表于显示界面中的初始行间距;基于实体数据表遍历实体文本表,以对实体文本表中的每个实体进行切分,并将切分后的实体进行突出显示和位置标注;基于关系标定表和位置标注,对初始行间距进行调整,并基于调整后的初始行间距在实体文本表中进行实体标注并渲染得到目标界面,实现了对文本标注实体及实体间关系的清晰展示,降低渲染成本,提高渲染效率,不受窗口大小变化的影响,通用性强。通用性强。通用性强。

【技术实现步骤摘要】
一种数据处理方法、装置及设备


[0001]本专利技术涉及计算机
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]随着各领域人工智能的发展,数据标注行业快速崛起发展。数据标注行业作为人工的基础层,是机器感知世界的起点,数据标注的展示在其中有着不可或缺的价值。
[0003]现有的标注方法是基于后端接收数据,搭建与后端对应的框架,对获取的数据进行一次性全部渲染。
[0004]上述方法,在文本数据量大且文本实体间关系复杂的情况下,渲染开销大,渲染时间长,容易出现卡顿,且前后端工具耦合程度过高,通用性不强,不利于二次开发和应用抽离。

技术实现思路

[0005]本专利技术提供了一种数据处理方法、装置及设备。以实现对文本标注实体及实体间关系的清晰展示,降低渲染成本,提高渲染效率,不受窗口大小变化的影响,通用性强。
[0006]第一方面,本专利技术实施例提供了一种数据处理方法,该方法包括:
[0007]获取至少三个数据表,并基于初始化样式显示实体文本表;其中,至少三个数据表包括实体数据表、关系标定表以及实体文本表,实体文本表中包括文本内容;
[0008]在实体文本表于显示窗口中显示时,基于显示窗口的显示尺寸调整实体文本表于显示界面中的初始行间距;
[0009]基于实体数据表遍历实体文本表,以对实体文本表中的每个实体进行切分,并将切分后的实体进行突出显示和位置标注;
[0010]基于关系标定表和位置标注,对初始行间距进行调整,并基于调整后的初始行间距在实体文本表中进行实体标注并渲染得到目标界面。
[0011]第二方面,本专利技术实施例还提供了一种数据处理装置,该装置包括:
[0012]数据获取模块,用于获取至少三个数据表,并基于初始化样式显示实体文本表;其中,至少三个数据表包括实体数据表、关系标定表以及实体文本表,实体文本表中包括文本内容;
[0013]初始行间距调整模块,用于在实体文本表于显示窗口中显示时,基于显示窗口的显示尺寸调整实体文本表于显示界面中的初始行间距;
[0014]实体处理模块,用于基于实体数据表遍历实体文本表,以对实体文本表中的每个实体进行切分,并将切分后的实体进行突出显示和位置标注;
[0015]行间距调整及渲染模块,用于基于关系标定表和位置标注,对初始行间距进行调整,并基于调整后的初始行间距在实体文本表中进行实体标注并渲染得到目标界面。
[0016]第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:
[0017]至少一个处理器;以及
[0018]与至少一个处理器通信连接的存储器;其中,
[0019]存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本专利技术任一实施例的数据处理方法。
[0020]根据本专利技术的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本专利技术任一实施例的数据处理方法。
[0021]本专利技术实施例的技术方案,通过获取至少三个数据表,并基于初始化样式显示实体文本表;其中,至少三个数据表包括实体数据表、关系标定表以及实体文本表,实体文本表中包括文本内容;在实体文本表于显示窗口中显示时,基于显示窗口的显示尺寸调整实体文本表于显示界面中的初始行间距;基于实体数据表遍历实体文本表,以对实体文本表中的每个实体进行切分,并将切分后的实体进行突出显示和位置标注;基于关系标定表和位置标注,对初始行间距进行调整,并基于调整后的初始行间距在实体文本表中进行实体标注并渲染得到目标界面,解决了在文本数据量大且文本实体间关系复杂的情况下,渲染开销大,渲染时间长,容易出现卡顿,且前后端工具耦合程度过高,通用性不强,不利于二次开发和应用抽离问题,实现了对文本标注实体及实体间关系的清晰展示,降低渲染成本,提高渲染效率,不受窗口大小变化的影响,通用性强。
[0022]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是根据本专利技术实施例一提供的一种数据处理方法的流程图;
[0025]图2是根据本专利技术实施例二提供的一种数据处理方法的流程图;
[0026]图3是根据本专利技术实施例三提供的一种数据处理方法的流程图;
[0027]图4是根据本专利技术实施例四提供的一种数据处理方法的流程图;
[0028]图5是根据本专利技术实施例五提供的一种数据处理装置的结构示意图;
[0029]图6是实现本专利技术实施例的数据处理方法的电子设备的结构示意图。
具体实施方式
[0030]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0031]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0032]实施例一
[0033]图1为本专利技术实施例一提供的一种数据处理方法的流程图,本实施例可适用于对文本标注实体进行展示的情况,该方法可以由数据处理装置来执行,该数据处理装置可以采用硬件和/或软件的形式实现,该数据处理装置可配置于计算机中。
[0034]如图1所示,该方法包括:
[0035]S110、获取至少三个数据表,并基于初始化样式显示实体文本表。
[0036]其中,至少三个数据表包括实体数据表、关系标定表以及实体文本表,实体文本表中包括文本内容。
[0037]其中,实体是指被标注的字、词、句。实体数据表是包含实体、实体属性、样式、在文本内容中位置等信息的数据表。进一步的,实体属性可以是时间、数值、指标等。关系标定表是指包含各个实体之间关系的表,实体间关系可以是限定、否定、并列、修饰、加强等。实体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取至少三个数据表,并基于初始化样式显示实体文本表;其中,所述至少三个数据表包括实体数据表、关系标定表以及实体文本表,所述实体文本表中包括文本内容;在所述实体文本表于显示窗口中显示时,基于所述显示窗口的显示尺寸调整所述实体文本表于显示界面中的初始行间距;基于所述实体数据表遍历所述实体文本表,以对所述实体文本表中的每个实体进行切分,并将切分后的实体进行突出显示和位置标注;基于所述关系标定表和所述位置标注,对所述初始行间距进行调整,并基于调整后的初始行间距在所述实体文本表中进行实体标注并渲染得到目标界面。2.根据权利要求1所述的方法,其特征在于,所述基于所述显示窗口的显示尺寸调整所述实体文本表于显示界面中的初始行间距,包括:基于所述显示窗口的显示尺寸和所述初始化样式,调整所述实体文本表中每行显示的文字数量以及相邻两行文字所对应的初始行间距。3.根据权利要求1所述的方法,其特征在于,所述将切分后的实体进行突出显示和位置标注,包括:确定切分后的每个实体,并调整每个实体所对应的显示样式;其中,所述显示样式包括显示字体、文字之间的文字间距以及高亮显示中的至少一种;以及,确定所述实体所对应的像素点,并将所述像素点作为位置标注。4.根据权利要求1所述的方法,其特征在于,所述基于所述关系标定表和所述位置标注,对所述初始行间距进行调整,包括:基于所述关系标定表,确定切分后各实体之间的关联关系;基于所述关联关系和所述位置标注,调整所述初始行间距。5.根据权利要求4所述的方法,其特征在于,所述基于所述关联关系和所述位置标注,调整所述初始行间距,包括:若所述关联关系中包括实体之间的层级关系,则基于所述层级关系和所述位置标注调整所述初始行间距;若所述关联关系中包括目标实体关系为多个实体关系的并集,则删除所述目标实体关系,以基于调整后的实体关系和所述位置标注调整所述初始行间距。6.根据权利要求1所述的方法,其特征在于,渲染得到目标界面包括...

【专利技术属性】
技术研发人员:秦伟健
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1