文件中的流程图解析方法及装置、计算设备、存储介质制造方法及图纸

技术编号:27195529 阅读:14 留言:0更新日期:2021-01-31 11:49
一种文件中的流程图解析方法及装置、计算设备、存储介质,所述方法包括:对待解析文件的每个页面进行解析,获取各页面内的所有元素,以及各元素的属性信息,元素包括:文本、线条以及箭头图像;根据箭头图像的属性信息,确定各箭头图像的位置;根据箭头图像的位置以及线条的属性信息,确定连接线的位置,连接线为具有箭头的线条,用于标识各节点之间的执行顺序;根据文本的属性信息、每个连接线的起始端的位置以及指向端的位置,确定每个连接线的起始端对应的节点以及指向端对应的节点;根据每个连接线的起始端对应的节点以及指向端对应的节点,确定待解析文件中的流程图的各节点的执行顺序。上述方案能够解析得到流程图中节点之间的逻辑关系。的逻辑关系。的逻辑关系。

【技术实现步骤摘要】
文件中的流程图解析方法及装置、计算设备、存储介质


[0001]本专利技术实施例涉及流程图解析领域,尤其涉及一种文件中的流程图解析方法及装置、计算设备、存储介质。

技术介绍

[0002]临床指南是经过长时间的循证医学以及临床经验汇总而成,具有临床上的指导意义,在海外还具有医疗纠纷时的法律效应。每年发布的最新指南对于临床医生而言有很大的参考价值,指临床指南中除了文本的论述之外,还有流程图部分。流程图包含了临床路径,在临床诊疗过程中给予对于患者在哪一个阶段应该采用的治疗方案可以给予快速、直观、精准的指导。
[0003]目前,临床指南通常采用PDF文件格式。而任一种疾病对应的流程图部分从十多页到几十页不等,页和页之间有前后逻辑关系,每页中的流程图都有几十个节点,最终上千个节点在逻辑上可以汇成一个大的流程图。对于临床使用者来说,通过使用PDF(临床指南的载体)查看临床指南,需要多次翻页,无法对所需的内容进行快速定位。另外,由于PDF文件中流程图呈分叉树形式,缺乏直观逻辑。
[0004]现有的PDF文件解析,可以解析出流程图中的文字信息,却无法识别出流程图中各节点间的逻辑关系。

技术实现思路

[0005]本专利技术实施例解决的技术问题是现有的文件解析,无法得到流程图中各节点间的逻辑关系。
[0006]为解决上述技术问题,本专利技术实施例提供一种文件中的流程图解析方法,包括:对待解析文件的每个页面进行解析,获取各页面内的所有元素,以及各元素的属性信息,所述元素包括:文本、线条以及箭头图像;根据所述箭头图像的属性信息,确定各箭头图像的位置,所述箭头图像的属性信息包括箭头图像的位置信息;根据所述箭头图像的位置以及所述线条的属性信息,确定连接线的位置,所述连接线为具有箭头的线条,所述连接线用于标识各节点之间的执行顺序;根据所述文本的属性信息、每个连接线的起始端的位置以及指向端的位置,确定每个连接线的起始端对应的节点以及指向端对应的节点,其中,所述起始端指所述连接线没有箭头的一端,所述指向端指所述连接线具有箭头的一端;根据所述每个连接线的起始端对应的节点以及指向端对应的节点,确定所述待解析文件中的流程图的各节点的执行顺序。
[0007]可选的,所述根据所述箭头图像的位置以及所述线条的属性信息,确定连接线的位置,包括:根据所述线条的属性信息,确定线条的两端的位置;在以所述箭头图像的位置为中心的预设区域范围内,获取一端位于所述预设区域范围内且所述箭头图像相适配的线条,将所述箭头图像及与所述箭头图像适配的线条组合成所述连接线。
[0008]可选的,所述根据所述文本的属性信息、每个连接线的起始端的位置,确定每个连
接线的起始端对应的节点,包括:在所述连接线的起始端的位置的预设区域范围内,若所述连接线的起始端对应于文本,则根据所述连接线的起始端对应的文本,确定所述连接线的起始端对应的节点。
[0009]可选的,所述根据所述连接线的起始端对应的文本,确定所述连接线的起始端对应的节点,包括:根据所述文本的属性信息,得到所述文本中的各文本流的位置及文本流之间的行间距;根据所述各文本流的位置及文本流之间的行间距,确定与所述连接线的起始端相对应的一个或多个文本流,所述与所述连接线的起始端相对应的一个或多个文本流即为所述连接线的起始端对应的节点。
[0010]可选的,所述根据所述文本的属性信息、每个连接线的起始端的位置,确定每个连接线的起始端对应的节点,包括:在所述连接线的起始端的位置的预设区域范围内,若所述连接线的起始端对应于线条,则获取所述连接线的起始端对应的线条所跨越的范围内的文本,根据所述连接线的起始端对应的线条所跨越的范围内的文本,确定所述连接线的起始端对应的节点。
[0011]可选的,所述获取所述连接线的起始端对应的线条所跨越的范围内的文本,根据所述连接线的起始端对应的线条所跨越的范围内的文本,确定所述连接线的起始端对应的节点,包括以下至少一种:若所述连接线的起始端对应的线条所跨越范围内对应于文本时,根据所述连接线的起始端对应的线条所跨越的范围内对应的文本,确定所述连接线的起始端对应的节点;若所述连接线的起始端对应的线条所跨越范围内对应于其他连接线时,获取所述其他连接线分别对应的节点,将所述其他连接线分别对应的节点作为所述连接线的起始端对应的节点。
[0012]可选的,所述根据所述文本的属性信息、每个连接线的指向端的位置,确定每个连接线的指向端对应的节点,包括:在所述连接线的指向端的位置的预设区域范围内,若所述连接线的指向端对应于文本,则根据连接线的指向端对应的文本,确定所述连接线的指向端对应的节点。
[0013]可选的,所述根据所述文本的属性信息、每个连接线的指向端的位置,确定每个连接线的指向端对应的节点,包括:在所述连接线的指向端的位置的预设区域范围内,若所述连接线的指向端对应于线条,则获取所述连接线的指向端对应的线条所跨越的范围内的文本,根据所述连接线的指向端对应的线条所跨越的范围内的文本,确定所述连接线的指向端对应的节点。
[0014]可选的,所述获取所述连接线的指向端对应的线条所跨越的范围内的文本,根据所述连接线的指向端对应的线条所跨越的范围内的文本,确定所述连接线的指向端对应的节点,包括:若所述连接线的指向端对应的线条所跨越范围内对应于文本时,根据所述连接线的指向端对应的线条所跨越的范围内对应的文本,确定所述连接线的指向端对应的节点;若所述连接线的指向端对应的线条所跨越范围内对应于其他连接线时,获取所述其他连接线分别对应的节点,将所述其他连接线分别对应的节点作为所述连接线的指向端对应的节点。
[0015]可选的,所述文件中的流程图解析方法还包括:确定所述待解析文件中的各节点的执行顺序之后,按照各节点之间的执行顺序,形成各节点之间的结构化信息并存储。
[0016]可选的,所述文件中的流程图解析方法还包括:获取各页面内的所有元素之后,根
据所述线条的属性信息,对所述流程图的边界进行定位;根据所述流程图的边界的定位结果,确定所述流程图的位置。
[0017]可选的,所述文件中的流程图解析方法还包括:根据文本的属性信息,识别得到节点标题。
[0018]可选的,所述文件中的流程图解析方法还包括:在识别得到节点标题之后,根据文本的属性信息确定所述节点标题的位置;根据所述节点标题的位置以及节点的位置,确定所述节点标题与节点之间的对应关系。
[0019]可选的,所述文件中的流程图解析方法还包括:获取角标识别条件;根据每个节点所对应的文本的属性信息,结合所述角标识别条件,判断各节点是否具有角标;当节点对应的文本的属性信息中具有与所述角标识别条件相适配的文本时,将与所述角标识别条件相适配的文本作为角标。
[0020]可选的,所述文件中的流程图解析方法还包括:获取脚注识别条件;根据文本的属性信息,结合所述脚注识别条件,确定脚注区域。
[0021]可选的,所述脚注识别条件包括:脚注开头字母的字号以及位置,所述根据文本的属性信息,结合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件中的流程图解析方法,其特征在于,包括:对待解析文件的每个页面进行解析,获取各页面内的所有元素,以及各元素的属性信息,所述元素包括:文本、线条以及箭头图像;根据所述箭头图像的属性信息,确定各箭头图像的位置,所述箭头图像的属性信息包括箭头图像的位置信息;根据所述箭头图像的位置以及所述线条的属性信息,确定连接线的位置,所述连接线为具有箭头的线条,所述连接线用于标识各节点之间的执行顺序;根据所述文本的属性信息、每个连接线的起始端的位置以及指向端的位置,确定每个连接线的起始端对应的节点以及指向端对应的节点,其中,所述起始端指所述连接线没有箭头的一端,所述指向端指所述连接线具有箭头的一端;根据所述每个连接线的起始端对应的节点以及指向端对应的节点,确定所述待解析文件中的流程图的各节点的执行顺序。2.如权利要求1所述的文件中的流程图解析方法,其特征在于,所述根据所述箭头图像的位置以及所述线条的属性信息,确定连接线的位置,包括:根据所述线条的属性信息,确定线条的两端的位置;在以所述箭头图像的位置为中心的预设区域范围内,获取一端位于所述预设区域范围内且与所述箭头图像相适配的线条,将所述箭头图像及与所述箭头图像适配的线条组合成所述连接线。3.如权利要求1所述的文件中的流程图解析方法,其特征在于,所述根据所述文本的属性信息、每个连接线的起始端的位置,确定每个连接线的起始端对应的节点,包括:在所述连接线的起始端的位置的预设区域范围内,若所述连接线的起始端对应于文本,则根据所述连接线的起始端对应的文本,确定所述连接线的起始端对应的节点。4.如权利要求3所述的文件中的流程图解析方法,其特征在于,所述根据所述连接线的起始端对应的文本,确定所述连接线的起始端对应的节点,包括:根据所述文本的属性信息,得到所述文本中的各文本流的位置及文本流之间的行间距;根据所述各文本流的位置及文本流之间的行间距,确定与所述连接线的起始端相对应的一个或多个文本流,所述与所述连接线的起始端相对应的一个或多个文本流即为所述连接线的起始端对应的节点。5.如权利要求1所述的文件中的流程图解析方法,其特征在于,所述根据所述文本的属性信息、每个连接线的起始端的位置,确定每个连接线的起始端对应的节点,包括:在所述连接线的起始端的位置的预设区域范围内,若所述连接线的起始端对应于线条,则获取所述连接线的起始端对应的线条所跨越的范围内的文本,根据所述连接线的起始端对应的线条所跨越的范围内的文本,确定所述连接线的起始端对应的节点。6.如权利要求5所述的文件中的流程图解析方法,其特征在于,所述获取所述连接线的起始端对应的线条所跨越的范围内的文本,根据所述连接线的起始端对应的线条所跨越的范围内的文本,确定所述连接线的起始端对应的节点,包括以下至少一种:若所述连接线的起始端对应的线条所跨越范围内对应于文本时,根据所述连接线的起始端对应的线条所跨越的范围内对应的文本,确定所述连接线的起始端对应的节点;
若所述连接线的起始端对应的线条所跨越范围内对应于其他连接线时,获取所述其他连接线分别对应的节点,将所述其他连接线分别对应的节点作为所述连接线的起始端对应的节点。7.如权利要求1至6任一项所述的文件中的流程图解析方法,其特征在于,所述根据所述文本的属性信息、每个连接线的指向端的位置,确定每个连接线的指向端对应的节点,包括:在所述连接线的指向端的位置的预设区域范围内,若所述连接线的指向端对应于文本,则根据连接线的指向端对应的文本,确定所述连接线的指向端对应的节点。8.如权利要求1至6任一项所述的文件中的流程图解析方法,其特征在于,所述根据所述文本的属性信息、每个连接线的指向端的位置,确定每个连接线的指向端对应的节点,包括:在所述连接线的指向端的位置的预设区域范围内,若所述连接线的指向端对应于线条,则获取所述连接线的指向端对应的线条所跨越的范围内的文本,根据所述连接线的指向端对应的线条所跨越的范围内的文本,确定所述连接线的指向端对应的节点。9.如权利要求8所述的文件中的流程图解析方法,其特征在于,所述获取所述连接线的指向端对应的线条所跨越的范围内的文本,根据所述连接线的指向端对应的线条所跨越的范围内的文本,确定所述连接线的指向端对应的节点,包括:若所述连...

【专利技术属性】
技术研发人员:秦晓宏刘焕春
申请(专利权)人:上海柯林布瑞信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1