一种对PDF文件中图片提取的方法及装置制造方法及图纸

技术编号:27879620 阅读:23 留言:0更新日期:2021-03-31 01:11
本发明专利技术提供一种对PDF文件中图片提取的方法及装置,包括,步骤S1,响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;其中,所述识别结果包括已识别或未识别;步骤S2,根据所述启动命令开始提取目标文件中的图片,生成提取结果;所述提取结果包括已提取或未提取;步骤S3,根据所述启动命令开始获取所述提取结果,根据所述提取结果确定目标文件中的图片是否提取成功,若成功,则将提取的图片保存至预设的路径并进行命名;若不成功,则输出报警信息。本发明专利技术将一份PDF文档中的图片全部提取出来放入用户自定义文件,从而提高了工作人员的工作效率,也降低了人为操作带来的失误。

【技术实现步骤摘要】
一种对PDF文件中图片提取的方法及装置
本专利技术涉及计算机
,特别是涉及一种对PDF文件中图片提取的方法及装置。
技术介绍
在日常生活中我们离不开PDF文档,特别是在校大学生、公司职员、文秘这类型的从业人员常常需要与PDF文档打交道,但是若没有专业的PDF工具基本不可能直接打开PDF文档对其中的图片进行保存、修改等操作。退一步来说,就算有专业的软件工具能对PDF文档进行编辑,若是文档较大,图片较多,每保存一张图片都要选择文件夹,选择路径,这就使得提取图片的过程变得复杂且容易出错。由于各文职工作人员常常需要处理PDF文件,并从提取其中的图片以获得相关资料的图片数据,所以选择一款合适的软件是提高工作人员工作效率的关键。首先传统的文本编辑器不能编辑PDF文档,若使用PDF编辑器来保存图片也容易出现以下问题:1.若PDF文件较大,页数较多,图片较多,操作繁琐,使得工作效率降低。2.由于提取每一张图片都需要选择保存路径,所以过程冗余,容易出现差错,使得保存路径出错。
技术实现思路
本专利技术的目的在于,提出一种对PDF文件中图片提取的方法及装置,解决现有方法对PDF文件中图片提取效率低且易出错的技术问题。一方面,提供一种对PDF文件中图片提取的方法,包括以下步骤:步骤S1,响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;其中,所述识别结果包括已识别或未识别;步骤S2,根据所述启动命令开始提取目标文件中的图片,生成提取结果;所述提取结果包括已提取或未提取;步骤S3,根据所述启动命令开始获取所述提取结果,根据所述提取结果确定目标文件中的图片是否提取成功,若成功,则将提取的图片保存至预设的路径并进行命名;若不成功,则输出报警信息。优选地,所述步骤S1包括:根据预设规则对目标文件的路径信息和名称信息进行识别,若识别到符合标准的路径信息和名称信息,则判定识别成功,生成识别结果为已识别;若未识别到符合标准的路径信息和名称信息,则判定识别未成功,生成识别结果为未识别。优选地,所述步骤S1还包括:当识别结果为未识别时,重新对目标文件的路径信息和名称信息进行识别,直到生成的识别结果为已识别或重复识别的次数达到预设的识别上限为止;其中,当重复识别的次数达到预设的识别上限时,输出识别未成功提示信息。优选地,所述步骤S2包括:若开始提取且提取到完整的图片,则判定提取成功,生成提取结果为已提取;若未开始提取或未提取到完整的图片,则判定提取未成功,生成提取结果为未提取。优选地,所述步骤S2还包括:当生成的提取结果为未提取时,重新对目标文件中的图片进行提取,直到生成的提取结果为已提取或重复提取的次数达到预设的提取上限为止;其中,当重复提取的次数达到预设的提取上限时,输出未提取提示信息。优选地,所述步骤S3包括:若获取的提取结果为已提取,则判定目标文件中的图片提取成功,获取提取的图片;若获取的提取结果为未提取,则判定目标文件中的图片提取不成功,持续获取所述提取结果,直到获取的提取结果为已提取为止。另一方面,还提供一种对PDF文件中图片提取的装置,用以实现所述的对PDF文件中图片提取的方法,包括:识别模块,用以响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;其中,所述识别结果包括已识别或未识别;提取模块,用以根据所述启动命令开始提取目标文件中的图片,生成提取结果;所述提取结果包括已提取或未提取;保存模块,用以根据所述启动命令开始获取所述提取结果,根据所述提取结果确定目标文件中的图片是否提取成功,若成功,则将提取的图片保存至预设的路径并进行命名;若不成功,则输出报警信息。优选地,述识别模块生成的识别结果为未识别时,重新对目标文件的路径信息和名称信息进行识别,直到生成的识别结果为已识别或重复识别的次数达到预设的识别上限为止;其中,当重复识别的次数达到预设的识别上限时,输出识别未成功提示信息。优选地,所述提取模块开始提取且提取到完整的图片,则判定提取成功,生成提取结果为已提取;若未开始提取或未提取到完整的图片,则判定提取未成功,生成提取结果为未提取;其中,当生成的提取结果为未提取时,重新对目标文件中的图片进行提取,直到生成的提取结果为已提取或重复提取的次数达到预设的提取上限为止;其中,当重复提取的次数达到预设的提取上限时,输出未提取提示信息。优选地,所述保存模块获取的提取结果为已提取,则判定目标文件中的图片提取成功,获取提取的图片;若获取的提取结果为未提取,则判定目标文件中的图片提取不成功,持续获取所述提取结果,直到获取的提取结果为已提取为止。综上,实施本专利技术的实施例,具有如下的有益效果:本专利技术提供的对PDF文件中图片提取的方法及装置,一步到位将一份PDF文档中的图片全部提取出来放入用户自定义文件,从而提高了工作人员的工作效率,也降低了人为操作带来的失误,提高了工作人员的工作效率,避免一些不必要的工作量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本专利技术的范畴。图1为本专利技术实施例中一种对PDF文件中图片提取的方法的主流程示意图。图2为本专利技术实施例中一种对PDF文件中图片提取的装置的结构示意图。图3为本专利技术实施例中一种对PDF文件中图片提取的方法的逻辑示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述。如图1和图3所示,为本专利技术提供的一种对PDF文件中图片提取的方法的一个实施例的示意图。在该实施例中,所述方法包括以下步骤:步骤S1,响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;当识别结果为未识别时,重新对目标文件的路径信息和名称信息进行识别,直到生成的识别结果为已识别或重复识别的次数达到预设的识别上限为止;其中,当重复识别的次数达到预设的识别上限时,输出识别未成功提示信息;其中,所述识别结果包括已识别或未识别;可以理解的是,用户确定好需要提取的目标PDF文件,选择确定指令后,对目标PDF文件保存的路径和名称进行识别,返回识别结果,当确定目标文件符合要求后,则触发提取,其中,同时触发两条线程的任务,一个是提取目标PDF文件中图片,另一个是等待提取结果对图片进行保存。具体实施例中,根据预设规则对目标文件的路径信息和名称信息进行识别,若识别到符合标准的路径信息和名称信息,则判定识别成功,生成识别结果为已识别;若未识别到符合标准的路径信息和名称信息,则判本文档来自技高网...

【技术保护点】
1.一种对PDF文件中图片提取的方法,其特征在于,包括以下步骤:/n步骤S1,响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;其中,所述识别结果包括已识别或未识别;/n步骤S2,根据所述启动命令开始提取目标文件中的图片,生成提取结果;所述提取结果包括已提取或未提取;/n步骤S3,根据所述启动命令开始获取所述提取结果,根据所述提取结果确定目标文件中的图片是否提取成功,若成功,则将提取的图片保存至预设的路径并进行命名;若不成功,则输出报警信息。/n

【技术特征摘要】
1.一种对PDF文件中图片提取的方法,其特征在于,包括以下步骤:
步骤S1,响应于用户的选择指令对目标文件的路径信息和名称信息进行识别,生成识别结果;当识别结果为已识别时,生成启动命令;其中,所述识别结果包括已识别或未识别;
步骤S2,根据所述启动命令开始提取目标文件中的图片,生成提取结果;所述提取结果包括已提取或未提取;
步骤S3,根据所述启动命令开始获取所述提取结果,根据所述提取结果确定目标文件中的图片是否提取成功,若成功,则将提取的图片保存至预设的路径并进行命名;若不成功,则输出报警信息。


2.如权利要求1所述的方法,其特征在于,所述步骤S1包括:
根据预设规则对目标文件的路径信息和名称信息进行识别,若识别到符合标准的路径信息和名称信息,则判定识别成功,生成识别结果为已识别;若未识别到符合标准的路径信息和名称信息,则判定识别未成功,生成识别结果为未识别。


3.如权利要求2所述的方法,其特征在于,所述步骤S1还包括:
当识别结果为未识别时,重新对目标文件的路径信息和名称信息进行识别,直到生成的识别结果为已识别或重复识别的次数达到预设的识别上限为止;其中,当重复识别的次数达到预设的识别上限时,输出识别未成功提示信息。


4.如权利要求3所述的方法,其特征在于,所述步骤S2包括:
若开始提取且提取到完整的图片,则判定提取成功,生成提取结果为已提取;
若未开始提取或未提取到完整的图片,则判定提取未成功,生成提取结果为未提取。


5.如权利要求4所述的方法,其特征在于,所述步骤S2还包括:
当生成的提取结果为未提取时,重新对目标文件中的图片进行提取,直到生成的提取结果为已提取或重复提取的次数达到预设的提取上限为止;其中,当重复提取的次数达到预设的提取上限时,输出未提取提示信息。


6.如权利要求5所述的方法,其特征在于,所述步骤S3包括:
若获取的提取结果为已...

【专利技术属性】
技术研发人员:黄敬轩江健武刘康军陈祎亮云辰太梁楚衡洪玉婷
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1