基于openpyxl的目录审查结果汇总系统及方法技术方案

技术编号:28624285 阅读:11 留言:0更新日期:2021-05-28 16:20
本发明专利技术涉及技术语言文档处理技术领域,具体为一种基于openpyxl的目录审查结果汇总系统及方法。一种基于openpyxl的目录审查结果汇总系统,包括目录数据上传模块,用于上传同一批次的目录数据并将所述目录数据进行预处理以得到待处理文档;文档分类模块,用于将所述待处理文档分类为excel文件和word文件;excel文件处理模块,用于对所述excel文件进行处理以得到具有标注的物资目录页;word文件处理模块,用于对所述word文件进行处理以得到具有标注的物资目录页;物资目录页封装模块,用于将所述物资目录页进行整理封装。本发明专利技术系统及方法能够通过Openpyxl功能模块对目录文档进行分类以得到excel文件和word文件,从而提高了物资项目管理领域下目录文档的处理效果和处理效率。

【技术实现步骤摘要】
基于openpyxl的目录审查结果汇总系统及方法
本专利技术涉及技术语言文档处理
,具体为一种基于openpyxl的目录审查结果汇总系统及方法。
技术介绍
技术语言文档处理技术主要是针对庞杂的表格及文本信息按照特殊的逻辑关系标识出有用的技术词语。随着海量表格及文本数据的增加,如何从海量文本信息中迅速捕获到适用于自身的信息,进而对这些信息进行合理的应用和管理是当前急需解决的问题。目前,物资项目管理领域下,表格及文档大都直接人为处理,导致在目录文档的整理过程中,工作效率较低且容易出现错漏,进而使目录文档的处理效果及处理效率不太理想。
技术实现思路
本专利技术针对现有技术存在的问题,提出了一种基于openpyxl的目录审查结果汇总系统及方法,能够有效提高物资项目管理领域下目录文档的处理效果及处理效率。本专利技术解决其技术问题所采用的技术方案是:一种基于openpyxl的目录审查结果汇总系统,包括目录数据上传模块,用于上传同一批次的目录数据并将所述目录数据进行预处理以得到待处理文档;文档分类模块,用于将所述待处理文档分类为excel文件和word文件;excel文件处理模块,用于对所述excel文件进行处理以得到具有标注的物资目录页;word文件处理模块,用于对所述word文件进行处理以得到具有标注的物资目录页;物资目录页封装模块,用于将所述物资目录页进行整理封装。本专利技术系统能够通过文档分类模块对目录文档进行分类以得到excel文件和word文件,并能够通过excel文件处理模块对excel文件进行关键内容查找和标注,还能够通过word文件处理模块对word文件进行关键词查找和标注,从而提高了物资项目管理领域下目录文档的处理效果和处理效率。作为优选,所述目录数据上传模块包括总文件夹建立单元,用于建立存放所述目录数据的批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;压缩包解压单元,用于在所述批次文件总文件夹中将所述压缩包解压为文件夹;次文件夹建立单元,用于建立存放所述批次文件总文件夹以及所述文件夹中的word文件和excel文件的批次文件次文件夹。作为优选,所述文档分类模块通过openpyxl功能模块对所述待处理文档进行分类。作为优选,所述excel文件处理模块用于当所述待处理文档为excel文件时,通过fileParse功能函数读取excel文件的内容;用于当所述excel文件的sheet名称为投标人采购材料设备表或招标人采购材料设备表时,将投标人采购材料设备表或招标人采购材料设备表中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述投标人采购材料设备表或招标人采购材料设备表中的对应单元格添加不同的背景色;用于当所述excel文件的sheet名称为工程量清单时,将工程量清单中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述工程量清单的对应单元格添加不同的背景色。作为优选,所述word文件处理模块用于当所述待处理文档为word文件时,通过read_word_java功能函数读取word文件的内容并将其进行切词处理,还用于将切好的词与数据库里的技术规范书中的关键词进行匹配,如果匹配上,则将该词进行高亮处理。一种基于openpyxl的目录审查结果汇总方法,包括以下步骤S1上传同一批次的目录数据,并将所述目录数据进行预处理以得到待处理文档;S2通过文档分类模块将所述待处理文档分类为excel文件和word文件;S3通过excel文件处理模块对所述excel文件进行处理并通过word文件处理模块对所述word文件进行处理以得到具有标注的物资目录页;S4将所述物资目录页进行整理封装。本专利技术方法能够通过文档分类模块对目录文档进行分类以得到excel文件和word文件,并能够通过excel文件处理模块对excel文件进行关键内容查找和标注,还能够通过word文件处理模块对word文件进行关键词查找和标注,从而提高了物资项目管理领域下目录文档的处理效果和处理效率。作为优选,所述S1具体包括S11建立批次文件总文件夹,并将目录数据上传至所述批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;S12在所述批次文件总文件夹中将所述压缩包解压为文件夹;S13在所述批次文件总文件夹中建立批次文件次文件夹,将所述批次文件总文件夹以及所述文件夹中的word文件和excel文件移动至所述批次文件次文件夹以形成待处理文档。作为优选,所述S2具体包括,通过openpyxl功能模块对所述待处理文档进行分类。作为优选,所述S3中,当所述待处理文档为excel文件时,所述excel文件处理模块通过fileParse功能函数读取excel文件的内容;当所述excel文件的sheet名称为投标人采购材料设备表或招标人采购材料设备表时,所述excel文件处理模块将投标人采购材料设备表或招标人采购材料设备表中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述投标人采购材料设备表或招标人采购材料设备表中的对应单元格添加不同的背景色;当所述excel文件的sheet名称为工程量清单时,所述excel文件处理模块将工程量清单中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述工程量清单的对应单元格添加不同的背景色。作为优选,所述S3中,当所述待处理文档为word文件时,所述word文件处理模块通过read_word_java功能函数读取word文件的内容并将其进行切词处理,所述word文件处理模块将切好的词与数据库里的技术规范书中的关键词进行匹配,如果匹配上,则将该词进行高亮处理。有益效果本专利技术系统及方法能够通过Openpyxl功能模块对目录文档进行分类以得到excel文件和word文件,并能够通过Openpyxl功能模块对excel文件进行关键内容查找和标注,还能够通过word文件处理模块对word文件进行关键词查找和标注,从而提高了物资项目管理领域下目录文档的处理效果和处理效率。附图说明图1为本专利技术目录数据的组成图。具体实施方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。一种基于openpyxl的目录审查结果汇总系统,包括目录数据上传模块,文档分类模块,excel文件处理模块,word文件处理模块和物资目录页封装模块。目录数据上传模块用于上传同一批次的目录数据并将所述目录数据进行预处理以得到待处理文档。所述目录数据上传模块具体包括总文件夹建立单元,压缩包解压单元和次文件夹建立单元。总文件夹建立单元用于建立存放所述目录数据的批次文件总本文档来自技高网...

【技术保护点】
1.基于openpyxl的目录审查结果汇总系统,其特征在于:包括/n目录数据上传模块,用于上传同一批次的目录数据并将所述目录数据进行预处理以得到待处理文档;/n文档分类模块,用于将所述待处理文档分类为excel文件和word文件;/nexcel文件处理模块,用于对所述excel文件进行处理以得到具有标注的物资目录页;/nword文件处理模块,用于对所述word文件进行处理以得到具有标注的物资目录页;/n物资目录页封装模块,用于将所述物资目录页进行整理封装。/n

【技术特征摘要】
1.基于openpyxl的目录审查结果汇总系统,其特征在于:包括
目录数据上传模块,用于上传同一批次的目录数据并将所述目录数据进行预处理以得到待处理文档;
文档分类模块,用于将所述待处理文档分类为excel文件和word文件;
excel文件处理模块,用于对所述excel文件进行处理以得到具有标注的物资目录页;
word文件处理模块,用于对所述word文件进行处理以得到具有标注的物资目录页;
物资目录页封装模块,用于将所述物资目录页进行整理封装。


2.根据权利要求1所述的基于openpyxl的目录审查结果汇总系统,其特征在于:所述目录数据上传模块包括
总文件夹建立单元,用于建立存放所述目录数据的批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
压缩包解压单元,用于在所述批次文件总文件夹中将所述压缩包解压为文件夹;
次文件夹建立单元,用于建立存放所述批次文件总文件夹以及所述文件夹中的word文件和excel文件的批次文件次文件夹。


3.根据权利要求1所述的基于openpyxl的目录审查结果汇总系统,其特征在于:所述文档分类模块通过openpyxl功能模块对所述待处理文档进行分类。


4.根据权利要求1所述的基于openpyxl的目录审查结果汇总系统,其特征在于:所述excel文件处理模块用于当所述待处理文档为excel文件时,通过fileParse功能函数读取excel文件的内容;
用于当所述excel文件的sheet名称为投标人采购材料设备表或招标人采购材料设备表时,将投标人采购材料设备表或招标人采购材料设备表中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述投标人采购材料设备表或招标人采购材料设备表中的对应单元格添加不同的背景色;
用于当所述excel文件的sheet名称为工程量清单时,将工程量清单中内容与数据库的一二级采购目录进行匹配,如果匹配上,则根据所述一二级采购目录的大中小类给所述工程量清单的对应单元格添加不同的背景色。


5.根据权利要求1所述的基于openpyxl的目录审查结果汇总系统,其特征在于:所述word文件处理模块用于当所述待处理文档为word文件时,通过read_word_java功能函数读取word文件的内容并将其进行切词处理,还用于将切好的词与数据库里的技术规范书中的关键词进行匹配,如果匹配上,则将该词进行高亮处理。


6.基于ope...

【专利技术属性】
技术研发人员:李雪维钱仲文裘华东范江东赵欣金日强张志仁韩欣之吕晓青卢孔实吴越人郭燕玲潘丐多叶凡林春张睿李媛媛朱力郑思佳吴波徐天天袁奕文何佳杨文颖喻琤刘挺杨钦
申请(专利权)人:国网浙江省电力有限公司物资分公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1