System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及电子档案的归档处理,尤其涉及一种基于自定义归档策略的电子档案自动化归档方法。
技术介绍
1、随着信息技术的深入快速发展,电子文件归档的需求日益迫切。提出数字化转型战略,推进产业数字化、数字产业化,大量具有档案价值的电子文件随之产生,对电子文件归档管理与应用的需求迫切。然而,当前的电子文件归档和电子文件归档多数采用人工整理的方法,面临生产效率低、文档分类归档成本高、准确性差的问题。基于上述目前电子档案整理的现状,提出一种基于自定义归档策略的自动化解决方案,以实现各行业各类成果的机器自动化归档技术应用。
技术实现思路
1、为了解决
技术介绍
中的技术问题,本申请实施例提供一种基于自定义归档策略的电子档案自动化归档方法,包括如下步骤:
2、步骤s1、待归档电子化文档准备:
3、将通过各类型数字化文档扫描设备形成的电子化文档或现有的电子化文档存储于指定的安装了归档软件系统的计算机的文件系统中;
4、步骤s2、配置归档策略:
5、根据不同数字化成果的具体归档要求,配置相应的归档整理策略,一个整理策略配置多个归档规则,将其归档策略及配置的归档规则的集存储在归档软件系统数据库当中,通过归档软件系统中的策略配置功能模块,实现归档策略的维护与更新,在执行归档时,可以从数据库中加载选择指定策略方案执行归档工作;
6、步骤s3、根据归档策略执行归档任务:
7、对于待归档成果,在根据归档的要求配置好对应的归档策略后,对待归档成果
8、模式一、与自动化扫描仪设备联动,将扫描仪的扫描输出路径设置为其待归档目录,动态监测待归档目录文件变化并按其配置的策略时行文件整理分类;
9、模式二、指定静态的待归档目录,根据其配置的归档策略进行文件的整理分类,此模式针对已经扫描好的未分类的电子文件再归类;
10、步骤s4、归档任务完整性检查:
11、检查待归档源文件目录大小与归档目标目录文件大小是否相等,检查待归档源文件文件总数量与归档目标目录文件数量是否一致,对tab_soucefileindex进行统计,计算文件ocr识别率rr、计算归档文件数量及归档成功率ar、获取归档文件重复文件数量及详细清单;
12、rr=(文字识别特征区域文字识别成功数量/文字识别特征区域数量)*100%;
13、ar=(归档成功文件数量/待归档电子文件数量)*100%;
14、对于ocr识别失败的,进行人工逐个字符标注,并将其训练数据结果增量写入到识别数据集当中,以完善提升文字识别精度;
15、步骤s5、生成归档任务报告:
16、生成归档任务报告,并自动生成归档目录在报告显示区以pdf的形式显示,同时将报告生成数字签名信息的pdf输出到归档输出根目录的上一级目录;
17、步骤s6、归档任务结束:
18、完成一次基于所选归档策略的自动化整理后,在归档软件系统中按照归归档后的电子档案目录树的形式显示其归档档案。
19、在本申请的其中一个实施例中,所述基于自定义归档策略的电子档案自动化归档方法,所述步骤s2、配置归档策略中,归档策略的属性包括策略名称、模板文件列表、归档说明、参考文献或标准、创建索引目录选项、归档规则集;
20、属性通过归档策略配置功能模块实现可视化配置,并保存在归档软件系统的系统数据库表tab_policy及子表tab_filetemplate、tab_indexrules中;
21、模板文件列表用于选择设置本归档策略要整理的所有类别文档的样本文件,通过打开指定文件目录导入样本文件的方式导入,其文件信息存入tab_filetemplate;
22、创建索引目录选项,用于需要自动生成卷内目录的情形,是一个高级可选项,系统默认不创建索引目录;如需要在整理完成后自动生成卷内目录文件,则设置一个卷内目录的excel模板样式,在模板中的单元格设置对应的引用的模板文件名及其它属性的变更名,系统将自动动态赋值生成卷内目录及其属性;
23、归档规则集当中的每一个子项即一个归档规则,每个归档规则对应一种类型文件的其归档规则定义。
24、在本申请的其中一个实施例中,所述基于自定义归档策略的电子档案自动化归档方法,所述步骤s2、配置归档策略包括:
25、步骤s2.1、新建归档策略,并根据其归档任务命名;
26、步骤s2.2、导入要归档的各类型文件,将待归档的类型文件导入到当前策略文件模板库,系统将导入的文件存储在程序运行根目录下policy 子文件夹中的,并根据导入的顺序分别为t1..tx;tx代表文件模板文件t1,t2...;同时将识别导入文件tx识别其主要属性存储于数据表tab_filetemplates中;其模板文件属性包括文件标识名、文件类型、页面像素宽、页面像素高、页数;
27、步骤s2.3、配置归档规则集,根据归档的要求制定一个或多个规则(r1..rx),以实现对文件的自动化归档整理,通常一个规则对应一个类型文件的归档任务,同一类型文件需要在不同的目标归档目录中重复存放时,则一个类型文件对应可以配置两个或以上的归档规则;
28、归档规则的属性包含规则名称、文件源目录、对应模板文件(t1..tx中的一个)、页面像素宽、页面像素高、页数、标识名、文件匹配规则表达式、归档目录、归档文件命名规则和文件标识特征。
29、在本申请的其中一个实施例中,所述基于自定义归档策略的电子档案自动化归档方法,步骤s3、根据归档策略执行归档任务包括:
30、步骤s3.1、系统启动,进行系统标准数据库sysdb的连接、全局选项参数的初始化、界面初始化、ocr引擎初始化、条形码二维码识别引擎初始化、日志消息模块加载并完成系统用户的授权认证;
31、步骤s3.2、选择当前的归档策略,默认系统加载最近一次使用的归档策略,并将其显示在状态栏位置,根据需求可以切换归档策略,切换时以列表的形式弹出,提供人工切换的人机交互界面,可以输入关键字查询归档策略名称,支持模糊查询;
32、步骤s3.3、指定待归档目录,打开待归档文件的所在目录,系统将根据所选归档策略,将重新初始化当前归档策略的所有配置属性,加载当前归档策略所有的属性以及所包含的归档规则集;
33、步骤s3.4、指定归档输出目录,指定归档输出的文件夹目录根目录,可以是本地磁盘变可以为外部存储设备路径,当指定的文件夹目录不存在时,系统将自动创建指定的输出目录;
34、步骤s3.5,待归档目录的全目录文件扫描分析,对待归档目录进行全文件扫描,并依此建立全局内存文件索引表tab_soucefileindex,获得所有的文件属性索引信息内存表。建立的内存数据表包含的属性有:文件名、文件路径、文件大小、文件md5校验码、本文档来自技高网...
【技术保护点】
1.一种基于自定义归档策略的电子档案自动化归档方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于自定义归档策略的电子档案自动化归档方法,其特征在于,所述步骤S2、配置归档策略中,归档策略的属性包括策略名称、模板文件列表、归档说明、参考文献或标准、创建索引目录选项、归档规则集;
3.根据权利要求1所述的基于自定义归档策略的电子档案自动化归档方法,其特征在于,所述步骤S2、配置归档策略包括:
4.根据权利要求1所述的基于自定义归档策略的电子档案自动化归档方法,其特征在于,步骤S3、根据归档策略执行归档任务包括:
5.根据权利要求4所述的基于自定义归档策略的电子档案自动化归档方法,其特征在于,所述步骤S3.6,自动化归档整理包括:
【技术特征摘要】
1.一种基于自定义归档策略的电子档案自动化归档方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于自定义归档策略的电子档案自动化归档方法,其特征在于,所述步骤s2、配置归档策略中,归档策略的属性包括策略名称、模板文件列表、归档说明、参考文献或标准、创建索引目录选项、归档规则集;
3.根据权利要求1所述的基于自定...
【专利技术属性】
技术研发人员:蔡晓程,王怀採,李修庆,
申请(专利权)人:湖南盛鼎科技发展有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。