一种基于信息抽取的档案存储方法及系统技术方案

技术编号:36862334 阅读:52 留言:0更新日期:2023-03-15 18:39
本发明专利技术涉及档案存储技术领域,具体公开了一种基于信息抽取的档案存储方法及系统。本发明专利技术通过获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储;基于档案扫描信息,进行抽取识别;对纸质档案集进行抽取处理,得到多个档案抽取子集;分析确定多个档案抽取子集的存储位置;按照多个存储位置,对多个档案抽取子集进行存储指引。能够对纸质档案集进行信息扫描,按照档案扫描信息,进行抽取识别,进而抽取得到多个档案抽取子集,确定多个档案抽取子集对应的存储位置,进行存储指引,从而将纸质档案文件进行信息抽取的分类存储,有效避免档案信息的泄露,有利于重要档案文件的安全、保密存储,适用于安全性要求高的档案文件的存储场景。场景。场景。

【技术实现步骤摘要】
一种基于信息抽取的档案存储方法及系统


[0001]本专利技术属于档案存储
,尤其涉及一种基于信息抽取的档案存储方法及系统。

技术介绍

[0002]档案是指人们在各项社会活动中直接形成的各种形式的具有保存价值的原始记录。档案是由文件有条件地转化而来的,这里的“文件”是指广义文件,即一切由文字、图表、声像等形式形成的各种材料。档案和文件是同一事物在不同价值阶段的不同形态,两者具有同源性和阶段性的共性,也具有实效、功用、离合等个性差异。档案具有历史再现性、知识性、信息性、文化性、社会性、教育性、价值性等特点,其中历史再现性为其本质属性,其他特点为其一般属性。因此,可将档案的定义简要地表述为:档案是再现历史真实面貌的原始文献。
[0003]对于重要的档案,通常需要进行纸质文件的保存,而现有的纸质档案的存储管理方式通常十分简单,只是按照档案的名字,确定对应的存储位置,将整个档案文件进行指定位置存储,主要目的是方便档案文件的找寻,这种纸质档案的存储管理方式,容易造成档案信息的泄露,不利于重要档案文件的安全、保密存储,因此不适用于对安全性要求高的档案文件的存储。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种基于信息抽取的档案存储方法及系统,旨在解决
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术实施例提供如下技术方案:一种基于信息抽取的档案存储方法,所述方法具体包括以下步骤:获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储;基于所述档案扫描信息,进行抽取识别,生成抽取识别结果;按照所述抽取识别结果,对所述纸质档案集进行抽取处理,得到多个档案抽取子集;分析确定多个所述档案抽取子集的存储位置;按照多个所述存储位置,对多个所述档案抽取子集进行存储指引。
[0006]作为本专利技术实施例技术方案进一步的限定,所述获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储具体包括以下步骤:接收档案人员的档案存储申请;对所述档案存储申请进行主体验证,并在验证成功之后,生成接收指令;根据所述接收指令,接收纸质档案集;对所述纸质档案集进行扫描,得到档案扫描信息;对所述档案扫描信息进行备份存储。
[0007]作为本专利技术实施例技术方案进一步的限定,所述基于所述档案扫描信息,进行抽取识别,生成抽取识别结果具体包括以下步骤:基于所述档案扫描信息,确定档案类型;根据所述档案类型,匹配分类抽取框架;按照所述分类抽取框架,生成多个分类抽取指令;按照多个所述分类抽取指令,对所述档案扫描信息进行抽取识别,生成抽取识别结果。
[0008]作为本专利技术实施例技术方案进一步的限定,所述按照所述抽取识别结果,对所述纸质档案集进行抽取处理,得到多个档案抽取子集具体包括以下步骤:按照所述抽取识别结果,生成多个纸质抽取指令;对多个所述纸质抽取指令进行顺序分析,确定指令顺序;按照所述指令顺序,分别发送多个纸质抽取指令;根据多个所述纸质抽取指令,对所述纸质档案集进行抽取处理,得到多个档案抽取子集。
[0009]作为本专利技术实施例技术方案进一步的限定,所述分析确定多个所述档案抽取子集的存储位置具体包括以下步骤:完成抽取处理之后,生成存储分配信号;获取多个空闲位置;按照所述存储分配信号,从多个所述空闲位置中选取多个所述档案抽取子集的存储位置。
[0010]作为本专利技术实施例技术方案进一步的限定,所述按照多个所述存储位置,对多个所述档案抽取子集进行存储指引具体包括以下步骤:监测档案人员拾取的档案抽取子集;按照所述档案抽取子集对应的存储位置,规划存储路线;根据所述存储路线,生成指引信号;按照所述存储路线,对档案人员进行档案抽取子集的存储指引。
[0011]一种基于信息抽取的档案存储系统,所述系统包括档案获取扫描单元、信息抽取识别单元、档案抽取处理单元、存储分析确定单元和档案存储指引单元,其中:档案获取扫描单元,用于获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储;信息抽取识别单元,用于基于所述档案扫描信息,进行抽取识别,生成抽取识别结果;档案抽取处理单元,用于按照所述抽取识别结果,对所述纸质档案集进行抽取处理,得到多个档案抽取子集;存储分析确定单元,用于分析确定多个所述档案抽取子集的存储位置;档案存储指引单元,用于按照多个所述存储位置,对多个所述档案抽取子集进行存储指引。
[0012]作为本专利技术实施例技术方案进一步的限定,所述信息抽取识别单元具体包括:类型确定模块,用于基于所述档案扫描信息,确定档案类型;
框架匹配模块,用于根据所述档案类型,匹配分类抽取框架;框架处理模块,用于按照所述分类抽取框架,生成多个分类抽取指令;抽取识别模块,用于按照多个所述分类抽取指令,对所述档案扫描信息进行抽取识别,生成抽取识别结果。
[0013]作为本专利技术实施例技术方案进一步的限定,所述档案抽取处理单元具体包括:结果处理模块,用于按照所述抽取识别结果,生成多个纸质抽取指令;顺序分析模块,用于对多个所述纸质抽取指令进行顺序分析,确定指令顺序;指令发送模块,用于按照所述指令顺序,分别发送多个纸质抽取指令;抽取处理模块,用于根据多个所述纸质抽取指令,对所述纸质档案集进行抽取处理,得到多个档案抽取子集。
[0014]作为本专利技术实施例技术方案进一步的限定,所述档案存储指引单元具体包括:拾取监测模块,用于监测档案人员拾取的档案抽取子集;路线规划模块,用于按照所述档案抽取子集对应的存储位置,规划存储路线;信号生成模块,用于根据所述存储路线,生成指引信号;存储指引模块,用于按照所述存储路线,对档案人员进行档案抽取子集的存储指引。
[0015]与现有技术相比,本专利技术的有益效果是:本专利技术实施例通过获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储;基于档案扫描信息,进行抽取识别;对纸质档案集进行抽取处理,得到多个档案抽取子集;分析确定多个档案抽取子集的存储位置;按照多个存储位置,对多个档案抽取子集进行存储指引。能够对纸质档案集进行信息扫描,按照档案扫描信息,进行抽取识别,进而抽取得到多个档案抽取子集,确定多个档案抽取子集对应的存储位置,进行存储指引,从而将纸质档案文件进行信息抽取的分类存储,有效避免档案信息的泄露,有利于重要档案文件的安全、保密存储,适用于安全性要求高的档案文件的存储场景。
附图说明
[0016]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例。
[0017]图1示出了本专利技术实施例提供的方法的流程图。
[0018]图2示出了本专利技术实施例提供的方法中获取档案扫描信息的流程图。
[0019]图3示出了本专利技术实施例提供的方法中生成抽取识别结果的流程图。
[0020]图4示出了本专利技术实施例提供的方法中得到档案抽取子集的流程图。
[0021]图5示出了本专利技术实施例提供的方法中子集存储位置确定的流程图。
[0022]图6示出了本专利技术实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于信息抽取的档案存储方法,其特征在于,所述方法具体包括以下步骤:获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储;基于所述档案扫描信息,进行抽取识别,生成抽取识别结果;按照所述抽取识别结果,对所述纸质档案集进行抽取处理,得到多个档案抽取子集;分析确定多个所述档案抽取子集的存储位置;按照多个所述存储位置,对多个所述档案抽取子集进行存储指引。2.根据权利要求1所述的基于信息抽取的档案存储方法,其特征在于,所述获取纸质档案集,进行扫描得到档案扫描信息,并进行备份存储具体包括以下步骤:接收档案人员的档案存储申请;对所述档案存储申请进行主体验证,并在验证成功之后,生成接收指令;根据所述接收指令,接收纸质档案集;对所述纸质档案集进行扫描,得到档案扫描信息;对所述档案扫描信息进行备份存储。3.根据权利要求1所述的基于信息抽取的档案存储方法,其特征在于,所述基于所述档案扫描信息,进行抽取识别,生成抽取识别结果具体包括以下步骤:基于所述档案扫描信息,确定档案类型;根据所述档案类型,匹配分类抽取框架;按照所述分类抽取框架,生成多个分类抽取指令;按照多个所述分类抽取指令,对所述档案扫描信息进行抽取识别,生成抽取识别结果。4.根据权利要求1所述的基于信息抽取的档案存储方法,其特征在于,所述按照所述抽取识别结果,对所述纸质档案集进行抽取处理,得到多个档案抽取子集具体包括以下步骤:按照所述抽取识别结果,生成多个纸质抽取指令;对多个所述纸质抽取指令进行顺序分析,确定指令顺序;按照所述指令顺序,分别发送多个纸质抽取指令;根据多个所述纸质抽取指令,对所述纸质档案集进行抽取处理,得到多个档案抽取子集。5.根据权利要求1所述的基于信息抽取的档案存储方法,其特征在于,所述分析确定多个所述档案抽取子集的存储位置具体包括以下步骤:完成抽取处理之后,生成存储分配信号;获取多个空闲位置;按照所述存储分配信号,从多个所述空闲位置中选取多个所述档案抽取子集的存储位置。6.根据权利要求1所述的基于信息抽取的档案存储方法,其特征在于,所述按照多个所述存储位置,对多个所述档案抽取子集进行存储指引具体包括以下步骤:监测档案人...

【专利技术属性】
技术研发人员:卢姗朱健张鹏刘明扬周莹张广鑫刘洁张弢焦健
申请(专利权)人:中信天津金融科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1