System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种档案目录生成方法和装置。
技术介绍
1、随着社会的电子信息化发展,纸质档案逐渐被电子档案所替代,但是已经存在的大量纸质档案需要电子化,在将纸质档案转化为电子档案的过程中,需要人工提取档案中的标题、类号、页码和材料形成时间。
2、现有技术中,在档案的电子化过程中,对于数以万计、百万计的信息提取任务,需要耗费大量的人力资源和物力资源,导致电子档案生成的效率和准确性较低。
技术实现思路
1、针对现有技术中的问题,本专利技术实施例提供一种档案目录生成方法和装置。
2、具体地,本专利技术实施例提供了以下技术方案:
3、第一方面,本专利技术实施例提供了一种档案目录生成方法,包括:
4、获取目标档案的电子图像;
5、从所述电子图像中提取出目标信息对应的电子图像单元;所述目标信息为档案目录中所需的信息;
6、根据所述目标信息对应的电子图像单元,得到所述目标档案对应的档案目录。
7、进一步地,所述根据所述目标信息对应的电子图像单元,得到所述目标档案对应的档案目录,包括:
8、对所述电子图像单元中的文字进行识别,得到所述电子图像单元中的文字信息;
9、根据所述电子图像单元中的文字信息,生成所述目标档案对应的档案目录。
10、进一步地,所述对所述电子图像单元中的文字进行识别,得到所述电子图像单元中的文字信息之前,还包括:
11、检测所述电
12、根据所述电子图像单元中的文字方向,将所述电子图像单元按照顺时针或逆时针方向进行旋转,得到旋转后的所述电子图像单元。
13、进一步地,所述根据所述电子图像单元中的文字方向,将所述电子图像单元按照顺时针或逆时针方向进行旋转,得到旋转后的所述电子图像单元,包括:
14、根据所述电子图像单元中的文字方向,将所述电子图像单元按照目标角度进行旋转,得到旋转后的所述电子图像单元;所述旋转后的所述电子图像单元中的文字方向与预设目标方向的偏差在预设范围内;所述目标角度包括以下至少一项:90度、180度和270度。
15、进一步地,所述得到旋转后的所述电子图像单元之后,还包括:
16、检测旋转后的所述电子图像单元中的文字方向;
17、根据旋转后的所述电子图像单元中的文字方向,对旋转后的所述电子图像单元对应的倾斜角度进行纠偏,得到纠偏后的电子图像单元。
18、进一步地,所述根据所述电子图像单元中的文字信息,生成所述目标档案对应的档案目录,包括:
19、对所述电子图像单元中的文字信息进行语义分析,得到所述电子图像单元中的文字信息的语义分析结果;
20、根据所述语义分析结果,对所述电子图像单元中的文字信息进行修正,得到修正后的文字信息;
21、根据所述修正后的文字信息,得到所述目标档案对应的档案目录。
22、进一步地,所述目标信息包括以下至少一项:
23、档案标题、档案类号、档案页码和档案形成时间。
24、第二方面,本专利技术实施例还提供了一种档案目录生成装置,包括:
25、获取模块,用于获取目标档案的电子图像;
26、处理模块,用于从所述电子图像中提取出目标信息对应的电子图像单元;所述目标信息为档案目录中所需的信息;
27、生成模块,根据所述目标信息对应的电子图像单元,得到所述目标档案对应的档案目录。
28、第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述档案目录生成方法的步骤。
29、第四方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述档案目录生成方法的步骤。
30、第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述档案目录生成方法的步骤。
31、本专利技术实施例提供的档案目录生成方法和装置,通过从电子图像中提取出目标信息对应的电子图像单元,也就可以得到电子图像单元中包含的档案标题、档案类号、档案页码和档案形成时间等文字信息并准确高效的生成目标档案对应的档案目录,有效地提升了档案电子化的效率和准确性,解决了档案电子化过程中效率较低和准确性较差的问题。
本文档来自技高网...【技术保护点】
1.一种档案目录生成方法,其特征在于,包括:
2.根据权利要求1所述的档案目录生成方法,其特征在于,所述根据所述目标信息对应的电子图像单元,得到所述目标档案对应的档案目录,包括:
3.根据权利要求2所述的档案目录生成方法,其特征在于,所述对所述电子图像单元中的文字进行识别,得到所述电子图像单元中的文字信息之前,还包括:
4.根据权利要求3所述的档案目录生成方法,其特征在于,所述根据所述电子图像单元中的文字方向,将所述电子图像单元按照顺时针或逆时针方向进行旋转,得到旋转后的所述电子图像单元,包括:
5.根据权利要求4所述的档案目录生成方法,其特征在于,所述得到旋转后的所述电子图像单元之后,还包括:
6.根据权利要求2-5任一项所述的档案目录生成方法,其特征在于,所述根据所述电子图像单元中的文字信息,生成所述目标档案对应的档案目录,包括:
7.根据权利要求1-5任一项所述的档案目录生成方法,其特征在于,所述目标信息包括以下至少一项:
8.一种档案目录生成装置,其特征在于,包括:
9.一种档
...【技术特征摘要】
1.一种档案目录生成方法,其特征在于,包括:
2.根据权利要求1所述的档案目录生成方法,其特征在于,所述根据所述目标信息对应的电子图像单元,得到所述目标档案对应的档案目录,包括:
3.根据权利要求2所述的档案目录生成方法,其特征在于,所述对所述电子图像单元中的文字进行识别,得到所述电子图像单元中的文字信息之前,还包括:
4.根据权利要求3所述的档案目录生成方法,其特征在于,所述根据所述电子图像单元中的文字方向,将所述电子图像单元按照顺时针或逆时针方向进行旋转,得到旋转后的所...
【专利技术属性】
技术研发人员:刘子强,王彬燕,刘万超,
申请(专利权)人:北京航星永志科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。