扭曲文档恢复方法、装置、设备及介质制造方法及图纸

技术编号:29021514 阅读:22 留言:0更新日期:2021-06-26 05:22
本发明专利技术涉及人工智能领域,提供一种扭曲文档恢复方法、装置、设备及介质,能够基于2D扰动网格生成扭曲样本,采用合成的方法生成训练数据,减少了人力收集数据的成本和难度,且生成的训练数据量可根据需要进行增减,解决了扭曲样本量及样本种类不足的问题,构建损失函数,采用掩膜图像进行模型的训练,使模型的训练关注于形变映射关系的学习,减小了背景、光照等其它因素的干扰,模型训练更易收敛,直接从对文本行的矫正出发,思路直观有效,且相比于利用整张图像,模型计算量小,更易部署,进而基于人工智能手段实现扭曲文本的自动恢复。此外,本发明专利技术还涉及区块链技术,扭曲文档恢复模型可存储于区块链节点中。存储于区块链节点中。存储于区块链节点中。

【技术实现步骤摘要】
扭曲文档恢复方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种扭曲文档恢复方法、装置、设备及介质。

技术介绍

[0002]随着移动设备的普及,随手拍照已成为一种对物理文档进行数字化的普遍方式,并可据此展开后续的自动化操作,如文字识别。但是,由于物理文档时常存在扭曲或者变形,且易受拍照角度的影响,使得文字识别难以达到理想效果。
[0003]针对上述问题,需要对扭曲的文档进行恢复,常见的方法如DocUnet、DewarpNet等,大多直接利用整张图片信息学习扭曲文档与平整化文档之间的映射关系,学习过程中易受到图像背景、光照等额外因素的干扰,进而对映射关系的学习造成不良影响,同时,整个过程计算量大,易受图片输入分辨率的影响。

技术实现思路

[0004]鉴于以上内容,有必要提供一种扭曲文档恢复方法、装置、设备及介质,能够基于人工智能手段实现扭曲文本的自动恢复。
[0005]一种扭曲文档恢复方法,所述方法包括:
[0006]根据扭曲文档恢复指令获取初始样本;
[0007]对所述初始样本进行文本检测,得到所述初始样本的文本行信息;
[0008]对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本,并获取所述初始样本与对应的扭曲样本间的映射关系;
[0009]构建损失函数;
[0010]根据所述初始样本与对应的扭曲样本间的映射关系,以及所述损失函数训练预设网络;
[0011]当所述损失函数的取值不再减小时,停止训练,得到扭曲文档恢复模型;
[0012]接收待恢复文档图片,对所述待恢复文档图片进行文本检测,得到待恢复信息;
[0013]将所述待恢复信息输入至所述扭曲文档恢复模型,得到目标映射关系,并根据所述目标映射关系恢复所述待恢复文档图片。
[0014]根据本专利技术优选实施例,所述根据扭曲文档恢复指令获取初始样本包括:
[0015]解析所述扭曲文档恢复指令的方法体,得到所述扭曲文档恢复指令所携带的信息;
[0016]获取预设标签;
[0017]根据所述预设标签构建正则表达式;
[0018]根据所述正则表达式对所述扭曲文档恢复指令所携带的信息进行遍历,并将遍历到的数据确定为目标地址;
[0019]连接至所述目标地址,并获取所述目标地址存储的数据作为所述初始样本。
[0020]根据本专利技术优选实施例,所述对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本包括:
[0021]在所述文本行信息上添加配置网格;
[0022]在所述配置网格上随机选择网格顶点作为初始变形点;
[0023]随机生成形变向量;
[0024]将所述初始变形点确定为起点,根据所述形变向量进行传播;
[0025]获取配置权重,根据所述配置权重计算所述配置网格中其他任意网格顶点变形后的坐标,得到网格图片;
[0026]对所述网格图片进行插值处理,生成与所述初始样本对应的扭曲样本。
[0027]根据本专利技术优选实施例,所述对所述网格图片进行插值处理,生成与所述初始样本对应的扭曲样本包括:
[0028]识别所述网格图片中的空格;
[0029]将每个空格确定为圆心,并根据预设半径在所述网格图片中识别每个空格的相邻区域;
[0030]检测所述相邻区域内的所有网格顶点;
[0031]根据检测到的网格顶点进行插值运算,得到每个空格的填充点的坐标;
[0032]根据每个空格的填充点的坐标填充每个空格,得到与所述初始样本对应的扭曲样本。
[0033]根据本专利技术优选实施例,所述构建损失函数包括:
[0034]将所述初始样本与对应的扭曲样本间的映射关系确定为训练标签;
[0035]将所述初始样本对应的输出作为预测映射关系;
[0036]根据所述预测映射关系及所述训练标签构建绝对损失函数;
[0037]根据所述预测映射关系及所述训练标签构建相对损失函数;
[0038]获取权重向量;
[0039]根据所述绝对损失函数、所述相对损失函数及所述权重向量构建所述损失函数。
[0040]根据本专利技术优选实施例,采用下述公式根据所述预测映射关系及所述训练标签构建绝对损失函数:
[0041][0042]其中,L
e
表示所述绝对损失函数,n表示点到数量,y
i
表示点i输出的预测映射关系,表示点i的训练标签;
[0043]采用下述公式根据所述预测映射关系及所述训练标签构建相对损失函数:
[0044][0045]其中,L
s
表示所述相对损失函数,y
j
表示点j输出的预测映射关系,表示点j的训练标签;
[0046]采用下述公式根据所述绝对损失函数、所述相对损失函数及所述权重向量构建所述损失函数:
[0047]L=αL
e
+βL
s
[0048]其中,L表示所述损失函数,α、β组成所述权重向量(α,β)。
[0049]根据本专利技术优选实施例,所述根据所述目标映射关系恢复所述待恢复文档图片包括:
[0050]获取所述待恢复信息中的每个坐标点;
[0051]根据所述目标映射关系确定每个坐标点恢复后对应的平整化坐标;
[0052]根据所述平整化坐标恢复所述待恢复文档图片。
[0053]一种扭曲文档恢复装置,所述扭曲文档恢复装置包括:
[0054]获取单元,用于根据扭曲文档恢复指令获取初始样本;
[0055]检测单元,用于对所述初始样本进行文本检测,得到所述初始样本的文本行信息;
[0056]扰动单元,用于对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本,并获取所述初始样本与对应的扭曲样本间的映射关系;
[0057]构建单元,用于构建损失函数;
[0058]训练单元,用于根据所述初始样本与对应的扭曲样本间的映射关系,以及所述损失函数训练预设网络;
[0059]所述训练单元,还用于当所述损失函数的取值不再减小时,停止训练,得到扭曲文档恢复模型;
[0060]所述检测单元,还用于接收待恢复文档图片,对所述待恢复文档图片进行文本检测,得到待恢复信息;
[0061]恢复单元,用于将所述待恢复信息输入至所述扭曲文档恢复模型,得到目标映射关系,并根据所述目标映射关系恢复所述待恢复文档图片。
[0062]一种电子设备,所述电子设备包括:
[0063]存储器,存储至少一个指令;及
[0064]处理器,执行所述存储器中存储的指令以实现所述扭曲文档恢复方法。
[0065]一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述扭曲文档恢复方法。
[0066]由以上技术方案可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种扭曲文档恢复方法,其特征在于,所述方法包括:根据扭曲文档恢复指令获取初始样本;对所述初始样本进行文本检测,得到所述初始样本的文本行信息;对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本,并获取所述初始样本与对应的扭曲样本间的映射关系;构建损失函数;根据所述初始样本与对应的扭曲样本间的映射关系,以及所述损失函数训练预设网络;当所述损失函数的取值不再减小时,停止训练,得到扭曲文档恢复模型;接收待恢复文档图片,对所述待恢复文档图片进行文本检测,得到待恢复信息;将所述待恢复信息输入至所述扭曲文档恢复模型,得到目标映射关系,并根据所述目标映射关系恢复所述待恢复文档图片。2.如权利要求1所述的扭曲文档恢复方法,其特征在于,所述根据扭曲文档恢复指令获取初始样本包括:解析所述扭曲文档恢复指令的方法体,得到所述扭曲文档恢复指令所携带的信息;获取预设标签;根据所述预设标签构建正则表达式;根据所述正则表达式对所述扭曲文档恢复指令所携带的信息进行遍历,并将遍历到的数据确定为目标地址;连接至所述目标地址,并获取所述目标地址存储的数据作为所述初始样本。3.如权利要求1所述的扭曲文档恢复方法,其特征在于,所述对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本包括:在所述文本行信息上添加配置网格;在所述配置网格上随机选择网格顶点作为初始变形点;随机生成形变向量;将所述初始变形点确定为起点,根据所述形变向量进行传播;获取配置权重,根据所述配置权重计算所述配置网格中其他任意网格顶点变形后的坐标,得到网格图片;对所述网格图片进行插值处理,生成与所述初始样本对应的扭曲样本。4.如权利要求3所述的扭曲文档恢复方法,其特征在于,所述对所述网格图片进行插值处理,生成与所述初始样本对应的扭曲样本包括:识别所述网格图片中的空格;将每个空格确定为圆心,并根据预设半径在所述网格图片中识别每个空格的相邻区域;检测所述相邻区域内的所有网格顶点;根据检测到的网格顶点进行插值运算,得到每个空格的填充点的坐标;根据每个空格的填充点的坐标填充每个空格,得到与所述初始样本对应的扭曲样本。5.如权利要求1所述的扭曲文档恢复方法,其特征在于,所述构建损失函数包括:将所述初始样本与对应的扭曲样本间的映射关系确定为训练标签;
将所述初始样本对应的输出作为预测映射关系;根据所述预测映射关系及所述训练标签构建绝对损失函数;根据所述预测映射关系及所述训练标签构建相对损失函数;获取权重向量;根据...

【专利技术属性】
技术研发人员:易苗张蓉
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1