一种基于签名笔画序列的单字提取方法及系统技术方案

技术编号：35034570 阅读：41 留言：0更新日期：2022-09-24 23:10

本发明专利技术公开一种基于图像和序列的签名单字提取技术，涉及电子签名技术，减少笔画特征序列的坐标点集获得低采样率下签名的宏观特征，插值扩充笔画特征序列的坐标点集，获得高采样率下签名的微观特征，单字切割模块1使用插值模块输出的点集序列，单字切割模块2使用降采样模块输出的点集序列，单字切割模块中的笔画特征提取模块通过点集划分出笔画生成笔画特征，单字切割模块1和单字切割模块2使用嵌套命名实体识别方式根据笔画特征预测分别得到签名的笔画属性及字符数置信度，连笔切割模块根据笔画属性及字符数置信度判断是否存在连笔，对签名中的笔画连笔进行切割。获得更加鲁棒的单字提取效果，大幅提升签名识别准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于签名笔画序列的单字提取方法及系统

[0001]本专利技术涉及电子签名
，尤其涉及一种电子签名中单字提取方法。

技术介绍

[0002]在进行电子签名的校验中，会涉及到大量的签名对比，但现有的一些笔迹对比方法中，基本是以签名整体进行对比，没有将签名分割成单字为单位进行对比，导致在电子签名验证和对比中会损失很多笔画特征信息，以及获取的特征信息不准确，导致校验结果错误，准确率下降等一系列问题。对于书写中有连笔画等签名比对识别等带来极大困难。单字提取也是签名整体识别为汉字的前置必备条件，能够为持久的签名领域研究，数据建设等作出贡献。现有的一些整体识别算法，虽然有些能够较为精准的识别出汉字的内容，但是却并不能够精确地分离出字本身的全部笔画，用途非常受限。
[0003]公开号：CN113723413A，名称“一种基于贪吃蛇的手写中文文本切分方法”的中国专利技术专利申请。公开了一种基于贪吃蛇的手写中文文本切分方法，该方法用于图像文本的切分。根据文本行的垂直投影直方图和字符笔画宽度自适应计算字符间笔画薄弱位置，利用贪吃蛇算法在该区域内建立初始切分轨迹，并制定多重约束规则优化切分路径，实现手写文本的粗切分；根据字符宽度和宽高比阈值筛选粘连字符，从粘连字符的轮廓曲线和骨架特征入手，选取粘连切分点，并利用贪吃蛇算法进行二次切分；结合汉字的结构特征和汉字识别置信度完成过切分字符的合并，得到最终正确的文本切分结果。该方法基于图像文本切分，在该方法对粘连字符进行切分时，由于缺少了原始的书写轨迹，导致该方法在字之间笔画存在交叉...

【技术保护点】

【技术特征摘要】
1.一种基于笔画序列的签名单字提取方法，其特征在于，包括：降采样模块采集签名笔画特征序列，减少笔画特征序列的坐标点集，获得低采样率下签名的宏观特征，插值模块采集电子签名笔画特征序列，插值扩充笔画特征序列的坐标点集，获得高采样率下签名的微观特征，单字切割模块1与单字切割模块2的结构相同，单字切割模块1使用插值模块输出的点集序列，单字切割模块2使用降采样模块输出的点集序列，单字切割模块中的笔画特征提取模块通过点集划分出笔画生成笔画特征，单字切割模块1和单字切割模块2使用嵌套命名实体识别方式根据笔画特征预测分别得到签名的笔画属性及字符数置信度，连笔切割模块根据单字切割模块1和单字切割模块2输出的笔画属性及字符数置信度判断是否存在连笔，对签名中的笔画连笔进行切割。2.根据权利要求1所述的方法，其特征在于，所述获得低采样率下签名的宏观特征进一步包括，降采样模块采集电子签名笔画原始点集(x，y)，获取阈值角度θ，使用滑动窗口在点集上开始滑动删除非关键点，得到减少笔画特征的坐标点集序列(x
reduce
，y
reduce
)；所述删除非关键点进一步包括：取预定长度n的滑动窗口，从窗口起始点下标为i，向下标为i
‑
n的签名笔画原始点集中的点滑动，当取得滑动窗口的n个笔画点后，计算n点与当前滑动窗口起始点之间并以(x
i+1
，y
i+1
)为顶点的夹角θ
i
，若θ
i
＞θ，则在签名原始点集中删去该顶点对应的坐标点(x
i+1
，y
i+1
)，并令下标大于i的签名点下标减一，重新计算起始点下标为i的窗口；若θ
i
≤θ，则令窗口向后滑动，继续计算起始点下标为i+1的窗口，直至对笔画原始点集中的所有点完成滑动取得，降采样模块得到的点集长度的宏观特征坐标点集。3.根据权利要求2所述的方法，其特征在于，将上述经过降采样和插值后的笔画坐标点集划分笔画，设置目标笔画长度k，将签名笔画中特征序列长度大于k的笔画切割成若干个长度为k的笔画，对长度小于k的笔画用点集(0，0)补足点位使得长度为k，将一个签名的所有笔画转换为等长的笔画集合的点集。4.根据权利要求1
‑
3其中之一所述的方法，其特征在于，所述得到笔画属性及字符数置信度进一步包括，单字切割模块1获得笔画嵌入，单字切割模块2获得跨笔画特征，具备微观特征的等长签名笔画点集输入模块1，经过两个全连接层映射到高维空间获得笔画特征变量，再经过一个全连接层映射到一个固定维度的嵌入空间中，获得笔画嵌入；具有宏观特征的等长签名笔画点集输入模块2经过一个全连接层映射到高维空间，通过CNN对签名笔画点集进行卷积，以及最大池化，再经过一个全连接层映射到固定维度的嵌入空间中获得跨笔画特征，将笔画嵌入与跨笔画特征进行连接得到的笔画连接特征，利用条件随机场得到对应笔画属性以及字符数置信度。5.根据权利要求4所述的方法，其特征在于，所述对连笔进行分割进一步包括：若分割的字符中没有同时具有笔画属性B，E的笔画，不再对该字符进行分割，如分割字符中某笔画的笔画属性同时为B和E属性，根据字符结束笔画E属性的置信度α
E
、开始笔画B属性的置信度α
B
，根据公式r
target
＝(α
E
‑
0.5)/(α
E
+α
B
‑
1)计算对字符的分割比例，检测笔画向右向上发展并在x轴延伸出已书写的点集的范围，记录该处点位与整体笔画的点位比例r
candidate
，寻找与分割比例r
target
最接近的点位比例r
candidate
对应的点位之前的点位组成新的笔画，作为结束笔画赋予E属性，该点位之后的点位组成新的笔画，作为开始笔画赋予B属性。6.根据权利要求4或5所述的方法，其特征在于，对签名中存在笔画连笔进行切割包括，根据签名笔画的属性及对应的置信度，确定字符的开始笔画数、字符中间笔画数、字符结束
笔画数，计算所有开始笔画属性的平均置信度，取平均置信度高的笔画为开始笔画确定字符数置信度，具体包括，根据公式：α1＝(|0.5
‑
α
i
|+|0.5
‑
α
j
|+|0.5
‑
α
m
’
|+|0.5
‑
α
n
’
|+|0.5
‑
α
o
’
|)计算模块1输出的开始笔画属性的平均置信度，根据公式：α2＝(|0.5
‑
α
i
’
|+|0.5
‑
α
j
’
|+|0.5
‑
α
m
|+|0.5
‑
α
n
|+|0.5
‑
α
o
|)计算模块2输出的...

【专利技术属性】
技术研发人员：覃勋辉，刘科，祁松茂，毛今颂，
申请(专利权)人：重庆傲雄在线信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人