一种基于签名笔画序列的单字提取方法及系统技术方案

技术编号:35034570 阅读:26 留言:0更新日期:2022-09-24 23:10
本发明专利技术公开一种基于图像和序列的签名单字提取技术,涉及电子签名技术,减少笔画特征序列的坐标点集获得低采样率下签名的宏观特征,插值扩充笔画特征序列的坐标点集,获得高采样率下签名的微观特征,单字切割模块1使用插值模块输出的点集序列,单字切割模块2使用降采样模块输出的点集序列,单字切割模块中的笔画特征提取模块通过点集划分出笔画生成笔画特征,单字切割模块1和单字切割模块2使用嵌套命名实体识别方式根据笔画特征预测分别得到签名的笔画属性及字符数置信度,连笔切割模块根据笔画属性及字符数置信度判断是否存在连笔,对签名中的笔画连笔进行切割。获得更加鲁棒的单字提取效果,大幅提升签名识别准确率。率。率。

【技术实现步骤摘要】
一种基于签名笔画序列的单字提取方法及系统


[0001]本专利技术涉及电子签名
,尤其涉及一种电子签名中单字提取方法。

技术介绍

[0002]在进行电子签名的校验中,会涉及到大量的签名对比,但现有的一些笔迹对比方法中,基本是以签名整体进行对比,没有将签名分割成单字为单位进行对比,导致在电子签名验证和对比中会损失很多笔画特征信息,以及获取的特征信息不准确,导致校验结果错误,准确率下降等一系列问题。对于书写中有连笔画等签名比对识别等带来极大困难。单字提取也是签名整体识别为汉字的前置必备条件,能够为持久的签名领域研究,数据建设等作出贡献。现有的一些整体识别算法,虽然有些能够较为精准的识别出汉字的内容,但是却并不能够精确地分离出字本身的全部笔画,用途非常受限。
[0003]公开号:CN113723413A,名称“一种基于贪吃蛇的手写中文文本切分方法”的中国专利技术专利申请。公开了一种基于贪吃蛇的手写中文文本切分方法,该方法用于图像文本的切分。根据文本行的垂直投影直方图和字符笔画宽度自适应计算字符间笔画薄弱位置,利用贪吃蛇算法在该区域内建立初始切分轨迹,并制定多重约束规则优化切分路径,实现手写文本的粗切分;根据字符宽度和宽高比阈值筛选粘连字符,从粘连字符的轮廓曲线和骨架特征入手,选取粘连切分点,并利用贪吃蛇算法进行二次切分;结合汉字的结构特征和汉字识别置信度完成过切分字符的合并,得到最终正确的文本切分结果。该方法基于图像文本切分,在该方法对粘连字符进行切分时,由于缺少了原始的书写轨迹,导致该方法在字之间笔画存在交叉时不能将笔画进行细致的切分,容易存在笔画切分不完整的情况,同时,若两个字之间重叠较为严重时,该方法不能够切分出正确的文本。最后,该方法切分的准确率较低,均为90%以下,不具备太大实用价值。
[0004]公开号:CN111160245A,名称“一种动态签名识别方法及设备”的中国专利技术专利申请,依序对签名文件进行解析、基于笔画属性聚类的字符分割及笔画预处理,得到动态签名中的各单字符对应的至少两个有效采样点及每个所述有效采样点的归一化坐标,对各单字符的特征向量进行字符分类,并整合所有单字符的分类结果,实现对动态签名中的各单字符的有效识别。该方法针对笔画级别进行了切分,但是若签名中存在部分一笔画问题,即单一的笔画无法单纯归类于一个字符,而是被两个或更多字符共享的情况,该方法无法解决。
[0005]由于电子签名字数少,签名字符紧凑,很多龙飞凤舞的签名单字之间有勾连,即一笔画两个字,现有的一些单字提取办法,有基于离线数据(图像)的,和基于在线数据(序列)的基本都是将签名作为一个整体进行识别,没有对单字之间相互勾连,即俗称的一笔画进行分割区分,对紧凑的连笔画签名中的单字不能精确识别,导致电子签名识别的精准度不高,不能满足司法鉴定等要求高的应用场景对电子签名原笔迹识别鉴真的要求。

技术实现思路

[0006]本专利技术针对电子签名字符数少,笔画之间勾连、交叉、重叠等情况较多,现有技术
在电子签名识别方面对单字之间相互勾连情况的识别分割方面存在的笔画切分不完整、不能识别一笔画被两个或更多字符共享等情况,导致签名识别精确度低。本专利技术针对签字笔画交叉,以及重叠等现象进行了通用性的处理,在签名识别的单字提取中考虑字之间的笔画勾连情况(简称连笔)。
[0007]本专利技术提出一种基于笔画序列的签名单字提取方法,包括:降采样模块采集签名笔画特征序列,减少笔画特征序列的坐标点集,获得低采样率下签名的宏观特征,插值模块采集电子签名笔画特征序列,插值扩充笔画特征序列的坐标点集,获得高采样率下签名的微观特征,单字切割模块1与单字切割模块2的结构相同,单字切割模块1使用插值模块输出的点集序列(x
up
,y
up
),单字切割模块2使用降采样模块输出的点集序列(x
reduce
,y
reduce
),单字切割模块中的笔画特征提取模块通过点集划分出笔画生成笔画特征,单字切割模块1和单字切割模块2使用嵌套命名实体识别方式根据笔画特征预测分别得到签名的笔画属性及字符数置信度,连笔切割模块根据单字切割模块1和单字切割模块2输出的笔画属性及字符数置信度判断是否存在连笔,对签名中的笔画连笔进行切割。
[0008]进一步优选,所述获得低采样率下签名的宏观特征进一步包括,降采样模块采集电子签名笔画原始点集(x,y),获取阈值角度θ,使用滑动窗口在点集上开始滑动删除非关键点,得到减少笔画特征的坐标点集序列(x
reduce
,y
reduce
);所述获得高采样率下签名的微观特征进一步包括,设置目标笔画长度k,将签名笔画中特征序列长度大于k的笔画切割成若干个长度为k的笔画,对长度小于k的笔画用点集(0,0)补足点位使得长度为k,将一个签名的所有笔画转换为等长的笔画集合的点集。
[0009]进一步优选,所述删除非关键点进一步包括:取预定长度n的滑动窗口,从窗口起始点下标为i,向下标为i
‑‑
n的签名笔画原始点集中的点滑动,当取得滑动窗口的n个笔画点后,计算n点与当前滑动窗口起始点之间并以(x
i+1
,y
i+1
)为顶点的夹角θ
i
,若θ
i
>θ,则在签名原始点集中删去该顶点对应的坐标点(x
i+1
,y
i+1
),并令下标大于
i
的签名点下标减一,重新计算起始点下标为i的窗口;若θ
i
≤θ,则令窗口向后滑动,继续计算起始点下标为i+1的窗口,直至对笔画原始点集中的所有点完成滑动取得,降采样模块得到的点集长度的宏观特征坐标点集。
[0010]进一步优选,所述得到笔画属性及字符数置信度进一步包括,单字切割模块1获得笔画嵌入,单字切割模块2获得跨笔画特征,具备微观特征的等长签名笔画点集输入模块1,经过两个全连接层映射到高维空间获得笔画特征变量,再经过一个全连接层映射到一个固定维度的嵌入空间中,获得笔画嵌入;具有宏观特征的等长签名笔画点集输入模块2经过一个全连接层映射到高维空间,通过CNN对签名笔画点集进行卷积,以及最大池化,再经过一个全连接层映射到固定维度的嵌入空间中获得跨笔画特征,将笔画嵌入与跨笔画特征进行连接得到的笔画连接特征,利用条件随机场得到对应笔画属性以及字符数置信度,将笔画嵌入和跨笔画特征输入双向LSTM网络中在1维方向上的合并得到笔画连接特征。
[0011]进一步优选,对签名中存在笔画连笔进行切割包括,根据签名笔画的属性及对应的置信度,确定字符的开始笔画数、字符中间笔画数、字符结束笔画数,计算所有开始笔画属性的平均置信度,取平均置信度高的笔画为开始笔画确定字符数置信度,具体包括,根据公式:
[0012]α1=(|0.5

α
i
|+|0.5

α
j
|+|0.5

α
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于笔画序列的签名单字提取方法,其特征在于,包括:降采样模块采集签名笔画特征序列,减少笔画特征序列的坐标点集,获得低采样率下签名的宏观特征,插值模块采集电子签名笔画特征序列,插值扩充笔画特征序列的坐标点集,获得高采样率下签名的微观特征,单字切割模块1与单字切割模块2的结构相同,单字切割模块1使用插值模块输出的点集序列,单字切割模块2使用降采样模块输出的点集序列,单字切割模块中的笔画特征提取模块通过点集划分出笔画生成笔画特征,单字切割模块1和单字切割模块2使用嵌套命名实体识别方式根据笔画特征预测分别得到签名的笔画属性及字符数置信度,连笔切割模块根据单字切割模块1和单字切割模块2输出的笔画属性及字符数置信度判断是否存在连笔,对签名中的笔画连笔进行切割。2.根据权利要求1所述的方法,其特征在于,所述获得低采样率下签名的宏观特征进一步包括,降采样模块采集电子签名笔画原始点集(x,y),获取阈值角度θ,使用滑动窗口在点集上开始滑动删除非关键点,得到减少笔画特征的坐标点集序列(x
reduce
,y
reduce
);所述删除非关键点进一步包括:取预定长度n的滑动窗口,从窗口起始点下标为i,向下标为i

n的签名笔画原始点集中的点滑动,当取得滑动窗口的n个笔画点后,计算n点与当前滑动窗口起始点之间并以(x
i+1
,y
i+1
)为顶点的夹角θ
i
,若θ
i
>θ,则在签名原始点集中删去该顶点对应的坐标点(x
i+1
,y
i+1
),并令下标大于i的签名点下标减一,重新计算起始点下标为i的窗口;若θ
i
≤θ,则令窗口向后滑动,继续计算起始点下标为i+1的窗口,直至对笔画原始点集中的所有点完成滑动取得,降采样模块得到的点集长度的宏观特征坐标点集。3.根据权利要求2所述的方法,其特征在于,将上述经过降采样和插值后的笔画坐标点集划分笔画,设置目标笔画长度k,将签名笔画中特征序列长度大于k的笔画切割成若干个长度为k的笔画,对长度小于k的笔画用点集(0,0)补足点位使得长度为k,将一个签名的所有笔画转换为等长的笔画集合的点集。4.根据权利要求1

3其中之一所述的方法,其特征在于,所述得到笔画属性及字符数置信度进一步包括,单字切割模块1获得笔画嵌入,单字切割模块2获得跨笔画特征,具备微观特征的等长签名笔画点集输入模块1,经过两个全连接层映射到高维空间获得笔画特征变量,再经过一个全连接层映射到一个固定维度的嵌入空间中,获得笔画嵌入;具有宏观特征的等长签名笔画点集输入模块2经过一个全连接层映射到高维空间,通过CNN对签名笔画点集进行卷积,以及最大池化,再经过一个全连接层映射到固定维度的嵌入空间中获得跨笔画特征,将笔画嵌入与跨笔画特征进行连接得到的笔画连接特征,利用条件随机场得到对应笔画属性以及字符数置信度。5.根据权利要求4所述的方法,其特征在于,所述对连笔进行分割进一步包括:若分割的字符中没有同时具有笔画属性B,E的笔画,不再对该字符进行分割,如分割字符中某笔画的笔画属性同时为B和E属性,根据字符结束笔画E属性的置信度α
E
、开始笔画B属性的置信度α
B
,根据公式r
target
=(α
E

0.5)/(α
E

B

1)计算对字符的分割比例,检测笔画向右向上发展并在x轴延伸出已书写的点集的范围,记录该处点位与整体笔画的点位比例r
candidate
,寻找与分割比例r
target
最接近的点位比例r
candidate
对应的点位之前的点位组成新的笔画,作为结束笔画赋予E属性,该点位之后的点位组成新的笔画,作为开始笔画赋予B属性。6.根据权利要求4或5所述的方法,其特征在于,对签名中存在笔画连笔进行切割包括,根据签名笔画的属性及对应的置信度,确定字符的开始笔画数、字符中间笔画数、字符结束
笔画数,计算所有开始笔画属性的平均置信度,取平均置信度高的笔画为开始笔画确定字符数置信度,具体包括,根据公式:α1=(|0.5

α
i
|+|0.5

α
j
|+|0.5

α
m

|+|0.5

α
n

|+|0.5

α
o

|)计算模块1输出的开始笔画属性的平均置信度,根据公式:α2=(|0.5

α
i

|+|0.5

α
j

|+|0.5

α
m
|+|0.5

α
n
|+|0.5

α
o
|)计算模块2输出的...

【专利技术属性】
技术研发人员:覃勋辉刘科祁松茂毛今颂
申请(专利权)人:重庆傲雄在线信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1