System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数字签名,尤其涉及一种数据向量化的离线签名认证方法和系统。
技术介绍
1、离线手写签名作为久经实践的社会传统,在金融、商业和取证等应用中具有广泛的应用,并且由于社会文化惯性,手写签名依然会广泛应用于银行办公、合同签署、行政管理等需要安全保障的场景。在这些场景中,离线手写签名的认证安全性一直是提供辅助安全保障的重要方法。签名认证属于行为特征认证技术,相比于传统的指纹特征、虹膜特征、人脸特征等基于生理特征的认证技术,有着更低的用户隐私保护需求,并且在隐私保护与用户特征效用之间,具备接受度更高、权衡性较好的特点。因而扎根于人工智能方法的离线手写签名的认证方法,对手写签名的稽核认证,避免过多的人工开销以及提高稽核速度、稽核准确率有着重要的意义。
2、离线手写签名认证算法通常包括数据预处理、特征提取、分类器构建等步骤。当前的离线手写签名认证方法主要有两类,一种是基于手工特征提取的方法,另一种是基于神经网络特征提取的方法。
3、在基于手工特征提取的方法中,使用诸如几何特征、形状与结构特征、方向和梯度特征、图像关键点特征、比例特征、纹理特征等设计特征提取方式,在该提取的特征下,通过编码、聚合等方式构建为全局特征,并将其传入指定分类器或计算特征距离进行鉴伪判断。如专利cn104200239a、cn106778586a、cn113569863a。由于签名设备、时间差异、写字状态差异等情况,签名存在差异大的问题不可避免,而这类方法依赖于模板匹配,当底库模板与当前比较签名的图像差异较大时候,该类方法效果受到较大影
4、在基于神经网络特征提取的方法中,这类方法通常采用用户或数据相关的分类器。如cn106778586b方法让每个用户字迹信息作为一个单独的类,训练用户相关的卷积神经网络。这类方法在面对新增用户时候,将重新训练分类任务或重新训练基于用户信息的分类器。还有如如cn114360071a,cn115966029a,cn116152815a等,这类方法需要同时输入两张签名图像,一方面,只进行了较少的底库模板匹配,单模板具有决定性的判别影响力,受底库模板的影响较大,另一方面,方法需要更高的gpu计算开销。
技术实现思路
1、本专利技术的目的在于提供一种数据向量化的离线签名认证方法和系统,实现了以签名字迹向量化数据管理方式,处理大规模签名数据新增、管理系统化案例。
2、本专利技术采用的技术方案是:
3、一种数据向量化的离线签名认证方法,其包括以下步骤:
4、步骤1,获取手写字迹图像并进行预处理以截取得到签名单字;
5、步骤2,构建用于签名单字的字迹特征提取的sincnn模型,并利用签名字迹样本集合训练sincnn模型;sincnn模型的训练步骤如下:
6、步骤2-1,对未标注的单字图片进行数据增强得到两个正样本,
7、步骤2-2,两个正样本匹配对后分别通过孪生网络的基础模块进行特征提取,并各自通过一个dense层对特征表示距离采用softmax函数作为激活函数进行签名字迹特征分类;
8、步骤2-3,将提取的签名字迹特征存储为底库字迹特征;
9、步骤3,将签名单字输入训练好的sincnn模型提取抽象签名字迹特征;
10、步骤4,计算单个签名相似度:将当前图片的抽象签名字迹特征与底库字迹特征进行批量对比操作,并分别计算余弦相似度;
11、步骤5,统计余弦相似度最高的前10个对应的用户id,遍历当前签名的所有单字,统计每个字对应的用户id频数和;
12、步骤6,获取频数超过设定频数阈值所有用户id中相似度值排名前5和频数排名前5的用户id的交集,选取交集中最高频数值的用户id作为预测值。
13、进一步地,步骤1具体包括以下步骤:
14、步骤1-1,获取签名字迹样本集合,并对签名字迹样本进行数学形态处理得到带有人员详细的手写字迹图像;如人员编号_手写中文字迹。
15、步骤1-2,对手写字迹图像的签名字迹进行旋转二值化;利用sobel算子求得图像梯度信息,在图像梯度信息的基础上使用otsu算法确定二值化的阈值。
16、步骤1-3,基于二值化的签名字迹截取签名区域图像,
17、步骤1-3具体包括以下步骤:
18、步骤1-3-1,针对非标准二值化图像进行图片的膨胀和腐蚀操作得到预处理后的图片轮廓区域;
19、步骤1-3-2,对所有轮廓区域生成矩形框,去除面积小的部分、筛查轮廓比例偏移的部分,返回感兴趣区域的矩形框坐标;
20、步骤1-3-3,按照x和y轴的坐标点最值点扩大轮廓生成的矩形区域,保证截取的签名区域是非倾斜的区域;
21、步骤1-3-4,同时进行矩形区域边界越界判定,生成去除大部分留白背景的签名图像区域图片。
22、步骤1-4,在签名区域进行目标检测以截取签名单字;
23、步骤1-4中将单字图片处理成三通道图像,送入经过分割单字数据训练过后的yolov5目标检测模型,输入当前签名区域的多个单字进行分割,以得到签名单字。
24、进一步地,步骤2-2中基于用户id信息的字迹进行两个正样本匹配。
25、进一步地,步骤6的具体步骤如下:
26、步骤6-1,根据用户id统计对应的相似度值之和求平均;
27、步骤6-2,统计频数超过设定频数阈值所有用户id中相似度值前5对应的用户id形成相似度集合;
28、步骤6-3,在频数超过设定频数阈值所有用户id中取频数最高的前5个用户id形成频数集合,求相似度集合与频数集合的交集;
29、步骤6-4,选取交集中最高频数值的用户id作为预测值输出。
30、进一步地,步骤6中设定频数阈值为5。
31、一种数据向量化的离线签名认证系统,其包括数据管理模块、算法能力模块两个组成部分:
32、数据管理模块包括如下单元:
33、新增底库签名向量单元:管理新增签名数据,调用输入签名向量化能力,并将多个签名的标签统一为当前处理的用户id;
34、输入签名向量化单元:将输入的新签名图像,通过调用算法能力模块中的能力,生成高维的特征向量,保存到对应的向量数据库中;
35、签名向量比较单元:将签名向量与底库所有签名向量进行比对,寻找最相似的向量对应用户id;单个字返回前三个相似度最高的相似度值以及用户id,按照所有单字的返回结果,统计相同用户id对应的所有相似度累加,取最高值对应的用户id作为预测值;
36、算法模块替换单元:替换算法能力,保证算法能力输入输出相同即可直接替换算法功能,实现算法能力管理;
37、前端交互单元:提供前端操作页面进行数据管理与算法能力管理。
38、算法能力管理模块本文档来自技高网...
【技术保护点】
1.一种数据向量化的离线签名认证方法,其特征在于:其包括以下步骤:
2.根据权利要求1所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1具体包括以下步骤:
3.根据权利要求2所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1-3具体包括以下步骤:
4.根据权利要求3所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1-4中将单字图片处理成三通道图像,送入经过分割单字数据训练过后的yolov5目标检测模型,输入当前签名区域的多个单字进行分割,以得到签名单字。
5.根据权利要求1所述的一种数据向量化的离线签名认证方法,其特征在于:步骤2-2中基于用户ID信息的字迹进行两个正样本匹配。
6.根据权利要求1所述的一种数据向量化的离线签名认证方法,其特征在于:步骤6的具体步骤如下:
7.根据权利要求1或6所述的一种数据向量化的离线签名认证方法,其特征在于:步骤6中设定频数阈值为5。
8.一种数据向量化的离线签名认证系统,采用权利要求1至7任一项所述的一种数据向量化的离线签名认证方法,其
9.根据权利要求8所述的一种数据向量化的离线签名认证系统,其特征在于:前端交互单元的底层功能包括:
10.根据权利要求9所述的一种数据向量化的离线签名认证系统,其特征在于:签名认证加速模块使用英伟达tritonserver模块对模型进行加速。
...【技术特征摘要】
1.一种数据向量化的离线签名认证方法,其特征在于:其包括以下步骤:
2.根据权利要求1所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1具体包括以下步骤:
3.根据权利要求2所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1-3具体包括以下步骤:
4.根据权利要求3所述的一种数据向量化的离线签名认证方法,其特征在于:步骤1-4中将单字图片处理成三通道图像,送入经过分割单字数据训练过后的yolov5目标检测模型,输入当前签名区域的多个单字进行分割,以得到签名单字。
5.根据权利要求1所述的一种数据向量化的离线签名认证方法,其特征在于:步骤2-2中基于用户id信息的字迹进行两个正样本匹配。
【专利技术属性】
技术研发人员:段绿林,陈前昕,
申请(专利权)人:中电福富信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。