基于汉字分解和特征映射的手写体识别方法及装置制造方法及图纸

技术编号:29403819 阅读:12 留言:0更新日期:2021-07-23 22:42
本发明专利技术公开了基于汉字分解和特征映射的手写体识别方法及装置,涉及手写汉字识别技术领域;方法包括如下步骤S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果;装置包括结构层次化表示模块、嵌入表示模块和特征提取与映射模块;其通过步骤S2至步骤S4等,实现了识别手写汉字。

【技术实现步骤摘要】
基于汉字分解和特征映射的手写体识别方法及装置
本专利技术涉及手写汉字识别
,尤其涉及一种基于汉字分解和特征映射的手写体识别方法及装置。
技术介绍
手写汉字在场景文本识别中一直是一个非常困难的问题,主要是由于手写汉字的多样性,书写方式随意,不规正,无法达到印刷体要求;汉字字符级别比较繁杂,极具变化特点;诸多汉字在外形上相似,容易混淆;要求具备庞大的训练数据,但采集困难,特别是随意性、无约束性手写,对应数据库的构建显得力不从心等特点,因此解决好手写汉字识别可以解决财务报账中签字部分内容,从而判断签字内容是否符合要求,不再需要人工审视;从社会意义可见能够汉字识别技术可以应用于学生作业批改,手写笔记整理等实际场景中。一般而言,常见的手写中文单字识别系统主要包括数据预处理、特征提取和分类识别三部分,但是都非常依赖收集得到的数据,如专利《一种基于STDP的脉冲神经网络手写汉字识别方法CN201910954627.3》即是采用下载离线数据,对离线数据做预处理,确定神经元参数学习分类,这种方法的前提适用条件即是下载的离线数据集,但是如果需要适用于更广阔的手写汉字识别场景,必须要摆脱对于特定数据的依赖。本专利技术针对上述手写汉字算法过度依赖特定收集的数据的问题,提出了基于汉字拆解和特征映射的手写汉字识别方法。现有技术问题及思考:如何解决手写汉字识别困难的技术问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于汉字分解和特征映射的手写体识别方法及装置,其通过步骤S2至步骤S4等,实现了识别手写汉字。为解决上述技术问题,本专利技术所采取的技术方案是:一种基于汉字分解和特征映射的手写体识别方法包括如下步骤,S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。进一步的技术方案在于:还包括在步骤S2之前的步骤S1汉字分解,处理器从存储器获取文字图片,提取并形成每一汉字的单字图片。进一步的技术方案在于:在步骤S2中,所述汉字结构包括上下结构、左右结构、左中右结构、上中下结构、全包围结构、上半包围结构、左半包围结构、下半包围结构、右半包围结构和独立结构,共十种汉字结构;在步骤S3中,嵌入表示的步骤包括定义节点的路径长度L为根节点到该节点的最短距离,计算并获得每一个节点的影响因子。进一步的技术方案在于:在步骤S4中,转换模块将特征向量矩阵M压平为D维向量,然后经过两个全连接层转换为E维向量,选择E中概率值最大的作为识别结果;所述特征提取器为ResnetBlocks的特征提取器,该特征提取器包括四个通道分别是第一至第四通道,第一通道的通道数为64,第二通道的通道数为128,第三通道的通道数为256,第四通道的通道数为512。一种基于汉字分解和特征映射的手写体识别装置包括如下程序模块,结构层次化表示模块,用于处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;嵌入表示模块,用于处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;特征提取与映射模块,用于处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。进一步的技术方案在于:还包括汉字分解模块,用于处理器从存储器获取文字图片,提取并形成每一汉字的单字图片。进一步的技术方案在于:在结构层次化表示模块中,所述汉字结构包括上下结构、左右结构、左中右结构、上中下结构、全包围结构、上半包围结构、左半包围结构、下半包围结构、右半包围结构和独立结构,共十种汉字结构;在嵌入表示模块中,嵌入表示包括定义节点的路径长度L为根节点到该节点的最短距离,计算并获得每一个节点的影响因子。进一步的技术方案在于:特征提取与映射模块,还用于转换模块将特征向量矩阵M压平为D维向量,然后经过两个全连接层转换为E维向量,选择E中概率值最大的作为识别结果;所述特征提取器为ResnetBlocks的特征提取器,该特征提取器包括四个通道分别是第一至第四通道,第一通道的通道数为64,第二通道的通道数为128,第三通道的通道数为256,第四通道的通道数为512。一种基于汉字分解和特征映射的手写体识别装置包括存储器、处理器以及存储在存储器中并可在处理器上运行的上述程序模块,所述处理器执行程序模块时实现上述基于汉字分解和特征映射的手写体识别方法的步骤。一种基于汉字分解和特征映射的手写体识别装置为计算机可读存储介质,所述计算机可读存储介质存储有上述程序模块,所述程序模块被处理器执行时实现上述基于汉字分解和特征映射的手写体识别方法的步骤。采用上述技术方案所产生的有益效果在于:一种基于汉字分解和特征映射的手写体识别方法包括如下步骤,S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。其通过步骤S2至步骤S4等,实现了识别手写汉字。一种基于汉字分解和特征映射的手写体识别装置包括如下程序模块,结构层次化表示模块,用于处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;嵌入表示模块,用于处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;特征提取与映射模块,用于处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。其通过结构层次化表示模块、嵌入表示模块和特征提取与映射模块等,实现了识别手写汉字。一种基于汉字分解和特征映射的手写体识别装置包括存储器、处理器以及存储在存储器中并可在处理器上运行的上述程序模块,所述处理器执行程序模块时实现上述基于汉字分解和特征映射的手写体识别方法的步骤。其通过该装置,实现了识别手写汉字。一种基于汉字分解和特征映射的手写体识别装置为计算机可读存储介质,所述计算机可读存储介质存储有上述程序模块,所述程序模块被处理器执行时实现上述基于汉字分解和特征映射的手写体识别方法的步骤。其通过该装置,实现了识别手写汉字。详见具体实施方式部分描述。附图说明图1是本专利技术实施例1的流程图;图2是本专利技术实施例2的原理框图;图3是本专利技术中汉字结构的分类图;图4是本专利技术中汉字职的层次分解树的树图;图5是本专利技术中汉字树的层次分解树的树图;图6是本专利技术的数据流图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然本文档来自技高网...

【技术保护点】
1.一种基于汉字分解和特征映射的手写体识别方法,其特征在于:包括如下步骤,S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。/n

【技术特征摘要】
1.一种基于汉字分解和特征映射的手写体识别方法,其特征在于:包括如下步骤,S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。


2.根据权利要求1所述的基于汉字分解和特征映射的手写体识别方法,其特征在于:还包括在步骤S2之前的步骤S1汉字分解,处理器从存储器获取文字图片,提取并形成每一汉字的单字图片。


3.根据权利要求1所述的基于汉字分解和特征映射的手写体识别方法,其特征在于:在步骤S2中,所述汉字结构包括上下结构、左右结构、左中右结构、上中下结构、全包围结构、上半包围结构、左半包围结构、下半包围结构、右半包围结构和独立结构,共十种汉字结构;在步骤S3中,嵌入表示的步骤包括定义节点的路径长度L为根节点到该节点的最短距离,计算并获得每一个节点的影响因子。


4.根据权利要求1所述的基于汉字分解和特征映射的手写体识别方法,其特征在于:在步骤S4中,转换模块将特征向量矩阵M压平为D维向量,然后经过两个全连接层转换为E维向量,选择E中概率值最大的作为识别结果;所述特征提取器为ResnetBlocks的特征提取器,该特征提取器包括四个通道分别是第一至第四通道,第一通道的通道数为64,第二通道的通道数为128,第三通道的通道数为256,第四通道的通道数为512。


5.一种基于汉字分解和特征映射的手写体识别装置,其特征在于:包括如下程序模块,结构层次化表示模块,用于处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;嵌入表示模块,用于处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;特征提取与映射模块,用于处理器将单字图片发送...

【专利技术属性】
技术研发人员:刘义江陈蕾侯栋梁池建昆范辉阎鹏飞魏明磊李云超姜琳琳辛锐陈曦杨青沈静文吴彦巧姜敬檀小亚师孜晗
申请(专利权)人:国网河北省电力有限公司国网河北省电力有限公司雄安新区供电公司
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1