一种手写数字识别实现方法技术

技术编号：32966404 阅读：52 留言：0更新日期：2022-04-09 11:23

本发明专利技术公开了一种手写数字识别实现方法，属于图像识别领域。本发明专利技术主要将卷积神经网络部署到ZYNQ嵌入式硬件平台上，通过软硬件协同加速实现手写数字识别。本发明专利技术首先对输入图像进行灰度化、二值化处理并且与数据集图片大小尺寸进行识别框匹配，之后将识别框图像存到BRAM存储单元中；然后在PL端完成对识别框图像数据进行卷积运算、激活函数、池化运算加速；之后将池化后的图像数据构造摄像头时序，传输到PS端DDR里；最后在PS端完成隐藏层和输出层运算，将识别结果传输到PL端显示识别结果。本发明专利技术可以加速部分神经网络的推理运算，并将图片中的手写数字迅速识别出来。中的手写数字迅速识别出来。中的手写数字迅速识别出来。

全部详细技术资料下载

【技术实现步骤摘要】
一种手写数字识别实现方法

[0001]本专利技术属于图像识别领域，具体为一种手写数字识别实现方法。

技术介绍

[0002]目前，人类手写字的识别问题成为了研究热点。这项技术已经被广泛应用在税务表处理、邮件分类和电脑阅卷等方面。在这些应用中通常要求手写数字识别算法具有较高的识别速度和识别精度以及较高的可靠性和稳定性。手写数字的类别虽然只用十种，笔画简单，但是其识别问题仍然存在很大的困难。现有的一些测试结果已经表明，数字的正确识别率并不如印刷体汉字识别正确率高，甚至也不如联机手写体汉字识别率高甚至。主要原因是字体相差不大，每个人的写法不一样，这就使识别更加困难。如何利用设备自动化、智能化、高效的识别数字和字符，提高工作效率则已成为当前亟待解决的研究问题。
[0003]卷积神经网络的概念在1998年由纽约大学的Yann Le Cun提出，是一个可以成功应用在手写字符识别、车牌识别等很多图像分类上的神经网络。卷积神经网络的本质就是多层感知机的一种。之所以卷积神经网络可以成功应用的在很多方面，主要是因为卷积神经网络的稀疏连接和参数共享可以大大减少网络中参数的数量，使得训练整个卷积神经网络计算量大大降低，变得实际可操作。
[0004]手写数字识别是CNN领域的经典问题，针对手写体识别领域广泛使用的Minist数据集。相较于印刷体数字，手写体数字随意性大，不确定性高，但手写体数字的识别在生活中有着广泛的应用，如银行票据识别、邮件自动分拣以及手机号码识别等。由于CNN具有庞大的参数量与计算量，导致模型无法实现跨平台部...

【技术保护点】

【技术特征摘要】
1.一种手写数字识别实现方法，其特征在于，包括以下步骤：步骤1、获取图像数据，在PL端完成视频数据的采集，并对数字采集区域完成图像的预处理；步骤2、将预处理后的数据存储在PL端的BRAM存储单元中里；步骤3、对卷积神经网络参数进行定点化转换，存入集成ARM与FPGA的嵌入式平台ZYNQ中的ROM IP单元内；步骤4、针对卷积神经网络的卷积核尺寸，构造相应的卷积矩阵，完成预处理后的数据与定点化参数的卷积运算；步骤5、对卷积层运算结果进行激活处理，并对激活结果进行最大池化运算；步骤6、对池化后的数据，构造相应的视频时序，利用Video In to AXI4
‑
Stream IP核和VDMAIP核将池化结果传输至PS端DDR；步骤7、PS端完成卷积神经网络的隐藏层和输出层运算，将识别结果通过AXI
‑
lite传输至PL端，PL端驱动显示器，在显示画面中实现识别结果的显示功能。2.根据权利要求1所述的手写数字识别实现方法，其特征在于，步骤1中对数字采集区域进行的图像的预处理包括：灰度转换、平滑降噪、二值化、降采样处理。3.根据权利要求1所述的手写数字识别实现方法，其特征在于，步骤3对卷积神经网络的权重参数值采用定点化运算的方式进行浮点数处理，通过对权值参数扩大一定的整数倍得到定点数。4.根据权利要求1所述的手写数字识别实现方法，其特征在于，使用5个ROM IP核来存储权重参数，卷积核的大小为5*5，每个ROM里面存储150个权重参数，按照5*5矩阵方式排列。5.根据权利要求1所述的手写数字识别实现方法，其特征在于，针对卷积神经网络的卷积核尺...

【专利技术属性】
技术研发人员：靳欣，张俊举，李智博，张经纬，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人