基于哈希检索的手写英文单词智能识别方法技术

技术编号：20363316 阅读：42 留言：0更新日期：2019-02-16 16:43

本发明专利技术公开提供了一种基于哈希检索的手写英文单词智能识别方法，包括以下步骤：步骤(1)：提取数据库中每一张手写英文单词图像的视觉特征和标签信息，分别得到对应的视觉特征矩阵和标签信息矩阵；步骤(2)：根据标签信息矩阵计算数据库中图像两两之间的相似性，得到相似性矩阵；步骤(3)：利用视觉特征矩阵、标签信息矩阵和相似性矩阵，获得数据库中每一张手写英文单词图像的哈希码；步骤(4)：根据获得的哈希码，学习视觉特征到哈希码的映射，即哈希函数；步骤(5)：读取待检索的手写英文单词图像，利用哈希码检索数据库中图像的哈希码，完成图像识别。

全部详细技术资料下载

【技术实现步骤摘要】
基于哈希检索的手写英文单词智能识别方法
本专利技术涉及字符识别领域，具体涉及一种基于哈希检索的手写英文单词智能识别方法。
技术介绍
随着信息技术的飞速发展，机器识别手写字符成为了研究的热门领域，字符识别技术涉及到图像处理、机器学习、模式识别等多个学科，并且广泛应用于手写文档电子化，减少人工录入成本，提高输入效率。目前应用于脱机手写英文单词识别的主要方法有三类：结构方法、统计方法和神经网络方法。结构方法在实际应用中抗干扰能力差且复杂度高，这种技术已经逐渐衰弱。统计方法有很强的理论基础，其中基于隐马尔科夫模型的统计学方法具有很好的建模能力，对噪声和变形也都有较好的适应性，已经被广泛应用于脱机手写字符的识别中，并取得了不错的成果。近年来，深度学习发展迅速，由于神经网络有较强的学习能力和容错能力，很多基于神经网络的方法被提出，主要分为两大类：基于卷积神经网络的和基于递归神经网络的方法。基于卷积神经网络的方法一般用来做分类任务，利用卷积层提取图片的本质特征，用多层的全连接作为分类器；基于递归神经网络的方法利用递归神经网络考虑时间序列的优势，每一个时间戳生成一个字符，得到的字符序列就是识别结果。但是，当前采用的脱机手写英文单词识别方法均存在手写单词形状严重变形等问题，脱机手写字符识别一直以来都是字符识别领域中的一个重点和难点。另外，基于检索的手写英文单词识别中需要对单词图库进行检索对比，而且数据量巨大，传统的检索方法往往难以保证实时性。
技术实现思路
针对以上问题，本专利技术的目的在于提供一种基于哈希检索的手写英文单词智能识别方法。基于哈希学习的检索在计算机视觉、机器学习...

【技术保护点】
1.一种基于哈希检索的手写英文单词智能识别方法，其特征在于，包括以下步骤：步骤(1)：提取数据库中每一张手写英文单词图像的视觉特征和标签信息，分别得到对应的视觉特征矩阵和标签信息矩阵；步骤(2)：根据标签信息矩阵计算数据库中图像两两之间的相似性，得到相似性矩阵；步骤(3)：利用视觉特征矩阵、标签信息矩阵和相似性矩阵，获得数据库中每一张手写英文单词图像的哈希码；步骤(4)：根据获得的哈希码，学习视觉特征到哈希码的映射，即哈希函数；步骤(5)：读取待检索的手写英文单词图像，利用哈希码检索数据库中图像的哈希码，完成图像识别。

【技术特征摘要】
1.一种基于哈希检索的手写英文单词智能识别方法，其特征在于，包括以下步骤：步骤(1)：提取数据库中每一张手写英文单词图像的视觉特征和标签信息，分别得到对应的视觉特征矩阵和标签信息矩阵；步骤(2)：根据标签信息矩阵计算数据库中图像两两之间的相似性，得到相似性矩阵；步骤(3)：利用视觉特征矩阵、标签信息矩阵和相似性矩阵，获得数据库中每一张手写英文单词图像的哈希码；步骤(4)：根据获得的哈希码，学习视觉特征到哈希码的映射，即哈希函数；步骤(5)：读取待检索的手写英文单词图像，利用哈希码检索数据库中图像的哈希码，完成图像识别。2.如权利要求1所述的一种基于哈希检索的手写英文单词智能识别方法，其特征在于，所述步骤(1)的具体过程为：步骤(1.1)：假设有n幅手写英文单词图像，对每幅图像提取d维的视觉特征，使用了预训练好的VGG-19中conv54层的输出作为提取的图片特征，得到一个n×d视觉特征数据矩阵X＝[x1，x2，...，xn]∈Rn×d，其中n表示实例的数量，d表示特征维度，c表示类别数；步骤(1.2)：对n幅手写英文单词图像进行标注，得到标签信息矩阵L＝[l1，l2，...，ln]∈Rn×c，其中n表示实例的数量，d表示特征维度，c表示类别数；具体包括：采取人工的方式对数据进行类别标注，然后对所标注的结果进行筛选和统一；假设标注后数据集的所有图像一共有c个标签，每个标签对应一个单词，每幅图像的监督信息可以表示为c维的向量；如果该手写英文单词图像属于某个标签，那么该标签向量中对应位置为1，否则为0。3.如权利要求1所述的一种基于哈希检索的手写英文单词智能识别方法，其特征在于，所述步骤(3)包括：步骤(3.1)：利用视觉特征矩阵、标签信息矩阵和相似性矩阵，设计哈希函数；步骤(3.2)：根据哈希函数设计优化算法，获得数据库中每一张手写英文单词图像的哈希码。4.如权利要求3所述的一种基于哈希检索的手写英文单词智能识别方法，其特征在于，所述步骤(3.1)具体包括：首先考虑哈希码是原始数据核化之后通过一个映射矩阵映射而来，即XW；其次考虑嵌入标签信息，即假设标签可以被映射成哈希码，即LG；目标哈希函数为：s.t.B∈{-1，1}n×r其中S为...

【专利技术属性】
技术研发人员：马磊，陈义学，陈霞，张华英，
申请(专利权)人：山东山大鸥玛软件股份有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人