Continuous handwritten word recognition system and the method of the invention, the segmentation of handwritten character string contains the main image into multiple sub images; the first neural network model for the sub image feature extraction to get the corresponding number of feature vector sequence; the first through second probabilistic neural network model to obtain a sequence of feature vectors corresponding to each string fragments the result of recognition of the value; performing the following procedure by loss function module: enumerate all components of the handwritten character string the string fragments, and according to the first probability value to calculate the probability of each second string fragment combination value, preliminary identification results of second probability value string fragments maximum as the handwritten character string don't need; through the continuous accurate cutting into isolated font font to identify, and cooperate with God Through the network model for learning recognition, fast and accurate, and enhance user experience.
【技术实现步骤摘要】
连续手写字识别方法及系统
本专利技术涉及图像文字识别
,特别是涉及连续手写字识别方法及系统。
技术介绍
近年来,基于孤立字的手写字识别准确率已经达到了一定水平,随着科技的不断发展和电子产品的跟新替换,孤立字识别的技术越来越不能够满足人们的需求,也不符合人们日常的书写习惯,从而连续手写字的识别技术不断出现。具体来讲,对于孤立字的识别,可以用条件概率表述,maxP(ci|p)(1)其中p表示孤立字图像,ci表示第i个中文字符;而对于连续手写字,一张输入的图像中含有N个中文字符,所以s=c1c2...cN(2)其中s表示图像p所对应的字符串,最后要求解的问题则为,maxP(s|p)(3)此时,可以看出用同样的方法解决连续手写字的识别问题,其算法复杂度和时间复杂度都会对整个网络开销带来很大的负面影响,严重影响用户体验;再者,对识别模型的输入要求图像大小是固定的,但对于连续手写字,其终端写两个字或者三个字的图像大小是不一样的,而且对其进行切割成的孤立字图像大小也非一样,采用通用的图像缩放方法会对其精度造成一定的影响,而且,对图像切割有误的话,会对后面的识别结果及其它处理造成严重的影响。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供连续手写字识别方法及系统,用于解决现有技术中的问题。为实现上述目的及其他相关目的,本专利技术提供一种连续手写字识别方法,包括:分割包含手写字符串的主图像为多个子图像;通过第一神经网络模型分别对所述多个子图像进行特征提取以得到对应数量个特征向量序列;通过第二神经网络模型获得每个特征向量序列对应的字符串片段的识别结果的第 ...
【技术保护点】
一种连续手写字识别方法,其特征在于,包括:分割包含手写字符串的主图像为多个子图像;通过第一神经网络模型分别对所述多个子图像进行特征提取以得到对应数量个特征向量序列;通过第二神经网络模型获得每个特征向量序列对应的字符串片段的识别结果的第一概率值;通过损失函数模块执行以下过程:枚举组成所述手写字符串的各个所述字符串片段组合,并根据所述第一概率值来计算各个字符串片段组合的第二概率值,选择第二概率值最大的字符串片段组合作为所述手写字符串的初步识别结果。
【技术特征摘要】
1.一种连续手写字识别方法,其特征在于,包括:分割包含手写字符串的主图像为多个子图像;通过第一神经网络模型分别对所述多个子图像进行特征提取以得到对应数量个特征向量序列;通过第二神经网络模型获得每个特征向量序列对应的字符串片段的识别结果的第一概率值;通过损失函数模块执行以下过程:枚举组成所述手写字符串的各个所述字符串片段组合,并根据所述第一概率值来计算各个字符串片段组合的第二概率值,选择第二概率值最大的字符串片段组合作为所述手写字符串的初步识别结果。2.根据权利要求1所述的连续手写字识别方法,其特征在于,所述第一神经网络模型的类型包括:CNN模型。3.根据权利要求1所述的连续手写字识别方法,其特征在于,所述第二神经网络模型的类型包括:LSTM模型。4.根据权利要求1所述的连续手写字识别方法,其特征在于,所述损失函数模块的类型包括:CTC模型。5.根据权利要求1所述的连续手写字识别方法,其特征在于,还包括:网络训练过程通过随机梯度下降算法训练所述第一神经网络模型、第二神经网络模型、及损失网络函数模块中的一者或多者。6.根据权利要求1所述的连续手写字识别方法,其特征在于,还包括:网络测试过程,其包括:通过beam-search结合预设语言模型的方式来根据所述第二概率值计算得到第三概率值,并将第三概率值最大的字符串片段组合作为所述手写字符串的最终识别结果。7.根据权利要求1所述的连续手写字识别方法,其特征在于,各所述子图像尺寸相同;相邻子图像间有部分...
【专利技术属性】
技术研发人员:周诚,孙环荣,陈兆金,宫新伟,单志辉,吴宗翰,赵世亭,
申请(专利权)人:上海嵩恒网络科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。