本发明专利技术涉及一种基于云平台的脱机手写识别方法,通过互联网将待识别的手写文档图片传送到云平台进行高正确率的识别,并将识别结果返回给终端展示给用户。同时,引导用户修改错误识别结果并提交,可以以比较低的成本获得大量正确标注的训练数据。利用云平台强大的计算能力和存储能力,可达到更加快速准确的识别结果,可得到更多正确标注的训练集。
【技术实现步骤摘要】
本专利技术涉及一种手写识别方法,尤其涉及。
技术介绍
随着智能手机和平板电脑设备的普及,人们越来越需要一种能够快速有效的将书写在纸质介质的汉字输入到数码设备中的方法。现有技术中大多采用键盘将相关文字整理输入电脑,或者使用在线手写识别技术通过手写板、触摸屏等设备输入文字。使用键盘或联机手写识别方法输入纸质介质上的文字,要求用户顺序输入每一个字,效率比较低,不易快速输入。尤其是在没有物理键盘的移动设备上,更加无法满足快速输入的要求。脱机手写识别输入法是通常所说的光学文字识别(Optical CharacterRecognit1n, OCR ),文字一般印刷在或者手写在纸质介质上。脱机手写识别适合于处理大批量文稿的输入,文字可以通过扫描仪、照相机等设备以图像的形式输入到计算机中进行识别。这种识别方法不需要用户将纸质介质上的文字顺序输入、不需要熟悉键盘输入法或联机手写识别输入法,尤其是适合对相关输入法软件不够熟悉的操作者。然而已有的脱机手写识别系统只能批量扫描纸质文档进行一次性识别,例如,邮政机构使用脱机手写识别系统识别信件地址和邮编。显然这种批量处理方法难以在普通用户日常生活中普及,现在大多数信息都是通过键盘录入或联机手写识别方法录入。目前大多的智能终端设备都含有摄像头,这样就为脱机手写图像输入提供了良好的硬件支持,再加上直接在纸质材料书写所具有的先天优点使得它在汉字输入领域迅速普及成为可能。但是,智能终端设备的处理器和存储器性能比较低,一些高正确率的手写识别算法对计算量和存储量的要求过高,难以在智能终端上正常运行。互联网的普及,各大公司云计算平台的建设推广,使得超级计算能力通过互联网自由流通成为可能。将高准确率的手写识别算法运行在云端,用户可以在任何时间、任何地点,用任何可以连接至互联网的终端设备访问“云”端获得服务。
技术实现思路
本专利技术解决的技术问题是:传统脱机手写识别方法无法让普通用户自由识别已经写在纸质材料上的手写字符,从而必须通过键盘或在线手写输入法依次录入文字。这种方法大大降低了文字输入效率。本专利技术提供了一种能够支持用户通过移动终端对书写在纸质材料上的手写字符拍照,然后通过互联网上传到云计算平台进行脱机手写识别,云平台进行识别后将结果返回移动终端显示的方法。该方法不需要用户通过其它输入法依次录入文字,而能一次性将拍照的手写文字识别结果返回,大大节省了用户的文字录入时间。另外,用户可以在移动终端修改识别错误的字符,并将正确结果提交到云端;服务器端可以基于采集到的正确标注的脱机手写识别数据集进行调整,进一步提高手写识别正确率。本专利技术解决现有技术中存在的问题所采用的技术方案为:提供基于云平台的脱机手写识别方法,包括如下步骤: 终端录入手写文档并提交:用户通过智能终端(如手机、平板电脑等)对手写文档拍照,并将照片通过互联网传送到云平台; 云平台接收识别手写文档:云平台将图片上的手写文档切分成独立的手写信息单元并进行识别; 终端获取识别结果并修改提交:终端从云平台获取提交文档的对应识别结果并将其显示在界面上,用户修改识别错误的部分并将正确结果提交到云平台。本专利技术的进一步技术方案是:在终端录入手写文档并提交中,对手写文档进行拍照上传处理,包括如下步骤: 手写文档的拍照:将书写在任何材质上的手写文档用智能终端拍照; 手写文档的上传:将手写文档照片通过互联网上传到云平台。本专利技术的进一步技术方案是:在云平台接收识别手写文档步骤中,包括以下步骤: 切分手写文档,即:对手写文档图片进行切分,具体包括:按行切分:将手写文档的每一行文字切分成一个独立图片。按文字切分:针对按行切分得到的图片,继续按照不同的文字进行切分,每一个字作为一个手写信息单元; 识别手写文档,即:将切分得到的手写信息单元使用基于深度置信网络的方法进行粗分类,然后使用改进的二次分类函数方法进行细分类,最终输出识别结果。本专利技术的技术效果是:本专利技术涉及,通过移动终端拍照录入写在纸质介质上的手写文档,利用云平台进行高正确率的识别,并将结果返回移动终端显示给用户。用户只需对识别错误的少量字符进行检查修改,大大提高了文字录入速度。另外,用户可以将正确结果提交到云端,云平台获得标注正确的手写识别数据,可以用来进一步训练分类器,提高手写识别正确率。【附图说明】图1为本专利技术流程图。图2为本专利技术对手写文档进行录入提交的流程图。图3为本专利技术对手写文档进行接收识别的流程图。图4为本专利技术对手写文档进行切分的流程图。图5为本专利技术对手写文档进行按行切分的流程图。图6为本专利技术对手写文档进行按文字切分的流程图。图7为本专利技术识别手写文档流程图。【具体实施方式】下面结合具体实施例,对本专利技术技术方案进一步说明。如图1所示,本专利技术的【具体实施方式】是:提供,包括如下步骤: 步骤100:录入手写文档,即:通过智能终端录入手写文档并提交给云平台。如图2所示,在终端录入手写文档并提交步骤中,对所述手写文档进行录入处理包括如下步骤: 步骤110:智能终端登录系统,即:用户在智能终端用已经申请过的账号登陆软件系统,以便实现后续操作。步骤120:调用摄像头拍照,即:软件调用终端的摄像头对书写在纸质介质上的文字进行拍照并保存在本地。步骤130:照片提交云平台,S卩:将前面拍摄的包含手写文字的照片提交给云平台进行脱机手写识别。步骤200:接收识别手写文档,即:云平台接收从终端发送的手写文档照片,并对手写文档进行识别。如图3所示,具体在接收识别手写文档步骤中,包括如下步骤: 步骤210:接收手写文档,即:从智能终端接收手写文档照片并保存提交用户的用户名、提交时间等?目息。步骤220:切分手写文档,即:将手写文档照片切分成以字符为单位的信息单元。如图4所示,对于手写文档的切分包括如下步骤: 步骤221:按行切分:将手写文档的每一行文字切分成一个独立图片。如图5所示,在切分手写文档步骤中,按行切分包括如下步骤: 步骤2211:在云平台输入手写文档进行处理。步骤2212:—般用户在本子上书写,页面上都印刷有横向线条来帮助用户划分不同行,对手写后的页面拍照后,印刷的横向线条和用户的手写文字被同时上传到服务器,所以可以借助横向线条对用户手写文档切分。如果用户直接在白纸上写文档,则没有横向线条进行辅助切分。本步骤需要判断页面上是否有横向线条,从而可以针对不同方法采取不同措施进行切分。判断方法为:从上向下检测是否每隔固定距离有一条颜色相同的横向直线。若有,则横向线条存在;否则,横向线条不存在。步骤2213:若步骤2212检测到有横向线条,则执行该步骤。只需要沿着步骤2212检测到的横向线条将图片切分开即可。步骤2214:若步骤2212检测到没有横向线条,则执行该步骤。检测方法为??从上向下检测是否每超过固定距离都存在一小块横向空白区域。若有,则沿着空白区域中间横向将图片切分开。检测切分完成后,计算得到的每小块图片的高度和所有图片高度的平均值。若有图片的高度大于平均高度的1.5倍,继续从上到下扫描该图片每一行像素,查找该图片非底色像素点个数最少的哪一行并沿着改行像素对其切分;若有图片小于平均高度当前第1页1 2 本文档来自技高网...
【技术保护点】
一种基于云平台的脱机手写识别方法,包括如下步骤:终端录入手写文档并提交:用户通过智能终端(如手机、平板电脑等)对手写文档拍照,并将照片通过互联网传送到云平台;云平台接收识别手写文档:云平台将图片上的手写文档切分成独立的手写信息单元并进行识别;终端获取识别结果并修改提交:终端从云平台获取提交文档的对应识别结果并将其显示在界面上,用户修改识别错误的部分并将正确结果提交云平台。
【技术特征摘要】
【专利技术属性】
技术研发人员:周树森,朱杰,李振,马高伟,郑露云,
申请(专利权)人:鲁东大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。