本发明专利技术公开了一种应用于个人数字助理(PDA)或带有PDA功能的移动设备的将手写笔记转化为文字文本的转换方法,包括:将输出区分割为具有相同形状和范围的连续子区域,并记录输入到手写输入区内的字符信息和丢弃输入到手写输入区外的字符信息,将记录的每一个字符的信息顺序转换到输出区的所述连续子区域内,保存所形成的图片文件;提取图片文件中字符特征;调用手写识别引擎对该字符特征进行识别并将识别结果保存在缓冲中;将所述缓冲中经识别形成的文字文本显示到显示屏上。本发明专利技术还公开了一种安装了执行上述方法的转换模块的PDA或带有PDA功能的移动设备。使用本发明专利技术仅需占用少量计算资源即可简单高效地实现转换过程。(*该技术在2022年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及图像识别技术,特别是涉及一种应用于个人数字助理(PDA)或带有PDA功能的移动设备的将手写笔记转换为文字文本的方法,以及实现该方法的移动设备。
技术介绍
个人数字助理(PDA)由于其强大的应用功能和易于携带的特性,在目前得到了越来越广泛的应用。而PDA之所以能得到广泛的应用,这是与它能帮助用户记录信息的特点密切相关的。用户出于备忘的目的需要随时将某些重要的事项记录下来,这时就可以使用PDA提供的信息输入和保存的方法,作为电子文件保存的信息既便于携带,又便于后续处理,因此这一功能成为PDA的一个巨大优势。目前,PDA提供给用户进行信息输入和保存的方法主要有两种,第一种方法是手写识别,也就是用户在手写输入区内逐个输入字符,然后PDA在用户输入一个字符后立即对用户输入的该字符进行识别,也就是转换成文字文本,然后显示到输出区;但是这个识别过程对于计算处理能力有限的PDA来说需要消耗一定的时间,不适用于用户需要迅速地输入多个字符的情况。例如在会议或者采访过程中,用户可能需要迅速地连续输入很多的文字信息,这时漫长的识别等待过程对用户来说是难以忍受的。为了解决这个问题,PDA给用户提供了第二种信息输入和保存的方法,那就是速记应用程序。通过速记应用程序,用户可以用触笔在PDA的手写输入区内进行不间断的连续输入,手写输入区内的字符会自动显示到输出区,但是和上一种方法不同,此时显示到输出区的依然是用户的原始手写轨迹,也就是手写笔记。这种方法保证了用户可以快速记录下大量信息,给用户提供了很大的便利。但是,由于用户需要快速连续输入的信息在大多数情况下对用户来说都是非常有用的信息,因此用户非常希望能对该手写笔记进行编辑,例如增加、删除或修改某些字符等等,这就需要在这种情况下PDA也能对手写笔记进行文字识别,也就是能将手写笔记所形成的图像信息转换为它所包含的文字内容信息。但是到目前为止,还没有方法能在PDA上实现这种转换。如果用户需要编辑这些信息,那么需要重新进行如前述第一种方法的手写识别过程,用户依然会感觉很不方便。因此,用户强烈希望能对整个手写笔记进行整体识别,以更好地发挥速记应用程序的功能。对于文字图像进行整体识别的技术在诸如计算机的其他设备上已经有了一些成型的应用,例如在计算机上和扫描仪配套使用的光学字符识别(OCR)软件。这种OCR软件的识别过程基本上分为以下过程(1)扫描输入文字图像;(2)对图像进行预处理,包括倾斜校正和滤除干扰噪声等;(3)对图像版面进行分析和理解;(4)对图像进行行切分和字切分;(5)基于单字图像进行特征的选择和提取;(6)基于单字图像特征的模式进行分类;(7)将被分类的模式赋予识别结果;(8)对识别结果进行编辑、修改和处理。在上述计算机文字图像识别过程中,第(2)、(3)和(4)步的算法比较复杂,需要占用大量的计算资源,而由于一般PDA的硬件配置较低,特别是计算芯片的数据处理能力较低,因此在PDA上不能完成这些复杂的算法,这也是为什么到目前为止PDA还不能将用户通过速记应用程序输入的手写笔记转换为文字文本的原因。
技术实现思路
有鉴于此,本专利技术的一个目的是提供一种仅需要占用少量计算资源的简单高效的将手写笔记转换为文字文本的转换方法。本专利技术的另一个目的是提供一种安装有使用上述方法的转换模块的转换装置。本专利技术的上述目的是通过如下的技术方案予以实现的一种应用于PDA或带有PDA功能的移动设备的将手写笔记转化为文字文本的转换方法,包括如下步骤a.将输出区分割为具有相同形状和范围的连续子区域,并记录输入到手写输入区内的字符信息和丢弃输入到手写输入区外的字符信息,将记录的每一个字符的信息顺序转换到输出区的连续子区域内,保存所形成的图片文件;b.提取图片文件中字符特征;c.调用手写识别引擎对该字符特征进行识别并将识别结果保存在缓冲中;d.将缓冲中经识别形成的文字文本显示到显示屏上。在上述将手写笔记转化为文字文本的转换方法中,在步骤a中将记录的每一个字符的信息顺序转换到输出区的连续子区域内的过程中,可以对字符信息进行压缩处理。这种压缩处理可以采用抽线法,并且可以是1倍压缩。在上述将手写笔记转化为文字文本的转换方法中,每一个输出区的连续子区域的范围大小可以是手写输入区的范围的四分之一。输出区的连续子区域和手写输入区的形状可以是长方形或正方形。在上述将手写笔记转化为文字文本的转换方法中,在步骤d中可以进一步包括预先设置常见识别错误对照词库,在将缓冲中经识别形成的文字文本显示到屏幕上的过程中,系统调用常见识别错误对照词库对缓冲中的识别结果进行自动纠错,将进行自动纠错后的识别结果显示到屏幕上。在上述将手写笔记转化为文字文本的转换方法中,手写识别引擎可以采用汉字手写识别引擎。一种PDA或带有PDA功能的移动设备,除了电连接到总线的CPU、内存和显示屏,还进一步包括执行上述将手写笔记转换为文字文本的转换方法的转换模块,该转换模块电连接到CPU、内存和显示屏。通过本专利技术的技术方案可以看出,由于相对现有技术的OCR识别方法,本专利技术通过丢弃超出手写输入区的字符部分的信息,使每个手写笔记的大小是固定的,从而将整个手写原笔记分割成了标准大小的单独手写笔记,这样无需再按照一些复杂的切分算法进行切分,因此省略了对整个手写原笔记进行包括倾斜校正和滤除干扰噪声的预处理、对图像版面进行分析和理解以及对图像进行行切分和字切分等需要大量计算资源的步骤,简化了处理过程,提高了处理速度,从而实现了仅需占用少量计算资源即可简单高效地将手写笔记转换为文字文本的专利技术目的。同时,使用本专利技术可以在PDA上实现整篇手写原笔记的批量识别,提高了处理速度,也大大减少了需要重复输入给用户带来的不便。使用这种方法由于不需为了图像识别增加额外的手写识别库,从而使用户可以充分利用现有计算资源,避免了不必要的额外支出。附图说明图1示出了根据本专利技术的PDA上的手写输入区和输出区的形状和位置示例;图2示出了本专利技术的图像采集流程;图3示出了根据本专利技术的整个输出区所划分的16×16像素标准方格;图4示出了根据本专利技术的手写笔记示例;图5示出了根据本专利技术的PDA上的速记文件浏览窗口示例;图6示出了本专利技术的对图像进行预处理到输出最后结果的流程;图7示出了根据本专利技术的PDA上的识别完成窗口示例;图8是根据本专利技术的将手写笔记转换为文字文本的装置的示意图。具体实施例方式下面结合附图和具体实施方式对本专利技术进行详细介绍。本专利技术将手写笔记转换为文字文本的方法可以分为四个阶段图像采集、图像预处理、字符识别和后期处理。本专利技术的特点在于在数据采集过程中进行一些特别的处理,从而在硬件配置较低的PDA上也同样可以对手写笔记进行整体识别。在目前的PDA的速记程序应用中,数据采集过程大致是在打开PDA速记应用软件的情况下,通过触笔直接在手写输入区进行文字输入,当用户在手写输入区写完后,写完的字符会转移到输出区,然后作为图片文件进行保存。本专利技术的数据采集过程大致如此,但是在这个过程中进行了一些特别的处理。下面将详细介绍本专利技术是如何进行这些特殊处理的。如图1所示,不妨假设PDA的手写输入区的大小为32×32像素,本专利技术的例子中采用的是双框手写输入区,每一个手写输入区的大小都是32×32像素。在本文档来自技高网...
【技术保护点】
一种应用于个人数字助理(PDA)或带有PDA功能的移动设备的将手写笔记转化为文字文本的转换方法,包括如下步骤: a.将输出区分割为具有相同形状和范围的连续子区域,并记录输入到手写输入区内的字符信息和丢弃输入到手写输入区外的字符信息,将记录的每一个字符的信息顺序转换到输出区的所述连续子区域内,保存所形成的图片文件; b.提取所述图片文件中字符特征; c.调用手写识别引擎对该字符特征进行识别并将识别结果保存在缓冲中; d.将所述缓冲中经识别形成的文字文本显示到显示屏上。
【技术特征摘要】
【专利技术属性】
技术研发人员:赖洪波,史敬威,关如冰,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。