基于笔顺及OCR文字识别方法、装置、设备及存储介质制造方法及图纸

技术编号：28980387 阅读：13 留言：0更新日期：2021-06-23 09:27

本发明专利技术公开了一种基于笔顺及OCR文字识别方法、装置、设备及存储介质，所述方法通过在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果；能够提高字符的识别能力，高效率的完成对书写文字的识别，在保证工作效率的同时，提高了文字识别的效率和准确率，方便了用户使用，提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于笔顺及OCR文字识别方法、装置、设备及存储介质
本专利技术涉及字符识别
，尤其涉及一种基于笔顺及OCR文字识别方法、装置、设备及存储介质。
技术介绍
随着信息技术和计算机技术的日益普及，人类社会已进入信息时代，把各类载体上的原始信息转化为计算机可处理和传输的电子比特信息已成为要解决的重要问题；光学字符识别(OpticalCharacterRecognition，OCR)技术成为有效解决手工输入文字信息的重要工具，在各领域被广泛应用，并产生了巨大的社会效益和经济效益。OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。现有的字符识别中单独通过OCR识别的准确率不高，影响了用户的体验度。
技术实现思路
本专利技术的主要目的在于提供一种基于笔顺及OCR文字识别方法、装置、设备及存储介质，旨在解决现有技术中单独通过OCR识别的准确率不高，影响了用户的体验度的技术问题。第一方面，本专利技术提供一种基于笔顺及OCR的文字识别方法，所述基于笔顺及OCR的文字识别方法包括以下步骤：在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；通过预设OCR识别算法对所述当前文本图...

【技术保护点】
1.一种基于笔顺及OCR的文字识别方法，其特征在于，所述基于笔顺及OCR的文字识别方法包括：/n在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；/n通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；/n从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果。/n

【技术特征摘要】
1.一种基于笔顺及OCR的文字识别方法，其特征在于，所述基于笔顺及OCR的文字识别方法包括：
在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；
通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；
从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果。

2.如权利要求1所述的基于笔顺及OCR的文字识别方法，其特征在于，所述在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据，包括：
在智能书写笔书写时，获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值；
根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据；
通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别，获得当前文本图像数据。

3.如权利要求2所述的基于笔顺及OCR的文字识别方法，其特征在于，所述在智能书写笔书写时，获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值，包括：
在智能书写笔书写时，通过微型运动传感器获得用户的握笔运动轨迹数据，对所述握笔运动轨迹数据进行运动序列整合处理，将处理后的数据作为用户的书写动作数据；
通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标；
通过所述智能书写笔中的压力传感器获得压力滚动数据，根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

4.如权利要求1所述的基于笔顺及OCR的文字识别方法，其特征在于，所述通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果，包括：
对所述当前文本图像数据进行二值化处理，获得二值化图；
对所述二值化图依次进行噪声去除和倾斜校正，将处理后的图像数据进行字符切割，获得切割后的字符数据；
对所述字符数据进行字符识别，获得初步文字识别结果。

5.如权利要求1所述的基于笔顺及OCR的文字识别方法，其特征在于，所述从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果，包括：
从所述笔迹数据中获得落笔顺序和落笔间隔时间，根据所述落笔顺序和落笔间隔时间生成手写字符...

【专利技术属性】
技术研发人员：陈铿帆，
申请(专利权)人：深圳市鹰硕云科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人