基于笔顺及OCR文字识别方法、装置、设备及存储介质制造方法及图纸

技术编号:28980387 阅读:13 留言:0更新日期:2021-06-23 09:27
本发明专利技术公开了一种基于笔顺及OCR文字识别方法、装置、设备及存储介质,所述方法通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

【技术实现步骤摘要】
基于笔顺及OCR文字识别方法、装置、设备及存储介质
本专利技术涉及字符识别
,尤其涉及一种基于笔顺及OCR文字识别方法、装置、设备及存储介质。
技术介绍
随着信息技术和计算机技术的日益普及,人类社会已进入信息时代,把各类载体上的原始信息转化为计算机可处理和传输的电子比特信息已成为要解决的重要问题;光学字符识别(OpticalCharacterRecognition,OCR)技术成为有效解决手工输入文字信息的重要工具,在各领域被广泛应用,并产生了巨大的社会效益和经济效益。OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。现有的字符识别中单独通过OCR识别的准确率不高,影响了用户的体验度。
技术实现思路
本专利技术的主要目的在于提供一种基于笔顺及OCR文字识别方法、装置、设备及存储介质,旨在解决现有技术中单独通过OCR识别的准确率不高,影响了用户的体验度的技术问题。第一方面,本专利技术提供一种基于笔顺及OCR的文字识别方法,所述基于笔顺及OCR的文字识别方法包括以下步骤:在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。可选地,所述在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据,包括:在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。可选地,所述在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值,包括:在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。可选地,所述通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果,包括:对所述当前文本图像数据进行二值化处理,获得二值化图;对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;对所述字符数据进行字符识别,获得初步文字识别结果。可选地,所述从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果,包括:从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符;分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字;获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果。可选地,所述从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果之后,所述基于笔顺及OCR的文字识别方法还包括:将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作。可选地,所述将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作,包括:将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能。第二方面,为实现上述目的,本专利技术还提出一种基于笔顺及OCR的文字识别装置,所述基于笔顺及OCR的文字识别装置包括:采集模块,用于在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;初步识别模块,用于通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;优化模块,用于从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。第三方面,为实现上述目的,本专利技术还提出一种基于笔顺及OCR的文字识别设备,所述基于笔顺及OCR的文字识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于笔顺及OCR的文字识别程序,所述基于笔顺及OCR的文字识别程序配置为实现如权利要求上文所述的基于笔顺及OCR的文字识别方法的步骤。第四方面,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有基于笔顺及OCR的文字识别程序,所述基于笔顺及OCR的文字识别程序被处理器执行时实现如上文所述的基于笔顺及OCR的文字识别方法的步骤。本专利技术提出的基于笔顺及OCR的文字识别方法,通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。附图说明图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;图2为本专利技术基于笔顺及OCR的文字识别方法第一实施例的流程示意图;图3为本专利技术基于笔顺及OCR的文字识别方法第二实施例的流程示意图;图4为本专利技术基于笔顺及OCR的文字识别方法第三实施例的流程示意图;图5为本专利技术基于笔顺及OCR的文字识别方法第四实施例的流程示意图;图6为本专利技术基于笔顺及OCR的文字识别方法第五实施例的流程示意图;图7为本专利技术基于笔顺及OCR的文字识别方法第六实施例的流程示意图;图8为本专利技术基于笔顺及OCR的文字识别装置第一实施例的功能模块图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处本文档来自技高网...

【技术保护点】
1.一种基于笔顺及OCR的文字识别方法,其特征在于,所述基于笔顺及OCR的文字识别方法包括:/n在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;/n通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;/n从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。/n

【技术特征摘要】
1.一种基于笔顺及OCR的文字识别方法,其特征在于,所述基于笔顺及OCR的文字识别方法包括:
在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;
通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;
从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。


2.如权利要求1所述的基于笔顺及OCR的文字识别方法,其特征在于,所述在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据,包括:
在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;
根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;
通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。


3.如权利要求2所述的基于笔顺及OCR的文字识别方法,其特征在于,所述在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值,包括:
在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;
通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;
通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。


4.如权利要求1所述的基于笔顺及OCR的文字识别方法,其特征在于,所述通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果,包括:
对所述当前文本图像数据进行二值化处理,获得二值化图;
对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;
对所述字符数据进行字符识别,获得初步文字识别结果。


5.如权利要求1所述的基于笔顺及OCR的文字识别方法,其特征在于,所述从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果,包括:
从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符...

【专利技术属性】
技术研发人员:陈铿帆
申请(专利权)人:深圳市鹰硕云科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1