System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及到文本识别,特别是涉及到一种校园智慧纸笔的文本识别方法及系统。
技术介绍
1、随着信息技术的发展,校园智慧纸笔作为一种新型的智能教育工具,逐渐受到教育行业的关注。校园智慧纸笔能够将学生在纸上的书写内容实时转化为电子文本,方便教师对学生的学习情况进行实时监控和分析。目前,校园智慧纸笔的文本识别技术主要基于图像处理和机器学习算法。
2、现有技术中,在将行为数据转化为图像数据的过程中,现有的技术往往依赖于高精度的摄像头和良好的光照条件,以确保获取到清晰的图像数据。然而,在实际应用场景中,由于摄像头质量、光线条件等因素的限制,导致图像数据质量不高,进而影响后续的字符识别准确率;其次,现有的技术往往依赖于边缘检测算法,如canny算子等。然而,这些算法对于字符的连笔、倾斜等书写特点的适应性较差,容易导致字符识别错误。
3、因此,现有技术存在缺陷,需要改进。
技术实现思路
1、为了解决现有技术中的一个或者几个问题,本申请的主要目的为提供一种校园智慧纸笔的文本识别方法及系统。
2、为了实现上述专利技术目的,本申请提出一种校园智慧纸笔的文本识别方法,所述方法包括:
3、实时获取所述纸笔的执行指令;
4、当收到所述执行指令时,获取所述纸笔在书写过程中的行为数据;
5、将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域;
6、通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据
7、识别所述文本区别的字符进行特征提取和匹配,识别出字符内容;
8、基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息。
9、进一步地,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:
10、接收所述纸笔的行为数据,所述行为数据包括笔在纸上的移动轨迹、速度及压力信息;
11、将所述行为数据进行预处理并转化成特征向量;
12、将所述特征向量输入预设的模型中,通过预设的模型识别所述特征向量并输出图像数据,所述图像数据包括所述移动轨迹映射到特定的像素值上;
13、通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域;
14、基于所述单个字符区域和/或多个字符区域,得到字符数据。
15、进一步地,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:
16、通过轮廓检测算法识别每个字符区域的字符边界;
17、对所述字符边界的边界坐标进行识别;
18、根据所述边界坐标,将所述字符边界沿着边界坐标进行分割,得到分割后的单独的字符图像;
19、识别每个字符图像,将每个所述字符图像按照预设的排序方式进行组合,得到文本区域。
20、进一步地,所述对所述字符边界的边界坐标进行识别,包括:
21、对提取的轮廓进行跟踪,以识别字符的边界;
22、判断所述字符的边界是否闭合;
23、当所述字符的边界出现未闭合时,对所述字符边界进行未闭合的端点进行识别;
24、通过预设的工具填充所述未闭合的端点,再对闭合后的所述字符边界进行去噪平滑处理;
25、基于处理后的所述字符边界,获取边界点标记坐标。
26、进一步地,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息包括:
27、对每个字符内容进行特征提取,对每个提取的特征进行归一化处理,用于将每个特征控制在预设的数值范围内;
28、对归一化后的每个特征向量通过元素乘法进行元素相乘,得到新特征向量;
29、将所有所述新特征向量进行拼接融合,并输入已训练的文本生成模型中,得到最终文本信息。
30、进一步地,所述移动轨迹映射到特定的像素值上包括,包括:
31、获取所述移动轨迹在纸上的坐标系;
32、识别所述移动轨迹在纸上的坐标系,根据识别结果构建虚拟空间坐标系;
33、将所述移动轨迹按照所述虚拟空间坐标系映射到特定的像素值上。
34、进一步地,所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括:
35、识别所述图像数据中的亮度信息,根据预设的第一阈值,将所述图像数据中亮度大于第一阈值的图像分割为背景;
36、根据预设的第二阈值,将图像数据中亮度小于第二阈值的图像分割为字符区域;
37、提取所述字符区域,对所述字符区域进行连通域标记,将相邻的像素组成一个连通域;
38、对所有所述连通域按照预设的筛选方式进行筛选,得到最终的单个字符区域和/或多个字符区域,其中所述筛选方式包括根据连通域的大小、宽高比及紧凑度。
39、本申请实施例还提供一种校园智慧纸笔的文本识别系统,包括:
40、第一获取模块,用于实时获取所述纸笔的执行指令;
41、第二获取模块,用于当收到所述执行指令时,获取所述纸笔在书写过程中的行为数据;
42、转化模块,用于将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域;
43、检测模块,用于通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域;
44、识别模块,用于识别所述文本区别的字符进行特征提取和匹配,识别出字符内容;
45、整合模块,用于基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息。
46、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
47、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
48、本申请实施例的校园智慧纸笔的文本识别方法及系统,通过将行为数据转化为图像数据,并采用连通域检测算法和轮廓检测算法,能够在较低精度的摄像头和较差的光照条件下,获取到较高质量的图像数据,通过轮廓检测技术对字符区域进行边界检测和分割,可以将复杂的图像数据分割成单个字符或多个字符,适应字符的连笔、倾斜等书写特点,有效降低字符识别错误。实时获取和处理书写过程中的行为数据,使得文本识别更加高效。校园智慧纸笔,还可以应用于其他需要文本识别的场景,如电子签名、手写输入等。通过预设的合成方法,将识别出的字符内容整合成文本信息,简化了字符识别的过程,提高了识别效率。通过连通域检测算法来获取图像数据的字符区域,可以有效地将文字与其他背景进行区分,准确地定位文字的位置。
本文档来自技高网...【技术保护点】
1.一种校园智慧纸笔的文本识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:
3.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:
4.根据权利要求3所述的校园智慧纸笔的文本识别方法,其特征在于,所述对所述字符边界的边界坐标进行识别,包括:
5.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文本信息包括:
6.根据权利要求2所述的校园智慧纸笔的文本识别方法,其特征在于,所述移动轨迹映射到特定的像素值上,包括:
7.根据权利要求2所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过连通域检测算法识别所述图像数据中的单个字符区域和/或多个字符区域包括:
8.一种校园智慧纸笔的
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种校园智慧纸笔的文本识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述将所述行为数据转化为图像数据,通过连通域检测算法来获取所述图像数据的字符区域,包括:
3.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述通过轮廓检测所述字符区域的边界,根据所述边界将所述图像数据中的字符进行字符分割,得到文本区域,包括:
4.根据权利要求3所述的校园智慧纸笔的文本识别方法,其特征在于,所述对所述字符边界的边界坐标进行识别,包括:
5.根据权利要求1所述的校园智慧纸笔的文本识别方法,其特征在于,所述基于所述字符内容,通过预设的合成方法将所述字符内容整合成文...
【专利技术属性】
技术研发人员:徐丹,白世亮,
申请(专利权)人:广州宏途数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。