文本分析方法、装置、终端和计算机可读存储介质制造方法及图纸

技术编号：27568007 阅读：30 留言：0更新日期：2021-03-09 22:13

本发明专利技术提供了一种文本分析方法、装置、终端和计算机可读存储介质，其中，文本分析方法包括：对文本图像进行水平投影和垂直投影，生成水平投影数据和垂直投影数据，根据水平投影数据和垂直投影数据确定字符的位置信息；根据位置信息识别字符，根据识别结果统计出文本图像中的文字个数。通过本发明专利技术的技术方案能够准确定位文本图像中的各个字符，根据字符的位置进行对字符进行识别和统计，字数统计结果准确度高，抗干扰能力强。抗干扰能力强。抗干扰能力强。

全部详细技术资料下载

【技术实现步骤摘要】
文本分析方法、装置、终端和计算机可读存储介质

[0001]本专利技术涉及图像处理领域，具体而言，涉及一种文本分析方法、一种文本分析装置、一种终端和一种计算机可读存储介质。

技术介绍

[0002]人工智能相关技术在各个领域中的应用越来越广泛，在教育领域中，学生考试成绩分析系统能有效提取学生考试题目和老师的批改信息智能化的完成学生考试试卷的分析，自动生成反应出学生个人学习情况的用户画像。最终输出学生学习考试情况分析报告，帮助学生、老师以及家长提升学生成绩。语文作为初中以及高中重要考试科目，其中的作文的分数占总分比例相对较大，因而对作文答题情况的详细分析也是很有必要的。学生写作字数是否达标是考试中评分的一个基本要求。如何在学生考试成绩分析系统中完成字数自动统计任务，成为亟待解决的技术问题。
[0003]另外，整个说明书对
技术介绍
的任何讨论，并不代表该
技术介绍
一定是所属领域技术人员所知晓的现有技术，整个说明书中的对现有技术的任何讨论并不代表该现有技术一定是广泛公知的或一定构成本领域的公知常识。

技术实现思路

[0004]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0005]为此，本专利技术的一个目的在于提出了一种文本分析方法。
[0006]本专利技术的另一个目的在于提出了一种文本分析装置。
[0007]本专利技术的又一个目的在于提出了一种终端。
[0008]本专利技术的又一个目的在于提出了一种计算机可读存储介质。
[0009]在本专利技术的...

【技术保护点】

【技术特征摘要】
1.一种文本分析方法，其特征在于，包括：对文本图像进行水平投影和垂直投影，生成水平投影数据和垂直投影数据，其中，所述文本包含多个字符，所述字符包括文字和/或限定所述文字位置的线段；根据所述水平投影数据确定所述文本图像中的文本在水平方向上的坐标区域，以及根据所述垂直投影数据确定所述文本图像中的文本在垂直方向上的坐标区域，其中，所述水平方向上的坐标区域对应所述字符的上边界和下边界，所述垂直方向上的坐标区域对应所述字符的左边界和右边界，根据所述上边界、所述下边界、所述左边界和所述右边界确定所述字符的位置信息；根据所述位置信息识别所述字符，根据识别结果统计出所述文本图像中的文字个数。2.根据权利要求1所述的文本分析方法，其特征在于，所述根据所述位置信息识别所述字符，根据识别结果统计出所述文本图像中的文字个数，具体包括：计算出所述文本图像的像素值均值；根据所述字符的位置信息确定文本框，计算出文本框内的像素值均值；根据所述文本图像的像素值均值以及所述文本框内的像素值均值，确定所述文本框内包含文字，记录文字个数。3.根据权利要求1所述的文本分析方法，其特征在于，还包括：根据颜色定位所述文本图像中的干扰信息并删除所述干扰信息。4.根据权利要求3所述的文本分析方法，其特征在于，所述干扰信息为叠加在文本上的批改痕迹，则所述根据颜色定位所述文本图像中的干扰信息并删除所述干扰信息，具体包括：根据所述批改痕迹的颜色在所述文本图像中识别出所述批改痕...

【专利技术属性】
技术研发人员：贺涛，曾志辉，
申请(专利权)人：深圳中兴网信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人