一种文本识别方法及系统技术方案

技术编号:28625219 阅读:13 留言:0更新日期:2021-05-28 16:21
本发明专利技术提供一种文本识别方法及系统,文本识别方法包括:采集图像样本集,图像样本集包括:数据来源标签;根据数据来源标签,将图像样本集输入文本识别网络进行训练,获取文本识别模型,文本识别模型包括:手写字体识别模型和印刷字体识别模型;获取待识别图像;将待识别图像输入文本识别模型进行文本识别,获取文本识别结果;将文本识别结果输入语义标签提取模型进行语义标签提取,获取文本识别结果中的文本向量的语义标签;根据语义标签,对文本识别结果进行更新,完成文本识别;本发明专利技术中的方法,通过获取手写字体识别模型和印刷字体识别模型,能够对待识别图像进行较准确地识别,通过提取语义标签,对文本识别结果进行更新,提高识别精确度。

【技术实现步骤摘要】
一种文本识别方法及系统
本专利技术涉及图像处理领域,尤其涉及一种文本识别方法及系统。
技术介绍
图像处理技术得到了越来越多的应用,如在图像文本识别领域,利用图像识别技术将图像中的文本转换为机器能够识别读取的机器语言,目前,通常使用深度学习算法,进行图像文本识别,然而,由于文本识别过程中存在大量的印刷字体与手写字体,使用较单一的深度学习算法进行文本识别,容易导致文本识别的精确率较低的情况发生。
技术实现思路
本专利技术提供一种文本识别方法及系统,以解决现有技术中使用较单一的深度学习算法进行文本识别,容易导致文本识别的精确率较低的问题。本专利技术提供的文本识别方法,包括:采集图像样本集,所述图像样本集包括:数据来源标签;根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练,获取文本识别模型,所述文本识别模型包括:手写字体识别模型和印刷字体识别模型;获取待识别图像;将所述待识别图像输入所述文本识别模型进行文本识别,获取文本识别结果;将所述文本识别结果输入语义标签提取模型进行语义标签提取,获取所述文本识别结果中的文本向量的语义标签;根据所述语义标签,对所述文本识别结果进行更新,完成文本识别。可选的,根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练的步骤包括:根据所述数据来源标签,对所述图像样本集中的图像样本进行分类,获取一个或多个样本子集,所述样本子集与所述数据来源标签相对应,所述数据来源标签至少包括以下之一:医院名称、科室名称、人名;将所述样本子集输入所述文本识别网络进行训练,获取文本识别模型,训练过程包括:文本字体分类和手写字体识别,以及印刷字体识别。可选的,将所述样本子集输入所述文本识别网络进行训练的步骤包括:将所述样本子集输入所述文本识别网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;根据所述分布特征向量和/或结构形态特征向量,对样本子集进行文本字体分类,获取字体分类结果,所述字体分类结果包括:手写字体和印刷字体;将与手写字体对应的分布特征向量和/或结构形态特征向量输入所述文本识别网络的第一识别层进行识别,获取第一识别结果并进行迭代训练,进而获取手写字体识别模型;将与印刷字体对应的分布特征向量和/或结构形态特征向量输入所述文本识别网络的第二识别层进行识别,获取第二识别结果并进行迭代训练,进而获取印刷字体识别模型。可选的,获取所述第一识别结果和所述第二识别结果的步骤包括:将与手写字体对应的分布特征向量与手写字体数据库中的文字特征进行第一对比,获取第一对比结果;将与手写字体对应的结构形态特征向量与手写字体数据库中的文字特征进行第二对比,获取第二对比结果;根据所述第一对比结果和/或所述第二对比结果,获取第一识别结果;将与印刷字体对应的分布特征向量与印刷字体数据库中文字特征进行第三对比,获取第三对比结果;将与印刷字体对应的结构形态特征向量与印刷字体数据库中文字特征进行第四对比,获取第四对比结果;根据所述第三对比结果和/或所述第四对比结果,获取第二识别结果。可选的,将所述样本子集输入所述文本识别网络进行文字特征提取的步骤包括:根据所述样本子集中的图像样本和预设的区域划分原则,获取一个或多个文字区域;对所述文字区域进行二值化处理,获取二值化区域;根据所述二值化区域中的黑色像素点及白色像素点的集合,获取原始图像中的像素点的分布特征向量;对所述原始图像集中的原始图像进行细线化,获取细线化图像;获取所述细线化图像的结构形态特征,进而获取所述结构形态特征向量,所述结构形态特征至少包括以下之一:笔划端点、交叉点、笔划段。可选的,获取所述语义标签提取模型的步骤包括:获取原始文本集,所述原始文本集包括:语义标签标注;将所述原始文本集输入长短期记忆网络进行训练,获取所述语义标签提取模型,训练步骤包括:文本特征去噪、分布式向量转换、语义特征提取及反馈优化;所述反馈优化的步骤包括:根据预设的损失函数,获取语义标签的真实值和预测值之间的差值,进而进行迭代训练,获取所述语义标签提取模型。可选的,根据所述语义标签,对所述识别结果进行更新的步骤包括:构建分类数据库;将所述语义标签与所述分类数据库中词集的分类标签进行匹配,获取匹配结果;若所述匹配结果超出预设的匹配阈值,则将所述分类标签对应的词集确定为目标词集;将所述文本识别结果与目标词集中的目标词汇进行相似度对比,获取相似度对比结果;根据所述相似度对比结果,对所述文本识别结果进行更新,获取更新结果,完成文本识别。可选的,将所述图像样本集输入文本识别网络进行训练的步骤之前包括:根据预设的邻域像素判断原则,对所述图像样本集中的图像样本进行噪声判断,获取判断结果;根据所述判断结果,对所述图像样本集中的图像样本进行降噪处理,获取降噪图像,降噪处理的步骤至少包括以下之一:高斯滤波、中值滤波和双边滤波;对所述降噪图像进行清洗及校正,获取预处理图像;将所述预处理图像输入所述文本识别网络进行训练,获取文字识别模型。可选的,还包括:将更新结果传输至云端;当终端发出传输请求时,根据传输请求中的用户关联信息,对用户的权限进行认证,获取认证结果,所述用户关联信息至少包括以下之一:用户ID、身份证号码、手机号码;根据认证结果,建立终端与云端的连接,并将对应的所述更新结果传输至所述终端,进行文字协同编辑;根据预设的更新时间,将协同编辑的文本传输至云端并将编辑操作写入日志。本专利技术还提供一种文本识别系统,包括:预采集模块,用于采集图像样本集,所述图像样本集包括:数据来源标签;识别模型获取模块,用于根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练,获取文本识别模型,所述文本识别模型包括:手写字体识别模型和印刷字体识别模型;采集模块,用于获取待识别图像;识别模块,用于将所述待识别图像输入所述文本识别模型进行文本识别,获取文本识别结果;语义标签提取模块,用于将所述文本识别结果输入语义标签提取模型进行语义标签提取,获取所述文本识别结果中的文本向量的语义标签;更新模块,用于根据所述语义标签,对所述文本识别结果进行更新,完成文本识别;所述预采集模块、识别模型获取模块、采集模块、识别模块、语义标签提取模块和更新模块连接。本专利技术的有益效果:通过获取手写字体识别模型和印刷字体识别模型,能够对待识别图像进行较准确地识别,将文本识别结果输入语义标签提取模型进行语义标签提取,获取文本识别结果中的文本向量的语义标签,根据语义标签,对文本识别结果进行更新,实现了对图像中的文本数据的快速提取,识别精确度较高。附图说明<本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n采集图像样本集,所述图像样本集包括:数据来源标签;/n根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练,获取文本识别模型,所述文本识别模型包括:手写字体识别模型和印刷字体识别模型;/n获取待识别图像;/n将所述待识别图像输入所述文本识别模型进行文本识别,获取文本识别结果;/n将所述文本识别结果输入语义标签提取模型进行语义标签提取,获取所述文本识别结果中的文本向量的语义标签;/n根据所述语义标签,对所述文本识别结果进行更新,完成文本识别。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
采集图像样本集,所述图像样本集包括:数据来源标签;
根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练,获取文本识别模型,所述文本识别模型包括:手写字体识别模型和印刷字体识别模型;
获取待识别图像;
将所述待识别图像输入所述文本识别模型进行文本识别,获取文本识别结果;
将所述文本识别结果输入语义标签提取模型进行语义标签提取,获取所述文本识别结果中的文本向量的语义标签;
根据所述语义标签,对所述文本识别结果进行更新,完成文本识别。


2.根据权利要求1所述的文本识别方法,其特征在于,根据所述数据来源标签,将所述图像样本集输入文本识别网络进行训练的步骤包括:
根据所述数据来源标签,对所述图像样本集中的图像样本进行分类,获取一个或多个样本子集,所述样本子集与所述数据来源标签相对应,所述数据来源标签至少包括以下之一:医院名称、科室名称、人名;
将所述样本子集输入所述文本识别网络进行训练,获取文本识别模型,训练过程包括:文本字体分类和手写字体识别,以及印刷字体识别。


3.根据权利要求2所述的文本识别方法,其特征在于,将所述样本子集输入所述文本识别网络进行训练的步骤包括:
将所述样本子集输入所述文本识别网络进行文字特征提取,文字特征提取的步骤至少包括以下之一:分布特征提取、结构形态特征提取,获取分布特征向量和/或结构形态特征向量;
根据所述分布特征向量和/或结构形态特征向量,对样本子集进行文本字体分类,获取字体分类结果,所述字体分类结果包括:手写字体和印刷字体;
将与手写字体对应的分布特征向量和/或结构形态特征向量输入所述文本识别网络的第一识别层进行识别,获取第一识别结果并进行迭代训练,进而获取手写字体识别模型;
将与印刷字体对应的分布特征向量和/或结构形态特征向量输入所述文本识别网络的第二识别层进行识别,获取第二识别结果并进行迭代训练,进而获取印刷字体识别模型。


4.根据权利要求3所述的文本识别方法,其特征在于,获取所述第一识别结果和所述第二识别结果的步骤包括:
将与手写字体对应的分布特征向量与手写字体数据库中的文字特征进行第一对比,获取第一对比结果;
将与手写字体对应的结构形态特征向量与手写字体数据库中的文字特征进行第二对比,获取第二对比结果;
根据所述第一对比结果和/或所述第二对比结果,获取第一识别结果;
将与印刷字体对应的分布特征向量与印刷字体数据库中文字特征进行第三对比,获取第三对比结果;
将与印刷字体对应的结构形态特征向量与印刷字体数据库中文字特征进行第四对比,获取第四对比结果;
根据所述第三对比结果和/或所述第四对比结果,获取第二识别结果。


5.根据权利要求3所述的文本识别方法,其特征在于,将所述样本子集输入所述文本识别网络进行文字特征提取的步骤包括:
根据所述样本子集中的图像样本和预设的区域划分原则,获取一个或多个文字区域;
对所述文字区域进行二值化处理,获取二值化区域;
根据所述二值化区域中的黑色像素点及白色像素点的集合,获取原始图像中的像素点的分布特征向量;
对所述原...

【专利技术属性】
技术研发人员:姚娟娟钟南山
申请(专利权)人:明品云北京数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1