字体识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号：25523308 阅读：94 留言：0更新日期：2020-09-04 17:13

本申请实施例公开了一种字体识别方法，所述方法包括：获取待识别图像；利用预训练识别模型，对所述待识别图像进行文本位置识别和字体识别，得到至少一个文本位置处的至少一个文本对应的至少一个字体类型；其中，所述预训练识别模型用于确定图像中文本位置，以及所述文本位置处文本的字体类型；对所述至少一个文本进行内容识别，得到至少一个内容信息；基于所述至少一个字体类型和所述至少一个文本位置，在电子设备的显示界面显示所述至少一个内容信息。本申请实施例同时公开了一种字体识别装置、电子设备、存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
字体识别方法及装置、电子设备、存储介质
本申请涉及计算机领域中的图像处理技术，尤其涉及一种字体识别方法及装置、电子设备、存储介质。
技术介绍
字体，是文字的外在形式特征，是信息传递的主要载体，是具有实用价值的工具。实际应用中，在对图像进行实时光学字符识别(OpticalCharacterRecognition，OCR)的时候，得到的文本识别的结果都会以某一种特定的字体在显示界面中展示；通常情况下，识别后显示的字体和原始图像中的字体并不一样；这样，无法体现原始字体信息，造成信息流失。因此，电子设备有必要对图像中的文字进行自动化的字体识别。
技术实现思路
本申请实施例提供了一种字体识别方法及装置、电子设备、存储介质，能够对图像中的字体类型进行识别，提高了信息显示的完整性。第一方面，提供一种字体识别方法，应用于电子设备，所述方法包括：获取待识别图像；利用预训练识别模型，对所述待识别图像进行文本位置识别和字体识别，得到至少一个文本位置处的至少一个文本对应的至少一个字体类型；其中，所述预训练识别模型用于确定图像中文本位置，以及所述文本位置处文本的字体类型；对所述至少一个文本进行内容识别，得到至少一个内容信息；基于所述至少一个字体类型和所述至少一个文本位置，在电子设备的显示界面显示所述至少一个内容信息。可选地，所述预训练识别模型的训练过程，包括：获取样本图像和样本标签；所述样本标签包括文本位置标签和所述字体类型标签；基于待训练识别模型对所述样本图...

【技术保护点】
1.一种字体识别方法，其特征在于，应用于电子设备，所述方法包括：/n获取待识别图像；/n利用预训练识别模型，对所述待识别图像进行文本位置识别和字体识别，得到至少一个文本位置处的至少一个文本对应的至少一个字体类型；其中，所述预训练识别模型用于确定图像中文本位置，以及所述文本位置处文本的字体类型；/n对所述至少一个文本进行内容识别，得到至少一个内容信息；/n基于所述至少一个字体类型和所述至少一个文本位置，在所述电子设备的显示界面显示所述至少一个内容信息。/n

【技术特征摘要】
1.一种字体识别方法，其特征在于，应用于电子设备，所述方法包括：
获取待识别图像；
利用预训练识别模型，对所述待识别图像进行文本位置识别和字体识别，得到至少一个文本位置处的至少一个文本对应的至少一个字体类型；其中，所述预训练识别模型用于确定图像中文本位置，以及所述文本位置处文本的字体类型；
对所述至少一个文本进行内容识别，得到至少一个内容信息；
基于所述至少一个字体类型和所述至少一个文本位置，在所述电子设备的显示界面显示所述至少一个内容信息。

2.根据权利要求1所述的方法，其特征在于，所述预训练识别模型的训练过程，包括：
获取样本图像和样本标签；所述样本标签包括文本位置标签和所述字体类型标签；
基于待训练识别模型对所述样本图像进行处理，得到第一输出结果；所述第一输出结果用于表征所述样本图像中的第一文本位置和所述第一文本位置对应的第一字体类型；
通过目标损失函数，确定所述样本标签和所述第一输出结果之间的第一差异值；
基于所述第一差异值对所述待训练识别模型进行训练，直到满足训练结束条件时，得到所述预训练识别模型。

3.根据权利要求2所述的方法，其特征在于，所述目标损失函数包括第一损失函数和第二损失函数；其中，所述第一损失函数用于计算文本位置的差异值，所述第二损失函数用于计算字体类型的差异值；
所述通过目标损失函数，确定所述样本标签和所述第一输出结果之间的第一差异值，包括：
基于所述第一损失函数，确定所述文本位置标签和所述第一文本位置信息的文本位置差异值；
基于所述第二损失函数，确定所述字体类型标签和所述第一字体类型的字体类型差异值；
对所述文本位置差异值和所述字体类型差异值进行加权处理，得到所述第一差异值。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述对所述至少一个文本进行内容识别，得到至少一个内容信息，包括：
利用预设的文本内容识别模型，对所述待识别图像中所述至少一个文本位置对应的至少一个文本进行识别，得到所述至少一个文本内容信息；文本位置和文本内容信息一一对应；其中，所述文本内容识别模型用于确定文本图像中的内容信息。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述基于所述至少一个字体类型和所述至少一个文本位置，在所述电子设备的显示界面显示所述至少一个内容信息，包括：
获取所述至少一个字体类型对应的字体文件；
根据所述字...

【专利技术属性】
技术研发人员：尚太章，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人