一种字体识别方法、装置及设备制造方法及图纸

技术编号：42810141 阅读：18 留言：0更新日期：2024-09-24 20:52

本发明专利技术提供一种字体识别方法、装置及设备，所述方法包括：获取包含有文字的待识别图片；对所述待识别图片进行字形识别，得到字形识别结果；对所述待识别图片进行字体特征提取，得到字体特征提取结果；将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果；将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果。本发明专利技术的方案使得字体识别更准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及字符信息处理，特别是一种字体识别方法、装置及设备。

技术介绍

1、版式分析和版面还原对于实现无纸化办公和提升用户体验有着非常重要的作用，字体作为版面的组成部分，其准确识别有着重要的意义。随着计算机和深度学习技术的发展，自动化的字体识别成为当前的热点研究方向。

2、现有的字体识别算法首先提取文字图片特征，送入神经网络，解析得到字体识别的结果，但是此类算法在一定程度上忽视了字形对字体识别结果的影响。神经网络模型中需要综合考虑字体、字形等多个角度的特征，特征提取广泛，导致字体特征被弱化。

技术实现思路

1、本专利技术要解决的技术问题是提供一种字体识别方法、装置及设备，使得字体识别更准确。

2、为解决上述技术问题，本专利技术的技术方案如下：

3、一种字体识别方法，包括：

4、获取包含有文字的待识别图片；

5、对所述待识别图片进行字形识别，得到字形识别结果；

6、对所述待识别图片进行字体特征提取，得到字体特征提取结果；

7、将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果；

8、将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果。

9、可选的，对所述待识别图片进行字形识别，得到字形识别结果，包括：

10、通过字形识别模型对所述待识别图片中的文字进行字形识别，得到字形识别结果，所述字形识别模型根据图片集中的文本训练集进行训练得到。

11、可选的，通过字形识别模型对所述待识别图片中的文字进行字形识别，得到字形识别结果，包括：

12、通过所述字形识别模型的字形特征提取层对所述待识别图片进行字形特征提取，得到字形特征提取结果；

13、通过所述字形识别模型的字形识别层对所述字形特征提取结果进行字形识别处理，输出第一输出向量，所述第一输出向量为字形识别结果。

14、可选的，对所述待识别图片进行字体特征提取，得到字体特征提取结果，包括：

15、通过字体识别模型的字体特征提取层对所述待识别图片进行字体特征提取，输出第三输出向量，所述第三输出向量为字体特征提取结果；所述字体特征提取结果包括：所述待识别图片中的所有文字的至少一个包含字体特征的特征图；所述字体识别模型根据图片集中的字体训练集进行训练得到。

16、可选的，将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果，包括：

17、对所述第一输出向量进行卷积处理，得到第二输出向量；

18、通过字体识别模型的特征融合层，将所述第三输出向量和第二输出向量中的目标维度的特征数据进行拼接，得到融合处理结果。

19、可选的，将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果，包括：

20、通过所述字体识别模型的字体特征编码层，对所述融合处理结果中的字体类型进行识别，得到所述待识别图片中的文字的字体识别结果。

21、可选的，通过所述字体识别模型的字体特征编码层，对所述融合处理结果中的字体类型进行识别，得到所述待识别图片中的文字的字体识别结果，包括：

22、对所述融合处理结果进行降维处理，得到第四输出向量；

23、将所述第四输出向量输入所述字体特征编码层的卷积层，对所述融合处理结果进行分类卷积，输出待识别图片中的文字的字体识别结果。

24、本专利技术还提供一种字体识别装置，包括：

25、获取模块，用于获取包含有文字的待识别图片；

26、处理模块，用于对所述待识别图片进行字形识别，得到字形识别结果；对所述待识别图片进行字体特征提取，得到字体特征提取结果；将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果；将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果。

27、本专利技术还提供一种计算设备，包括：处理器、存储有计算机程序的存储器，所述计算机程序被处理器运行时，执行如上述的方法。

28、本专利技术还提供一种计算机可读存储介质，存储指令，当所述指令在计算机上运行时，使得计算机执行如上述的方法。

29、本专利技术的上述方案至少包括以下有益效果：

30、本专利技术的上述方案，通过获取包含有文字的待识别图片；对所述待识别图片进行字形识别，得到字形识别结果；对所述待识别图片进行字体特征提取，得到字体特征提取结果；将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果；将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果。可以在字体识别时，考虑了字形特征，但又弱化字形特征，增强对字体特征的敏感度，使得字体识别更准确。

本文档来自技高网...

【技术保护点】

1.一种字体识别方法，其特征在于，包括：

2.根据权利要求1所述的字体识别方法，其特征在于，对所述待识别图片进行字形识别，得到字形识别结果，包括：

3.根据权利要求2所述的字体识别方法，其特征在于，通过字形识别模型对所述待识别图片中的文字进行字形识别，得到字形识别结果，包括：

4.根据权利要求3所述的字体识别方法，其特征在于，对所述待识别图片进行字体特征提取，得到字体特征提取结果，包括：

5.根据权利要求4所述的字体识别方法，其特征在于，将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果，包括：

6.根据权利要求1所述的字体识别方法，其特征在于，将所述融合处理结果进行字体特征编码处理，得到所述待识别图片中的文字的字体识别结果，包括：

7.根据权利要求6所述的字体识别方法，其特征在于，通过所述字体识别模型的字体特征编码层，对所述融合处理结果中的字体类型进行识别，得到所述待识别图片中的文字的字体识别结果，包括：

8.一种字体识别装置，其特征在于，包括：

9.一种计算

10.一种计算机可读存储介质，其特征在于，存储指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种字体识别方法，其特征在于，包括：

2.根据权利要求1所述的字体识别方法，其特征在于，对所述待识别图片进行字形识别，得到字形识别结果，包括：

3.根据权利要求2所述的字体识别方法，其特征在于，通过字形识别模型对所述待识别图片中的文字进行字形识别，得到字形识别结果，包括：

4.根据权利要求3所述的字体识别方法，其特征在于，对所述待识别图片进行字体特征提取，得到字体特征提取结果，包括：

5.根据权利要求4所述的字体识别方法，其特征在于，将所述字体特征提取结果与所述字形识别结果进行特征融合处理，得到融合处理结果，包括：

6.根据权利要求1所述的字体识别方法，其特征在...

【专利技术属性】
技术研发人员：王少康，刘丹，张同社，闫倩，
申请(专利权)人：北京数科网维技术有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人