从图像中分离文字的方法、装置、电子设备及介质制造方法及图纸

技术编号：44102584 阅读：8 留言：0更新日期：2025-01-24 22:30

本公开涉及图像处理技术领域，具体涉及一种从图像中分离文字的方法、装置、电子设备及介质，从图像中分离文字的方法，包括：获取原始图像；依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器；利用所述文本过滤器处理所述原始图像得到文本图像。上述技术方案中通过采用形态学操作方法处理原始图像，依次对原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器，利用文本过滤器可以将原始图像中的图像部分去除掉，仅保留含文字信息的文本图像，这样在进行文字识别时不会因误选择了非文字区域导致文本识别准确性降低，有利于提高文字识别精度，降低识别错误率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及图像处理，具体涉及一种从图像中分离文字的方法、装置、电子设备及介质。

技术介绍

1、目前，图像内容越来越丰富，例如图像文件中可能同时包含文字和图像，图像文件中的文字往往不能直接进行编辑，需要使用文字识别软件先将文字识别出来才方便进行下一步地编辑操作。现有技术中，使用文字识别软件从图像文件中框选文字部分时，若框选的区域中同时存在部分图像等非文字信息时，会无法准确地识别出已框选的文字，导致文字的识别准确率低。

技术实现思路

1、为了解决相关技术中的问题，本公开实施例提供一种从图像中分离文字的方法、装置、电子设备及介质。

2、第一方面，本公开实施例中提供了一种从图像中分离文字的方法，包括：

3、获取原始图像；

4、依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器；

5、利用所述文本过滤器处理所述原始图像得到文本图像。

6、在本公开的一种实现方式中，所述依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器，包括：

7、对所述原始图像进行二值化操作得到第一图像；

8、对所述第一图像进行腐蚀操作得到第二图像；

9、以所述第二图像作为种子图像，以所述第一图像作为掩膜进行重建操作得到第三图像；

10、对所述第三图像进行黑帽操作得到文本过滤器。

11、在本公开的一种实现方式中，所述方法还包括：

12、接收文本过滤器的配置参数

13、所述对所述原始图像进行二值化操作得到第一图像包括：

14、基于所述二值化阈值得到第一图像；

15、所述对所述第一图像进行腐蚀操作得到第二图像包括：

16、基于所述腐蚀核得到第二图像；

17、所述对所述第三图像进行黑帽操作得到文本过滤器包括：

18、基于所述矩形核得到文本过滤器。

19、在本公开的一种实现方式中，所述利用所述文本过滤器处理所述原始图像得到文本图像，包括：

20、将所述文本过滤器取反后与所述原始图像相加得到文本图像。

21、在本公开的一种实现方式中，所述方法还包括：

22、对所述文本图像进行文字识别。

23、在本公开的一种实现方式中，在对所述文本图像进行文字识别之前，所述方法还包括：

24、对所述文本图像进行文本增强处理。

25、第二方面，本公开实施例中提供了一种从图像中分离文字的装置，包括：

26、获取模块，被配置为获取原始图像；

27、生成模块，被配置为依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器；

28、处理模块，被配置为利用所述文本过滤器处理所述原始图像得到文本图像。

29、在本公开的一种实现方式中，所述生成模块包括：

30、第一生成单元，被配置为对所述原始图像进行二值化操作得到第一图像；

31、第二生成单元，被配置为对所述第一图像进行腐蚀操作得到第二图像；

32、第三生成单元，被配置为以所述第二图像作为种子图像，以所述第一图像作为掩膜进行重建操作得到第三图像；

33、第四生成单元，被配置为对所述第三图像进行黑帽操作得到文本过滤器。

34、在本公开的一种实现方式中，所述装置还包括：

35、配置模块，被配置为接收文本过滤器的配置参数；所述配置参数包括二值化阈值和/或腐蚀核和/或黑帽操作的矩形核；

36、所述第一生成单元还被配置为：基于所述二值化阈值得到第一图像；

37、所述第二生成单元还被配置为：基于所述腐蚀核得到第二图像；

38、所述第四生成单元还被配置为：基于所述矩形核得到文本过滤器。

39、在本公开的一种实现方式中，所述处理模块，包括：

40、运算单元，被配置为将所述文本过滤器取反后与所述原始图像相加得到文本图像。

41、在本公开的一种实现方式中，所述装置还包括：

42、识别模块，被配置为对所述文本图像进行文字识别。

43、在本公开的一种实现方式中，所述装置还包括：

44、增强处理模块，被配置为对所述文本图像进行文本增强处理。

45、第三方面，本公开实施例提供了一种电子设备，包括存储器和处理器，其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现如第一方面任一项所述的方法。

46、第四方面，本公开实施例中提供了一种计算机可读存储介质，其上存储有计算机指令，该计算机指令被处理器执行时实现如第一方面任一项所述的方法。

47、本公开实施例提供的技术效果可以包括以下有益效果：

48、根据本公开实施例提供的技术方案，从图像中分离文字的方法，包括：获取原始图像；依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器；利用所述文本过滤器处理所述原始图像得到文本图像。上述技术方案中通过采用形态学操作方法处理原始图像，依次对原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器，利用文本过滤器可以将原始图像中的图像部分去除掉，仅保留含文字信息的文本图像，这样在进行文字识别时不会因误选择了非文字区域导致文本识别准确性降低，有利于提高文字识别精度，降低识别错误率。

49、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种从图像中分离文字的方法，其特征在于，包括：

2.根据权利要求1所述的从图像中分离文字的方法，其特征在于，所述依次对所述原始图像进行二值化操作、重建开操作、黑帽操作得到文本过滤器，包括：

3.根据权利要求2所述的从图像中分离文字的方法，其特征在于，还包括：

4.根据权利要求1所述的从图像中分离文字的方法，其特征在于，所述利用所述文本过滤器处理所述原始图像得到文本图像，包括：

5.根据权利要求1所述的从图像中分离文字的方法，其特征在于，还包括：

6.根据权利要求5所述的从图像中分离文字的方法，其特征在于，在对所述文本图像进行文字识别之前，所述方法还包括：

7.一种从图像中分离文字的装置，其特征在于，包括：

8.根据权利要求7所述的从图像中分离文字的装置，其特征在于，所述生成模块包括：

9.一种电子设备，其特征在于，包括存储器和处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现权利要求1-6任一项所述的方法。

10.

...

【技术特征摘要】

1.一种从图像中分离文字的方法，其特征在于，包括：

3.根据权利要求2所述的从图像中分离文字的方法，其特征在于，还包括：

4.根据权利要求1所述的从图像中分离文字的方法，其特征在于，所述利用所述文本过滤器处理所述原始图像得到文本图像，包括：

5.根据权利要求1所述的从图像中分离文字的方法，其特征在于，还包括：

6.根据权利要求5所述的从图像中分离文字的方...

【专利技术属性】
技术研发人员：于浩，
申请(专利权)人：北京大上科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人