一种数字图像中提取文本区域的方法技术

技术编号：3601442 阅读：225 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种数字图像中提取文本区域的方法，该方法包括如下步骤：扫描该数字图像，获得该图像的亮度值；平滑过滤该数字图像；将图像划分为多个块；计算各块中水平方向以及竖直方向的边缘个数；及根据该边缘个数确定文本块。本发明专利技术运用关系像素间的区别，简单有效地提取数字图像中的文本区域，在降低成本的同时得到了比较好的处理效果，同时提高了标记文本区域的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数字图像处理方法，特别是涉及。
技术介绍
在很多内容丰富的数字图像中，一幅图通常都同时包括图形区域、文本区域、连续的图像区域等。在对数字图像进行处理时，针对不同的区域，通常会有不同的处理方式。图形与文本一般都要求具有较清晰的边缘，特别是文本区域，具有较清晰的边缘才能较容易地识别出其中的文字内容，而图像区域则更注重内容，例如在打印的时候如果选用节约碳粉的打印方式，则将整幅图都进行淡化处理，这样图像、图形、文字同时被淡化，虽然对图像的处理效果比较明显，但是不能区别对待文字和图形的边缘和内部，因为文字和图形的打印结果只需要知道位置和形状就可以，用户更关心轮廓边缘，轮廓内部的可以不要或更淡。又如在数字复印机中，文件首先通过一个扫描单元进行扫描，经过扫描单元处理之后，文件转换为灰度图像或RGB彩色图像。图像根据例如一位驱动或多位驱动的驱动形式进一步处理。如果数字复印机是一个彩色复印机，则必须执行一个过网(Screen)功能，将8位灰度图像或8位RGB图像转换为1位或多位图像的步骤，彩色匹配步骤必须在过网功能之前执行，一些产品通过有规律的矩阵执行过网操作，另一些产品使用误差混淆来消除波纹干扰。虽然执行点阵过网中的半色调对于表现连续的色调源文件具有比较好的处理效果，但是会降低文本与图形的质量，使文本或图线的边缘更加平滑，从而导致边缘不够清晰。因此，当前急需一种自动识别图像中的文本区域，从而可对文本区域进行区别处理，使文本或图形区域获得清晰、尖锐的边缘，但对于其它连续的色调图像与半色调图像，通过平滑过滤使整个图像更加光滑。
技术实现思路
本专利技术所要解...

【技术保护点】
一种数字图像中提取文本区域的方法，其特征在于，该方法包括如下步骤：扫描该数字图像，获得该图像的亮度值；平滑过滤该数字图像；将图像划分为多个块；计算各块中水平方向以及竖直方向的边缘个数；及根据该边缘个数确定文本块。

【技术特征摘要】

【专利技术属性】
技术研发人员：周兴平，
申请(专利权)人：致伸科技股份有限公司，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人