图像中文字块的编码方法及装置制造方法及图纸

技术编号：15706693 阅读：186 留言：0更新日期：2017-06-26 21:17

本发明专利技术公开了一种图像中文字块的编码方法及装置。其中，该方法包括：提取包含了文字的图像中预定数量的文字块；统计每个文字块的残差，并对残差进行拟合，得到残差对应的概率状态转移表；依据概率状态转移表所确定的预设顺序对文字块进行分类；对分类后的文字块进行编码。本发明专利技术解决了由于相关技术中算法僵化且远离真实运算需求，导致图像编码计算效率低的技术问题。

Coding method and device for Chinese character block of image

The invention discloses a coding method and a device for Chinese characters in images. Among them, the method includes: extracting text in the image contains a predetermined number of blocks of text; residual statistics of each block of text, and fitting of residuals, obtained the probability residuals corresponding table; based on the probabilistic state transition table default order determined by the classification of text block; encoding text classification block. The invention solves the technical problem that the calculation efficiency of the image coding is low because the algorithm in the correlation technique is rigid and is far from the real computing requirement.

全部详细技术资料下载

【技术实现步骤摘要】
图像中文字块的编码方法及装置
本专利技术涉及电子技术应用领域，具体而言，涉及一种图像中文字块的编码方法及装置。
技术介绍
电脑屏幕画面采集的视频序列与摄像机等设备采集的视频序列有着较大的区别。在电脑屏幕画面中，较多场景会有文字画面，例如：浏览网页，播放幻灯片等会出现大量文字。对于文字画面进行截取并按固定大小划分成块，得到的图像块信息简称文字块。文字块基于其特有的性质，在较大的压缩比下，仍能保持较为合理的失真度。文字块经压缩后有失真，将图像的真实值和压缩恢复后的值之间的差值定义为残差。目前主流的压缩算法中如：H.264，H.265，JPEG更多的是针对自然画面的压缩。而对于文字块压缩效果并不理想。相关技术中提到的文字块压缩算法是目前出现的较为理想的针对文字块的压缩算法。具体如下：文字块最主要的特征是主要的能量集中在较少的几种像素中，例如屏幕显示为一篇白底黑字的文章，可以认为主要能量集中在白色像素和黑色像素中。由此定义能量集中的像素域为基本色，其他的定义为逃逸色。基本色根据文字块的频率直方图确定，确定基本色以后即得到基本色码表。根据基本色和逃逸色，按照相应序号对文字块中像素点进行编码(例如确定四个基本色，序号为0、1、2、3，所有逃逸色序号为4)，在编码过程中引入预测。即每个像素点的YUV三个分量跟左侧的像素点YUV三个分量是否相等，如果相等用符号L表示；每个像素点的YUV三个分量跟上面的像素点YUV三个分量是否相等，如果相等用符号U表示；如果不相等用符号O表示。由此得到预测索引码表。对于符号为O的像素点，由于无法根据邻域得到本身的值，故需要编写O数据对应码表...
图像中文字块的编码方法及装置

【技术保护点】
一种图像中文字块的编码方法，其特征在于，包括：提取包含了文字的图像中预定数量的文字块；统计每个所述文字块的残差，并对所述残差进行拟合，得到所述残差对应的概率状态转移表；依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类；对分类后的文字块进行编码。

【技术特征摘要】
1.一种图像中文字块的编码方法，其特征在于，包括：提取包含了文字的图像中预定数量的文字块；统计每个所述文字块的残差，并对所述残差进行拟合，得到所述残差对应的概率状态转移表；依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类；对分类后的文字块进行编码。2.根据权利要求1所述的方法，其特征在于，所述对所述残差进行拟合，得到所述残差对应的概率状态转移表包括：对所述残差进行高斯拟合，得到高斯系数σ；依据所述高斯系数σ和预先存储的统计规律，确定所述残差对应的概率状态转移表。3.根据权利要求2所述的方法，其特征在于，所述依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类包括：依据所述预设顺序判断每个文字块的残差是否为零；在判断结果为是的情况下，对所述残差为零的文字块标记第一标识；在判断结果为否的情况下，对所述残差为非零的文字块标记第二标识。4.根据权利要求3所述的方法，其特征在于，在所述对所述残差为零的文字块标记第一标识之后，所述方法还包括：判断所述文字块是否为所述文字画面中最后一个文字块；在判断结果为否的情况下，依据所述预设顺序判断所述文字块之后的文字块的残差是否为零，直至所述文字块为所述文字画面中最后一个文字块。5.根据权利要求3所述的方法，其特征在于，在所述对所述残差为非零的文字块标记第二标识之后，所述方法还包括：根据预设扫描顺序扫描所有所述残差非零的文字块的残差；依据第一预设顺序判断所述文字块的残差对应的编码符号是否为零；在判断结果为是的情况下，对所述编码符号为零的文字块标记第三标识；在判断结果为否的情况下，对所述编码符号为非零的文字块标记第四标识。6.根据权利要求5所述的方法，其特征在于，在所述对所述编码符号为非零的文字块标记第四标识之后，所述方法还包括：判断所述编码符号为非零的文字块的数值是否大于零；在判断结果为是的情况下，对所述数值大于零的文字块标记第五标识；在判断结果为否的情况下，对所述数值小于或等于零的文字块标记第六标识，其中，将所述数值小于零的文字块取所述数值的绝对值，并依据所述绝对值进行二值化。7.根据权利要求5所述的方法，其特征在于，在所述对所述编码符号为零的文字块标记第三标识之后，所述方法还包括：判断所述文字块是否为所述文字画面中最后一个文字块；在判断结果为否的情况下，依据所述第一预设顺序判断所述文字块的残差对应的编码符号是否为零，直至所述文字块为所述文字画面中最后一个文字块。8.根据权利要求1所述的方法，其特征在于，所述对分类后的文字块进行编码包括：依据所述文字块中的各个像素点的位置，配置所述各个像素点的邻域；依据所述邻域配置与第一像素点距离为阈值的所述邻域的第一像素点集为第一级别点，并将与所述第一像素点距离大于阈值的所述邻域的第二像素点集为第二级别点；依据所述第一像素点的量化值筛选所述第一级别点或所述第二级别点，得到与所述第一像素点量化值相同的点，其中，所述与所述第一像素点量化值相同的点包括：第一级别同类点和第二级别同类点；依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值，确定所述第一像素点对应的概率估计模型；依据所述概率估计模型得到符号概率并结合第一像素点对应取值进行编码，编码后对所述概率估计模型进行概率调整。9.根据权利要求8所述的方法，其特征在于，所述依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值，确定所述第一像素点对应的概率估计模型包括：如果所述第一级别同类点个数不为零，参考所述第一级别同类点；如果所述第一级别同类点个数为零，参考所述第二级别同类点；其中，参考所述第二级别同类点包括：如果所述第二级别同类点个数不为零，参考第二级别同类点；如果所述第二级别同类点个数为零，对应预设概率估计模型；在参考所述第一级别同类点确定参考点或参考所述第二级别同类点确定参考点的个数之后，依据所述参考点的值确定对应的概率估计模型索引，得到所述概率模型。10.一种图像中文字块的编码装置，其特征在于，包括：提取模块，用于提取包含了文字的图像中预定数量的文字块；统计模块，用于统计每个所述文字块的残差，并对...

【专利技术属性】
技术研发人员：炎喆，燕志伟，
申请(专利权)人：钟炎培，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人