当前位置: 首页 > 专利查询>钟炎培专利>正文

图像中文字块的编码方法及装置制造方法及图纸

技术编号:15706693 阅读:168 留言:0更新日期:2017-06-26 21:17
本发明专利技术公开了一种图像中文字块的编码方法及装置。其中,该方法包括:提取包含了文字的图像中预定数量的文字块;统计每个文字块的残差,并对残差进行拟合,得到残差对应的概率状态转移表;依据概率状态转移表所确定的预设顺序对文字块进行分类;对分类后的文字块进行编码。本发明专利技术解决了由于相关技术中算法僵化且远离真实运算需求,导致图像编码计算效率低的技术问题。

Coding method and device for Chinese character block of image

The invention discloses a coding method and a device for Chinese characters in images. Among them, the method includes: extracting text in the image contains a predetermined number of blocks of text; residual statistics of each block of text, and fitting of residuals, obtained the probability residuals corresponding table; based on the probabilistic state transition table default order determined by the classification of text block; encoding text classification block. The invention solves the technical problem that the calculation efficiency of the image coding is low because the algorithm in the correlation technique is rigid and is far from the real computing requirement.

【技术实现步骤摘要】
图像中文字块的编码方法及装置
本专利技术涉及电子技术应用领域,具体而言,涉及一种图像中文字块的编码方法及装置。
技术介绍
电脑屏幕画面采集的视频序列与摄像机等设备采集的视频序列有着较大的区别。在电脑屏幕画面中,较多场景会有文字画面,例如:浏览网页,播放幻灯片等会出现大量文字。对于文字画面进行截取并按固定大小划分成块,得到的图像块信息简称文字块。文字块基于其特有的性质,在较大的压缩比下,仍能保持较为合理的失真度。文字块经压缩后有失真,将图像的真实值和压缩恢复后的值之间的差值定义为残差。目前主流的压缩算法中如:H.264,H.265,JPEG更多的是针对自然画面的压缩。而对于文字块压缩效果并不理想。相关技术中提到的文字块压缩算法是目前出现的较为理想的针对文字块的压缩算法。具体如下:文字块最主要的特征是主要的能量集中在较少的几种像素中,例如屏幕显示为一篇白底黑字的文章,可以认为主要能量集中在白色像素和黑色像素中。由此定义能量集中的像素域为基本色,其他的定义为逃逸色。基本色根据文字块的频率直方图确定,确定基本色以后即得到基本色码表。根据基本色和逃逸色,按照相应序号对文字块中像素点进行编码(例如确定四个基本色,序号为0、1、2、3,所有逃逸色序号为4),在编码过程中引入预测。即每个像素点的YUV三个分量跟左侧的像素点YUV三个分量是否相等,如果相等用符号L表示;每个像素点的YUV三个分量跟上面的像素点YUV三个分量是否相等,如果相等用符号U表示;如果不相等用符号O表示。由此得到预测索引码表。对于符号为O的像素点,由于无法根据邻域得到本身的值,故需要编写O数据对应码表。前面步骤中,对于逃逸色统一编号为4,故需要编写逃逸色对应码表。最后将前面提到的基本色码表、预测索引码表、O数据码表、逃逸色码表编码后进行传输。在无损传输中,除传输前面提到的各种码表外,对于残差仍需要进行传输。而针对文字块的残差无损编码传输,目前应用Huffman编码,此外,算数编码器由于效果不好并未使用。对于残差编码目前理论体系一共有两类算法可选:Huffman编码或算数编码。但是相关技术中Huffman编码方案使用的假设前提是残差数据的取值为独立概率,基于文字编码器算法思想,临近范围内的残差的关联关系虽然已经被部分破坏,但仍有较多条件概率信息可以深度挖掘;Huffman编码方案在使用过程中需要预先得知整体概率分布,并生成字典。发送端和接收端每次在同步字典之前,字典不能有任何变化,即无法自适应的进行调整;残差如果分布的极不均匀(中间能量非常大即0附近的值多),Huffman编码方案需要进行升阶处理。例如残差取值为[-16,16],则码表字典共需要提供33个符号对应编码,如果升级为4阶段,则码表字典共需要提供334个符号对应编码。现有方案的升阶无论对于时间复杂度还是空间复杂度都是呈指数增长;而针对文字编码器残差的特殊性,算数编码器无法快速逼近真实概率,概率调整较为复杂,较多时候效果不如Huffman效果好。针对上述由于相关技术中算法僵化且远离真实运算需求,导致图像编码计算效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种图像中文字块的编码方法及装置,以至少解决由于相关技术中算法僵化且远离真实运算需求,导致图像编码计算效率低的技术问题。根据本专利技术实施例的一个方面,提供了一种图像中文字块的编码方法,包括:提取包含了文字的图像中预定数量的文字块;统计每个文字块的残差,并对残差进行拟合,得到残差对应的概率状态转移表;依据概率状态转移表所确定的预设顺序对文字块进行分类;对分类后的文字块进行编码。可选的,对残差进行拟合,得到残差对应的概率状态转移表包括:对残差进行高斯拟合,得到高斯系数σ;依据高斯系数σ和预先存储的统计规律,确定残差对应的概率状态转移表。进一步地,可选的,依据概率状态转移表所确定的预设顺序对文字块进行分类包括:依据预设顺序判断每个文字块的残差是否为零;在判断结果为是的情况下,对残差为零的文字块标记第一标识;在判断结果为否的情况下,对残差为非零的文字块标记第二标识。可选的,在对残差为零的文字块标记第一标识之后,本申请实施例提供的图像中文字块的编码方法还包括:判断文字块是否为文字画面中最后一个文字块;在判断结果为否的情况下,依据预设顺序判断文字块之后的文字块的残差是否为零,直至文字块为文字画面中最后一个文字块。可选的,在对残差为非零的文字块标记第二标识之后,本申请实施例提供的图像中文字块的编码方法还包括:根据预设扫描顺序扫描所有残差非零的文字块的残差;依据第一预设顺序判断文字块的残差对应的编码符号是否为零;在判断结果为是的情况下,对编码符号为零的文字块标记第三标识;在判断结果为否的情况下,对编码符号为非零的文字块标记第四标识。进一步地,可选的,在对编码符号为非零的文字块标记第四标识之后,本申请实施例提供的图像中文字块的编码方法还包括:判断编码符号为非零的文字块的数值是否大于零;在判断结果为是的情况下,对数值大于零的文字块标记第五标识;在判断结果为否的情况下,对数值小于或等于零的文字块标记第六标识,其中,将数值小于零的文字块取数值的绝对值,并依据绝对值进行二值化。可选的,在对编码符号为零的文字块标记第三标识之后,本申请实施例提供的图像中文字块的编码方法还包括:判断文字块是否为文字画面中最后一个文字块;在判断结果为否的情况下,依据第一预设顺序判断文字块的残差对应的编码符号是否为零,直至文字块为文字画面中最后一个文字块。可选的,对分类后的文字块进行编码包括:依据文字块中的各个像素点的位置,配置各个像素点的邻域;依据邻域配置与第一像素点距离为阈值的邻域的第一像素点集为第一级别点,并将与第一像素点距离大于阈值的邻域的第二像素点集为第二级别点;依据第一像素点的量化值筛选第一级别点或第二级别点,得到与第一像素点量化值相同的点,其中,与第一像素点量化值相同的点包括:第一级别同类点和第二级别同类点;依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值,确定第一像素点对应的概率估计模型;依据概率估计模型得到符号概率并结合第一像素点对应取值进行编码,编码后对概率估计模型进行概率调整。进一步地,可选的,依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值,确定第一像素点对应的概率估计模型包括:如果第一级别同类点个数不为零,参考第一级别同类点;如果第一级别同类点个数为零,参考第二级别同类点;其中,参考第二级别同类点包括:如果第二级别同类点个数不为零,参考第二级别同类点;如果第二级别同类点个数为零,对应预设概率估计模型;在参考第一级别同类点确定参考点或参考第二级别同类点确定参考点的个数之后,依据参考点的值确定对应的概率估计模型索引,得到概率模型。根据本专利技术实施例的另一方面,还提供了一种图像中文字块的编码装置,包括:提取模块,用于提取包含了文字的图像中预定数量的文字块;统计模块,用于统计每个文字块的残差,并对残差进行拟合,得到残差对应的概率状态转移表;分类模块,用于依据概率状态转移表所确定的预设顺序对文字块进行分类;编码模块,用于对分类后的文字块进行编码。可选的,统计模块包括:计算单元,用于对残差进行高斯拟合,得到高斯系数σ;统本文档来自技高网
...
图像中文字块的编码方法及装置

【技术保护点】
一种图像中文字块的编码方法,其特征在于,包括:提取包含了文字的图像中预定数量的文字块;统计每个所述文字块的残差,并对所述残差进行拟合,得到所述残差对应的概率状态转移表;依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类;对分类后的文字块进行编码。

【技术特征摘要】
1.一种图像中文字块的编码方法,其特征在于,包括:提取包含了文字的图像中预定数量的文字块;统计每个所述文字块的残差,并对所述残差进行拟合,得到所述残差对应的概率状态转移表;依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类;对分类后的文字块进行编码。2.根据权利要求1所述的方法,其特征在于,所述对所述残差进行拟合,得到所述残差对应的概率状态转移表包括:对所述残差进行高斯拟合,得到高斯系数σ;依据所述高斯系数σ和预先存储的统计规律,确定所述残差对应的概率状态转移表。3.根据权利要求2所述的方法,其特征在于,所述依据所述概率状态转移表所确定的预设顺序对所述文字块进行分类包括:依据所述预设顺序判断每个文字块的残差是否为零;在判断结果为是的情况下,对所述残差为零的文字块标记第一标识;在判断结果为否的情况下,对所述残差为非零的文字块标记第二标识。4.根据权利要求3所述的方法,其特征在于,在所述对所述残差为零的文字块标记第一标识之后,所述方法还包括:判断所述文字块是否为所述文字画面中最后一个文字块;在判断结果为否的情况下,依据所述预设顺序判断所述文字块之后的文字块的残差是否为零,直至所述文字块为所述文字画面中最后一个文字块。5.根据权利要求3所述的方法,其特征在于,在所述对所述残差为非零的文字块标记第二标识之后,所述方法还包括:根据预设扫描顺序扫描所有所述残差非零的文字块的残差;依据第一预设顺序判断所述文字块的残差对应的编码符号是否为零;在判断结果为是的情况下,对所述编码符号为零的文字块标记第三标识;在判断结果为否的情况下,对所述编码符号为非零的文字块标记第四标识。6.根据权利要求5所述的方法,其特征在于,在所述对所述编码符号为非零的文字块标记第四标识之后,所述方法还包括:判断所述编码符号为非零的文字块的数值是否大于零;在判断结果为是的情况下,对所述数值大于零的文字块标记第五标识;在判断结果为否的情况下,对所述数值小于或等于零的文字块标记第六标识,其中,将所述数值小于零的文字块取所述数值的绝对值,并依据所述绝对值进行二值化。7.根据权利要求5所述的方法,其特征在于,在所述对所述编码符号为零的文字块标记第三标识之后,所述方法还包括:判断所述文字块是否为所述文字画面中最后一个文字块;在判断结果为否的情况下,依据所述第一预设顺序判断所述文字块的残差对应的编码符号是否为零,直至所述文字块为所述文字画面中最后一个文字块。8.根据权利要求1所述的方法,其特征在于,所述对分类后的文字块进行编码包括:依据所述文字块中的各个像素点的位置,配置所述各个像素点的邻域;依据所述邻域配置与第一像素点距离为阈值的所述邻域的第一像素点集为第一级别点,并将与所述第一像素点距离大于阈值的所述邻域的第二像素点集为第二级别点;依据所述第一像素点的量化值筛选所述第一级别点或所述第二级别点,得到与所述第一像素点量化值相同的点,其中,所述与所述第一像素点量化值相同的点包括:第一级别同类点和第二级别同类点;依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值,确定所述第一像素点对应的概率估计模型;依据所述概率估计模型得到符号概率并结合第一像素点对应取值进行编码,编码后对所述概率估计模型进行概率调整。9.根据权利要求8所述的方法,其特征在于,所述依据预设顺序参考第一级别同类点和第二级别同类点的个数及对应值,确定所述第一像素点对应的概率估计模型包括:如果所述第一级别同类点个数不为零,参考所述第一级别同类点;如果所述第一级别同类点个数为零,参考所述第二级别同类点;其中,参考所述第二级别同类点包括:如果所述第二级别同类点个数不为零,参考第二级别同类点;如果所述第二级别同类点个数为零,对应预设概率估计模型;在参考所述第一级别同类点确定参考点或参考所述第二级别同类点确定参考点的个数之后,依据所述参考点的值确定对应的概率估计模型索引,得到所述概率模型。10.一种图像中文字块的编码装置,其特征在于,包括:提取模块,用于提取包含了文字的图像中预定数量的文字块;统计模块,用于统计每个所述文字块的残差,并对...

【专利技术属性】
技术研发人员:炎喆燕志伟
申请(专利权)人:钟炎培
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1