一种判定描述相对于参考方块的移动的移动向量的方法,该方法包含:根据相符标准,判定多个预测方块中哪一个与该参考方块有较佳相符;执行局部区域彻底搜寻以产生与该参考方块的最佳相符,该局部区域彻底搜寻在以该较佳相符预测方块为中央的周围的区域,该最佳相符具有整数像素分辨率;将该最佳相符与该参考方块间相符的程度建模为二次表面;分析地判定该二次表面的最小值,该最小值对应有分数分辨率的最佳相符方块;以及根据该有分数分辨率的最佳相符方块计算分数移动向量。
【技术实现步骤摘要】
本专利技术目前所揭露的内容关于一种图形处理单元,且尤其是关于具有图像压缩与解压缩特征的图形处理单元。
技术介绍
个人计算机与消费性电子产品是用于各种娱乐用品。这些娱乐用品可以大致区分为2类使用计算机制图(computer-generated graphics)的那些,例如计算机游戏;与使用压缩视频数据流(compressed video stream)的那些,例如预录节目到数字式激光视盘(DVD)上,或由有线电视或卫星业者提供数字节目(digital programming)至机顶盒(set-top box)。第2种亦包含编码模拟视频数据流,例如由数字录像机(DVR,digital video recorder)所执行。计算机制图通常由图形处理单元(GPU,graphic processing unit)产生。图形处理单元是一种建立在计算机游戏平台(computer game consoles)与一些个人计算机上一种特别的微处理器。图形处理单元被最佳化为快速执行描绘三度空间基本对象(three-dimensional primitive objects),例如三角形、四边形等。这些基本对象是以多个顶点描述,其中每个顶点具有属性(例如颜色),且可施加纹理(texture)至该基本对象上。描绘的结果是二维空间像素阵列(two-dimensional array of pixels),显示在计算机的显示器或监视器上。视频数据流的编码与解码牵涉到不同种类的运算,例如,离散余弦变换(discrete cosine transform)、移动估测(motion estimation)、移动补偿(motion compensation)、去方块效应滤波器(deblocking filter)。这些计算通常由一般用途中央处理器(CPU)结合特别的硬件逻辑电路,例如专用集成电路(ASIC,application specific integrated circuit),来处理。消费者因而需要多个运算平台以满足他们的娱乐需求。因而需要可以处理计算机制图与视频编码/解码的单一计算平台。
技术实现思路
本专利技术的一个方面是一种判定描述相对于参考方块的移动的移动向量的方法,该方法包含根据相符标准,判定多个预测方块中哪一个与该参考方块有较佳相符;执行局部区域彻底搜寻以产生与该参考方块的最佳相符,该局部区域彻底搜寻在以该较佳相符预测方块为中央的周围的区域,该最佳相符具有整数像素分辨率;将该最佳相符与该参考方块间相符的程度建模为二次表面;分析地判定该二次表面的最小值,该最小值对应有分数分辨率的最佳相符方块;以及根据该有分数分辨率的最佳相符方块计算分数移动向量。本专利技术的另一个方面是一种判定描述相对于参考方块的移动的移动向量的方法,该方法包含根据相符标准,判定多个预测方块中哪一个与该参考方块有较佳相符;执行局部区域彻底搜寻以产生与该参考方块的最佳相符,该局部区域彻底搜寻在以该较佳相符预测方块为中央的周围的区域,该最佳相符具有整数像素分辨率;以及分析地判定建模该最佳相符与该参考方块间相符的程度的二次表面的最小值,该最小值对应有分数分辨率的最佳相符方块。本专利技术的另一个方面是一种具有用来判断移动向量的程序的计算机可读媒体,该程序含有设置成用来执行下列步骤的逻辑根据相符标准,判定多个预测方块中哪一个与参考方块有较佳相符;执行局部区域彻底搜寻以产生与该参考方块的最佳相符,该局部区域彻底搜寻在以该较佳相符预测方块为中央的周围的区域,该最佳相符具有整数像素分辨率;将该最佳相符与该参考方块间相符的程度建模为二次表面;分析地判定该二次表面的最小值,该最小值对应有分数分辨率的最佳相符方块;以及根据该有分数分辨率的最佳相符方块计算分数移动向量。附图说明图1是用于图形与视频编码及/或解码的一示范性运算平台的方块图。图2是图1的视频编码器160的功能方块图。图3A、3B说明将目前图像分割成不重迭的区段的巨图块。图4是图2的移动估测器所使用的算法的一示范性实施例的流程图。图5是图4共轭梯度步骤440的一实施例的流程图。图6说明使用图5的共轭梯度下降步骤440的示范状态。图7是图4邻近搜寻算法的一实施例的流程图。图8A、8B说明图7的邻近搜寻算法所使用的5个候选巨图块的相对位置。图9A、图9B是说明对参考与预测方块进行绝对差值加总指令运作的方块图。图10是图1的图形处理单元的数据流程图。图11是图10纹理滤波单元与纹理快取的方块图。100~系统、110~主处理器、120~图形处理器(GPU)、130~存储器、140~总线、150~视频加速单元(VPU)、160~软件解码器、170~视频加速驱动器。205~图像、210~减法器、220~移动估测器、230~参考图像、245~移动向量、255~预测方块、260~剩余图像、270~离散余弦转换器、280~量化器、290~熵解码器、2100~解码器。310~目前巨图块、320~巨图块、330~搜寻窗、340~点。400~程序、410~判定移动向量将被图像间预测或图像内预测、420~施行共轭梯度下降搜寻算法、430~执行邻近搜寻、440~执行局部区域彻底搜寻、450~建立最佳候选巨图块与参考巨图块间相符程度为二次表面、460~在分数像素边界找到最佳候选巨图块调准、470~根据该相符巨图块计算分数移动向量。505~初始化候选方块、510~计算候选巨图块Cx,y四周的候选巨图块的坐标、515~分别计算5个候选巨图块的绝对差值加总、520~计算梯度gx与gy、525~梯度是否低于临界值、530~计算四个新候选巨图块的坐标、535~对各候选巨图块分别执行共轭梯度下降步骤440、540~比较绝对差值加总值是否低于临界值、545~回传有最低绝对差值加总值的候选巨图块、550~选择新的中央候选巨图块、555~从梯度gx与gy计算新的步骤值Δx与Δy、560~测试迭代循环数是否大于最大值、565~回传不相符。610C~候选巨图块、610L-610R-610T-610B~四个周围候选、620X-620Y~初始候选计算梯度、630TL-630TR-630BL-630BR~四个新的中央候选巨图块、640L-640R-640T-640B~候选、670-680~候选。710~利用目前巨图块310地址的绝对值与每行巨图块数计算旗标变量TOPVALID。若此绝对值非0,则TOPVALID为真,此外,TOPVALID为假。720~旗标变量LEFTVALID是利用目前巨图块地址的除以整数与每行巨图块数计算。若此除数非0,则LEFTVALID为真,此外,LEFTVALID为假。730~结合使用TOPVALID与LEFTVALID变量以判定目前巨图块邻近的4个候选巨图块的可得性。740~为一先前候选巨图块P判定可得性。750~为每一可得候选巨图块计算绝对差值加总。810-850~候选巨图块。910-940~4×4方块、950~4×4参考方块。234~旋转逻辑器、950~预测方块、960-990~绝对差值加总计算单元、1010~指令流处理器、1020~指令、1030~指令数据、1040~执行单元池、1050~纹理滤波单元、1060~纹理快取、1070~后包装本文档来自技高网...
【技术保护点】
一种判定描述相对于参考方块的移动的移动向量的方法,该方法包含:根据相符标准,判定多个预测方块中哪一个与该参考方块有较佳相符;执行局部区域彻底搜寻以产生与该参考方块的最佳相符,该局部区域彻底搜寻在以该较佳相符预测方块为中央的周围的区域,该最佳相符具有整数像素分辨率;将该最佳相符与该参考方块间相符的程度建模为二次表面;分析地判定该二次表面的最小值,该最小值对应有分数分辨率的最佳相符方块;以及根据该有分数分辨率的最佳相符方块计算分数移动向量。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:扎伊尔德荷圣,
申请(专利权)人:威盛电子股份有限公司,
类型:发明
国别省市:71[中国|台湾]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。