System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于对图形处理单元GPU核的物料清单成本和功率性能进行优化的系统和方法技术方案_技高网

用于对图形处理单元GPU核的物料清单成本和功率性能进行优化的系统和方法技术方案

技术编号:43886151 阅读:2 留言:0更新日期:2025-01-03 13:02
本发明专利技术提供了一种用于对图形处理单元GPU核的BoM成本进行优化的系统和方法。该系统(100)包括GPU(101),该GPU具有典型计算单元和GPU指令集,但具有缺少饱和逻辑的视频SIMD指令,其中实现了视频编解码器编码器/解码器模块。在GPU中实现了环路去区块滤波器、后处理滤波模块(102)。将用于在视频SIMD指令中实现饱和的逻辑硬件去除有助于降低BoM成本,并且本发明专利技术的步骤有助于在没有饱和逻辑的情况下实现比特精确结果。不使用饱和逻辑时消耗的功率小于使用饱和逻辑时消耗的功率,从而为平台SoC设计者和制造商使用具有更好功率性能的低BoM成本GPU提供了附加价值。

【技术实现步骤摘要】

本专利技术涉及一种用于对图形处理单元(gpu)核的物料清单(bom)成本和功率性能进行优化的系统和方法。更具体地,本专利技术涉及通过在具有视频单指令多数据(simd,single instruction multiple data)的gpu上实施视频编解码器编码器、解码器、环路滤波/后处理滤波(去区块滤波器)并且在平台片上系统(soc,system-on-chip)上的中央处理单元(cpu)中执行控制软件,来对gpu核的bom成本进行优化,其中在视频simd指令中没有硬连线的饱和逻辑。


技术介绍

1、平台soc通常由cpu核、dsp核和gpu核组成。平台soc用于构建不同类型的手持设备,例如移动手机、无人机、电池管理系统等。计算密集型视频编解码器在dsp上实现,有时由硬件协处理器辅助在dsp上实现。

2、存在各种视频压缩标准,诸如mpeg-1、mpeg-2、mpeg-4、h.264、h.265、h.266、av1、vp8、vp10以及更多即将推出的标准。编解码器在平台soc中的dsp上运行消耗了大量电力。最近的趋势探索设计在gpu上实现视频编解码器并在cpu上运行控制软件。

3、视频通信中处理器的高负荷会引起大量的功率消耗,结果在视频通信中设备使用的电池寿命急剧降低。

4、gpu核指令集架构(isa)具有内置在视频simd指令中的饱和逻辑。每条指令中的饱和逻辑花费了数百/数千个门,这增加了gpu核的芯片面积和bom成本。gpu核isa具有仅simd扩展,并且除了三条指令——即add、sub和专用sat指令——之外,缺少饱和逻辑。由此产生的gpu核的bom成本比具有饱和逻辑的gpu要低得多。在包含不具有饱和逻辑的此视频simd指令的gpu上获得比特精确结果和功率最优解决方案是具有挑战性的。本专利技术通过使用不具有饱和逻辑的gpu核视频simd指令,获得了在gpu上实现视频编解码器编码器、解码器、环路滤波模块的结果,同时获得了更好的功率性能并降低了bom成本。

5、名称为“system and method for optimizing power consumption in mobiledevices(用于对移动设备中的功率消耗进行优化的系统和方法)”的美国专利文件us10390309公开了一种用于通过合适的指令集架构特征变化和语音编解码器的优化实现方式来对移动设备中的功率消耗进行优化的方法和装置。然而,该解决方案目的在于主要以语音通话的使用情况为目标并且以cpu为目标。

6、名称为“system and method for optimizing power consumption in videocommunication in mobiledevices(用于对移动设备中的视频通信中的功率消耗进行优化的系统和方法)”的美国专利文件us11330526公开了一种用于通过合适的指令集架构特征变化和视频编解码器的优化实现方式来对移动设备中的功率消耗进行优化的方法和装置。然而,该解决方案目的在于使用cpu和dsp核对视频通话的使用情况的功率优化。


技术实现思路

1、本专利技术克服了相关技术中的缺陷,并且提供了一种用于对用于移动设备的平台soc中的gpu的bom成本和功率性能进行优化的系统和方法。

2、该系统包括平台soc中的cpu和具有视频simd指令的gpu。分辨率为8比特、10比特的数字视频数据由cpu提供给gpu进行编码/解码。控制软件在cpu上实现,而计算密集型的编码器、解码器、滤波模块则在gpu上实现。

3、在本专利技术的实施方式中,根据压缩标准h.264或任何其他适合应用的标准对数字视频信号进行编码。各种编码工具(诸如帧内预测、运动补偿、滤波)在包含不具有饱和逻辑的视频simd指令的gpu中被实现。该gpu中的电流消耗小于gpu包含具有饱和逻辑的视频simd指令的情况下的gpu中的电流消耗,并且具有降低gpu的bom成本的额外优势。

4、该系统还包括视频编解码器解码器。视频编解码器解码器模块被配置成对压缩视频信号进行解码。然后使用去区块滤波器模块对解码后的视频信号进行后处理。所有这些模块都在gpu核中实现。

5、因此,本专利技术提供了用于对gpu的bom成本进行优化同时与包含具有饱和逻辑的视频simd指令的gpu相比节省了产品设备中视频通话中的功率消耗的方法。

6、用具有较小的芯片面积的gpu核替换平台soc中的gpu核,从而降低gpu的bom成本。

本文档来自技高网...

【技术保护点】

1.一种用于对图形处理单元(GPU)核的物料清单(BoM)成本和功率性能进行优化的系统(100),所述系统(100)包括:

2.根据权利要求1所述的系统,其中,所述视频编解码器模块(101、102)包括MPEG-1、MPEG-2、MPEG-4、H.264、H.265、H.266、AV1、VP8、VP10标准视频编解码器。

3.根据权利要求1所述的系统,其中,与包含具有饱和逻辑的视频SIMD指令的GPU核相比,所述GPU核的所述BoM成本降低,用以实现视频编解码器编码器和解码器模块、环路/后处理(去区块滤波器)。

4.一种用于对GPU核的BoM成本和功率性能进行优化的方法,所述方法包括下述步骤:

5.根据权利要求4所述的方法,其中,所述视频编解码器模块(101、102)包括MPEG-1、MPEG-2、MPEG-4、H.264、H.265、H.266、AVI、VP8、VP10标准视频编解码器。

【技术特征摘要】

1.一种用于对图形处理单元(gpu)核的物料清单(bom)成本和功率性能进行优化的系统(100),所述系统(100)包括:

2.根据权利要求1所述的系统,其中,所述视频编解码器模块(101、102)包括mpeg-1、mpeg-2、mpeg-4、h.264、h.265、h.266、av1、vp8、vp10标准视频编解码器。

3.根据权利要求1所述的系统,其中,与包含具有饱和逻辑的视频simd指令的g...

【专利技术属性】
技术研发人员:纳拉辛汉·维贾伊·阿南德穆罕默德·阿姆林·布什拉·塔杰阿克沙伊·马达瓦拉皮·拉梅什勒拉帕利·阿那迦卡马尔舒·文卡塔·什里亚
申请(专利权)人:特锐斯贝斯技术OPC私人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1