一种剖析CUDA程序行为的方法技术

技术编号：7517443 阅读：262 留言：0更新日期：2012-07-11 23:41

本发明专利技术公开了一种CUDA程序行为剖析的方法，该方法通过修改模拟器的配置文件开启指令跟踪和程序信息调试功能，来记录CUDA程序运行过程中的线程id号、指令操作码等信息。在对原始的程序运行数据进行提取和过滤后，采用欧几里得距离公式来计算同一线程组中的线程之间的基本块向量距离，建立同步矩阵和相似矩阵模型来分析程序的线程特征。这样，我们提供了现有的CUDA剖析工具尚不具备的基本块级别和线程级别特征的剖析方法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于高性能计算研究和程序行为剖析领域，具体涉及针对CUDA编程模型开发的高性能应用程序(例如在GPGPU平台上运行的高性能数据库和气象预测程序)的行为剖析以及剖析工具的研究，它适用于CUDA应用程序的行为研究和剖析方法的优化。
技术介绍
GPU以其理论上计算性能显著超越同时代的多核CPU的技术优势，已经在近几年里进入了非图形计算领域，而像CUDA (Computing Unified Device Architecture，计算统一设备体系结构)这样的编程模型的涌现，鼓舞了开发者利用GPU来运行高性能应用的热情。在NVIDIA公司的官方网站上，已经有不同领域的几百个成功的典型应用，它们获得的加速比可以达到几十甚至上百，并且这一情况仍在继续发展。在产业界，也有不少公司希望把他们的应用，比如用于流媒体处理领域的H. 264编解码器，迁移到GPU架构上来，获得更高的并行性能。然而，目前缺乏一种优秀的剖析工具，来帮助开发者来深入理解CUDA应用程序的加速效果。NVIDIA公司开发的cudaprof工具受到硬件计数器数量的限制，提供的信息有限，而且不能扩展。而gpuocelot中的cuda程序剖析工具，主要是对源代码的静态剖析。我们希望开发一种CUDA程序剖析系统，来帮助开发者理解CUDA应用程序的动态行为特征，尤其是基本块特征、线程同步特征以及相似特征等现有的CUDA剖析工具无法剖析的特征。程序剖析一般分为静态剖析和动态剖析两种。静态剖析并不真正执行程序，而是通过对序源码进行分析，得到程序的结构信息(包括模块调用关系图、模块的控制流程图等)、逆向提取的...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：金海，喻之斌，程伟，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人