基于CUDA的剂量计算优化方法和系统技术方案

技术编号:4157387 阅读:273 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于CUDA的剂量计算优化方法,包括:中央处理单元将剂量计算可以并行计算部分的数据下发给显示处理单元;显示处理单元对接收的数据按照预定算法进行并行计算;显示处理单元将计算结果返回。本发明专利技术还公开了一种基于CUDA的剂量计算优化系统。本发明专利技术利用GPU硬件能提供更高的计算加速比,将可以并行计算的部分下发给GPU进行计算,充分发挥GPU并行计算的优势,有效提高了计算速度。

Dose calculation optimization method and system based on CUDA

The present invention discloses a kind of optimization method, the calculation of CUDA dose based on central processing unit may include: dose calculation can be computed in parallel to the display part of the data processing unit; a display processing unit for receiving data according to a predetermined algorithm for parallel computing; the display processing unit and return the result. The invention also discloses a dose calculation optimization system based on CUDA. The invention uses the GPU hardware can provide higher calculationspeedup ratio, will be able to compute in parallel to the GPU calculation part, give full play to the advantage of parallel computing GPU, effectively improve the computing speed.

【技术实现步骤摘要】

本专利技术涉及计算优化技术,尤其涉及一种基于CUDA的剂量计算优化 方法和系统。
技术介绍
在三维立体放射治疗系统中,在治疗前需要模拟得到放射剂量的分布 数据,以对潜在的治疗效果进行评估。该系统因此具有治疗规划系统以进 行治疗前的剂量模拟。治疗规划系统在模拟当中需要在不同照射角度下进行3D剂量场的计 算,而在单个照射角度下又要对很多个放射源(对于多源放疗设备)下的 剂量数据进行叠加。这些计算的运算量非常巨大,其中还涉及到大量的图 像和轮廓数据的调用以及查表运算等。目前是利用CPU技术对3D剂量场 进行计算,由于CPU的串行运算机制,对于处理大量数据运算来说,其速 度是比较慢的。虽然计算才几市场长期以来CPU处理器速度稳步上升并出现 多核处理器,但是对于3D剂量场的计算来说,成本增加而计算速度提高 有限的问题一直没有得到解决。
技术实现思路
本专利技术要解决的技术问题是提供一种能有效提高速度的基于CUDA 的剂量计算优化方法和系统本专利技术的技术问题通过以下技术方案加以解决一种基于CUDA的剂量计算优化方法,包括中央处理单元将剂量计 算可以并行计算部分的数据下发给显示处理单元;显示处理单元对接收的 数据按照预定算法进行并行计算;显示处理单元将计算结果返回。上述中央处理单元将剂量计算可以并行计算部分的数据下发给显示处 理单元包括将图像和轮廓数据下发到显示处理单元的紋理存储器;将剂 量计算用到的表数据以及网格数据下发到显示处理单元的常量存储器;将剂量计算用到的网格数据下发到显示处理单元的全局存储器。上述显示处理单元对接收的数据按照预定算法进行并行计算还包括 根据所述图像、轮廓数据和所述网格数据计算网格点的坐标;根据所述坐 标和轮廓数据以及所述表数据按照所述预定算法计算网格点的剂量;所述 显示处理单元将计算结果返回包括将所述网格点的剂量返回的过程。上述显示处理单元对接收的数据按照预定算法进行并行计算还包括 将计算得出的所述网格点的坐标和剂量存储在显示处理单元的全局内存中;所述显示处理单元将计算结果返回通过读取所述全局内存而获得所述 网格点的坐标和剂量来实现。基于CUDA的剂量计算优化系,统,包括中央处理单元和显示处理单 元;所述中央处理单元用于将剂量计算可以并行计算部分的数据下发给所 述显示处理单元;所述显示处理单元对接收的数据按照预定算法进行并行 计算,并将计算结果返回。上述剂量计算可以并行计算部分的数据是指网格点的剂量计算数据。 上述显示处理单元包括紋理存储器、常量存储器和全局存储器,所述 紋理存储器用于接收和存储所述中央处理单元下发的图像和轮廓数据;所 述常量存储器用于接收和存储所述中央处理单元下发的剂量计算用到的表 数据;所述全局存储器用于接收和存储网格数据。上述显示处理单元还包括处理器,用于根据所述紋理存储器存储的所 述图像、轮廓数据和所述常量存储器存储的所述表数据,以及所述全局存 储器存储的网格数据计算网格点的坐标;根据所述坐标和轮廓数据以及所 述表数据按照所述预定算法计算网格点的剂量;所述显示处理单元还用于 将所述网格点的剂量返回。上述显示处理单元还包括全局内存,用于存储计算得出的所述网格点 的坐标和剂量;所述中央处理单元还用于通过读取所述全局内存而获得所 述网格点的坐标和剂量。本专利技术与现有技术相比较的有益效果是(1)本专利技术利用GPU硬件能提供更高的计算加速比,将可以并行计算 的部分下发给GPU进行计算,充分发挥GPU并行计算的优势,有效提高 了计算速度;(2) 本专利技术将网格点的计算作为可以并行计算的部分,是针对网格点的剂量互相之间无耦合性之特点,能更好地发挥GPU并行计算的优势;(3) 本专利技术将图像和轮廓数据放入紋理存储器中,这些数据量大,读取频繁,而紋理存〗渚器的访问可以采用其快速紋理拾取的特性而得到加速;将表数据放入常量存储器中也正是利用GPU访问该緩存速度快的特点;(4) 本专利技术实现简单,成本低廉,加速效果显著。附图说明图l是本专利技术系统具体实施方式结构示意图;图2是本专利技术方法一种具体实施方式剂量计算流程图;图3是本专利技术方法一种具体实施方式剂量计算示意图;图4是本专利技术方法一种具体实施方式并行计算流程图。具体实施例方式下面用具体实施方式结合附图对本专利技术做进一步详细说明。CUDA(Compute Unified Device Architecture:计算统一i殳备架构),是一种由NVIDIA公司推出的通用并行计算架构,这个架构可以使用GPU(Graphics Processing Unit:显示处理单元)来解决商业、工业以及科学方面的复杂计算问题。它包含了 CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA的处理器上以超高性能运行。CUDA是一个完整的GPGPU (General Purpose GPU:通用GPU)解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。在架构上采用了一种全新的计算体系结构来使用GPU提供的硬件资源,从而给大规摸的数据计算应用提供了 一种比CPU更加强大的计算能力。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。GPU高性能计算时,并不能直接读取CPU内存数据,因此计算时需要将CPU的内存数据拷贝到显卡内存中。本专利技术基于CUDA剂量优化系统,其具体实施方式,如图l所示,包 括CPU (Central Processing Unit:中央处理单元)和GPU;该CPU用于 将剂量计算可以并行计算部分的数据下发给该GPU; GPU对接收的数据按 照预定算法进行并行计算,并将计算结果返回。剂量计算可以并行计算部分的数据是指网格点的剂量计算数据。 GPU包括紋理存储器和常量存储器,该紋理存储器用于接收和存储所 述CPU下发的图像和轮廓数据;常量存储器用于接收和存储CPU下发的 剂量计算用到的表数据,以及用于接收和存储网格数据的全局存储器,网 格数据包括网格的大小、密度和参考点的空间位置。表数据包括OF( Output Factor:输出因子)、OAR ( Off Axis Ratio:离轴比)等剂量计算需要的必 要数据。本实施方式中,该紋理存储器和常量存储器可以实现为Cache(高 速緩存)。GPU还包括处理器,用于根据紋理存储器存储的图像、轮廓数据和常 量存储器存储的表数据,以及全局存储器存储的网格数据计算网格点的坐 标;根据坐标和轮廓数据以及表数据按照预定算法计算网格点的剂量;GPU 还用于将网格点的剂量返回。GPU还包括全局内存,用于存储计算得出的网格点的坐标和剂量;本专利技术基于CUDA的剂量计算优化方法,其一种具体实施方式,包括 CPU将剂量计算可以并行计算部分的数据下发给GPU; GPU对接收的数 据按照预定算法进行并行计算;GPU将计算结果返回。剂量计算可以并行计算部分的数据是指网格点的剂量计算数据。 CPU将剂量计算可以并行计算部分的数据下发给GPU包括将图像 和轮廓数据下发到GPU本文档来自技高网...

【技术保护点】
一种基于CUDA的剂量计算优化方法,其特征在于,包括:    中央处理单元将剂量计算可以并行计算部分的数据下发给显示处理单元;    显示处理单元对接收的数据按照预定算法进行并行计算;    显示处理单元将计算结果返回。

【技术特征摘要】
1.一种基于CUDA的剂量计算优化方法,其特征在于,包括中央处理单元将剂量计算可以并行计算部分的数据下发给显示处理单元;显示处理单元对接收的数据按照预定算法进行并行计算;显示处理单元将计算结果返回。2. 如权利要求1所述的方法,其特征在于,其中所述剂量计算可以并 行计算部分的数据是指网格点的剂量计算数据。3. 如权利要求1所述的方法,其特征在于,所述中央处理单元将剂量 计算可以并行计算部分的数据下发给显示处理单元包括将图像和轮廓数据下发到显示处理单元的紋理存储器;将剂量计算用到的表数据下发到显示处理单元的常量存储器;将剂量计算用到的网格数据下发到显示处理单元的全局存储器。4. 如权利要求3所述的方法,其特征在于,所述显示处理单元对接收 的数据按照预定算法进行并行计算还包括根据所述图像、轮廓数据和所述网格数据计算网格点的坐标;冲艮据所述坐标和轮廓数据以及所述表数据按照所述预定算法计算网格 点的剂量;所述显示处理单元将计算结果返回包括将所述网格点的剂量返回的过程。5. 如权利要求4所述的方法,其特征在于,所述显示处理单元对接收 的数据按照预定算法进行并行计算还包括将计算得出的所述网格点的坐 标和剂量存储在显示处理单元的全局内存中;所述显示处理单元将计算结 果返回通过读取所述全局内存而获得所述网格点...

【专利技术属性】
技术研发人员:卿侯曹炜崔智刘启平
申请(专利权)人:深圳市海博科技有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利