System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能和集成电路设计领域,提供一种面向分子动力学计算的pcie通信系统,用以加速分子动力学计算。
技术介绍
1、分子动力学是一套分子模拟方法,属于计算科学中不可或缺的一部分,该方法依靠牛顿力学来模拟分子体系的运动,来进一步分析体系热力学性质及其他宏观性质。其主要可分为势能面(potential energy surface,pes)推理和牛顿运动方程积分两个部分。近年来,基于机器学习的分子动力学计算用深度学习的方法拟合高维势函数,可以做到既准确又快速的分子动力学模拟计算。在分子动力学计算的过程中,势能面推理部分占整个计算的绝大部分耗时,却由于硬件上的限制,难以进一步提升其计算速度。
2、在现有分子动力学模拟计算中,通常使用中央处理器(central processingunit,cpu)和图形处理器(graphics processing unit,gpu)进行分子动力学计算。但由于cpu、gpu等采用计算与存储相分离的“存算分离”芯片架构(“冯·诺依曼”架构),存在“存储墙”和“通信墙”瓶颈,大量的运算时间和功耗被消耗在了cpu、gpu与存储器之间频繁的数据交互中,严重制约了人工智能的算力提升。
3、为解决上述“存储墙”瓶颈,现有做法是通过在现场可编程门阵列(fieldprogrammable gate array,fpga)或专用计算芯片(application specific integratedcircuit,asic)等“非冯·诺依曼”架构的高性能硬件计算设备中,替代原gpu中
技术实现思路
1、为满足因采用fpga/asic等“非冯·诺依曼”高性能硬件计算设备(以下简称计算设备)所带来的巨大通信需求,保证上下位机之间的通信速度与所述计算设备的计算速度相匹配,本专利技术提供了一种面向分子动力学计算的pcie通信系统,通过优化通信结构和降低所述计算设备与cpu/gpu通信的数据量,实现分子动力学整体计算速度的提升。
2、本专利技术采用如下技术方案:
3、第一方面,在所述计算设备中,本专利技术基于高速的pcie协议,在pcie物理层、数据链路层、事务的三层结构基础上,定制适合分子动力学计算的应用层通信协议,通过设计适合分子动力学计算的滑窗算法,减少单步分子动力学计算的传输数据量,使得通信速度可以匹配上下位机之间的流水线计算,从而提升分子动力学的计算速度。
4、第二方面,在所述分子动力学计算的通信系统中,每台服务器中均配有合适数量的分子动力学所述计算设备,同时在服务器pcie架构中,将pcie switch设计为中间交换设备,其上游端口(upstream port)与服务器的cpu相连,下游端口(downstream port)分别与所述计算设备相连。gpu和计算设备之间,通过pcie p2p(peer to peer)的数据传输方式,实现gpu和计算卡间直接的数据交互,减少数据搬移导致的资源损耗和时间损耗。
5、本专利技术与现有技术相比,其显著优点在于,通过在“冯·诺依曼”架构和“非冯·诺依曼”架构之间设计专门的通信系统,显著降低高速分子动力学计算所需带宽,保证了不同架构设备之间的流水线计算,从而提高了系统整体的计算速度。同时基于pcie的p2p通信方式,提高gpu和计算加速设备间的通信带宽,降低传输时延,减少运算时间和功耗损失。
本文档来自技高网...【技术保护点】
1.一种面向分子动力学计算的PCIe通信系统。其特征在于,其专用于分子动力学计算,整个通信系统由PCIe Switch、GPU以及分子动力学计算专用计算设备三部分组成;所述PCIe通信系统应部署于适合进行高性能计算的服务器中。
2.如权利要求1所述PCIe通信系统,其特征在于,所述三部分连接结构为:PCIe Switch的上游端口需要与服务器的CPU相连接;下游端口则分别与GPU和分子动力学计算设备相连。PCIe Switch在分子动力学计算中实现PCIe P2P中转,在收到位于其地址空间下的TLP包后,其能以较低的延时转发至对应下游链路同时,该PCIe Switch下游的各设备均需要支持实现PCIe P2P的功能。
3.如权利要求1所述分子动力学计算专用计算设备,其特征在于,该设备基于“非冯·诺依曼”架构进行设计,并在该设备内部,基于PCIe协议设计相应应用层协议及其滑窗处理模块,能够对其他设备传输来的特定数据格式进行分析和处理,实现“冯·诺依曼”架构和“非冯·诺依曼”架构间的数据交互。
4.如权利要求3所述滑窗处理,其特征在于,本专利技术实
5.如权利要求1中的服务器,其特征在于,其内部可以安装多块GPU和分子动力学专用计算设备进行并行计算,实现更高的计算并行度。
...【技术特征摘要】
1.一种面向分子动力学计算的pcie通信系统。其特征在于,其专用于分子动力学计算,整个通信系统由pcie switch、gpu以及分子动力学计算专用计算设备三部分组成;所述pcie通信系统应部署于适合进行高性能计算的服务器中。
2.如权利要求1所述pcie通信系统,其特征在于,所述三部分连接结构为:pcie switch的上游端口需要与服务器的cpu相连接;下游端口则分别与gpu和分子动力学计算设备相连。pcie switch在分子动力学计算中实现pcie p2p中转,在收到位于其地址空间下的tlp包后,其能以较低的延时转发至对应下游链路同时,该pcie switch下游的各设备均需要支持实现pcie p2p的功能。
3.如权利要求1所述分子动力学计算专用计算设备,其特征在于,该设备基...
【专利技术属性】
技术研发人员:刘杰,纪植,赵卓影,张鑫,莫平辉,彭远超,官大为,陶佑源,
申请(专利权)人:湖南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。