System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向分子动力学计算的PCIe通信系统技术方案_技高网
当前位置: 首页 > 专利查询>湖南大学专利>正文

一种面向分子动力学计算的PCIe通信系统技术方案

技术编号:42087879 阅读:8 留言:0更新日期:2024-07-19 17:03
本发明专利技术涉及人工智能和集成电路设计领域,公开了一种面向分子动力学计算的PCIe通信系统。本发明专利技术为分子动力学计算的FPGA或ASIC等“非冯·诺依曼”架构计算设备,设计基于PCIe的通信系统。该系统通过PCIe Switch进行连接,实现计算设备和GPU间的P2P通信,并通过特定滑窗算法设计,显著减少分子动力学通信数据量,实现高精度、高速度的分子动力学计算。

【技术实现步骤摘要】

本专利技术涉及人工智能和集成电路设计领域,提供一种面向分子动力学计算的pcie通信系统,用以加速分子动力学计算。


技术介绍

1、分子动力学是一套分子模拟方法,属于计算科学中不可或缺的一部分,该方法依靠牛顿力学来模拟分子体系的运动,来进一步分析体系热力学性质及其他宏观性质。其主要可分为势能面(potential energy surface,pes)推理和牛顿运动方程积分两个部分。近年来,基于机器学习的分子动力学计算用深度学习的方法拟合高维势函数,可以做到既准确又快速的分子动力学模拟计算。在分子动力学计算的过程中,势能面推理部分占整个计算的绝大部分耗时,却由于硬件上的限制,难以进一步提升其计算速度。

2、在现有分子动力学模拟计算中,通常使用中央处理器(central processingunit,cpu)和图形处理器(graphics processing unit,gpu)进行分子动力学计算。但由于cpu、gpu等采用计算与存储相分离的“存算分离”芯片架构(“冯·诺依曼”架构),存在“存储墙”和“通信墙”瓶颈,大量的运算时间和功耗被消耗在了cpu、gpu与存储器之间频繁的数据交互中,严重制约了人工智能的算力提升。

3、为解决上述“存储墙”瓶颈,现有做法是通过在现场可编程门阵列(fieldprogrammable gate array,fpga)或专用计算芯片(application specific integratedcircuit,asic)等“非冯·诺依曼”架构的高性能硬件计算设备中,替代原gpu中最耗时的势能面计算,以实现分子动力学计算速度的进一步的提升。然而随着算力的提升,通信带宽需求也同步急剧增长,使得“通信墙”问题成为整体算力提升的短板,严重制约了分子动力学的计算速度进一步提升,亟需发展相匹配的通信技术。


技术实现思路

1、为满足因采用fpga/asic等“非冯·诺依曼”高性能硬件计算设备(以下简称计算设备)所带来的巨大通信需求,保证上下位机之间的通信速度与所述计算设备的计算速度相匹配,本专利技术提供了一种面向分子动力学计算的pcie通信系统,通过优化通信结构和降低所述计算设备与cpu/gpu通信的数据量,实现分子动力学整体计算速度的提升。

2、本专利技术采用如下技术方案:

3、第一方面,在所述计算设备中,本专利技术基于高速的pcie协议,在pcie物理层、数据链路层、事务的三层结构基础上,定制适合分子动力学计算的应用层通信协议,通过设计适合分子动力学计算的滑窗算法,减少单步分子动力学计算的传输数据量,使得通信速度可以匹配上下位机之间的流水线计算,从而提升分子动力学的计算速度。

4、第二方面,在所述分子动力学计算的通信系统中,每台服务器中均配有合适数量的分子动力学所述计算设备,同时在服务器pcie架构中,将pcie switch设计为中间交换设备,其上游端口(upstream port)与服务器的cpu相连,下游端口(downstream port)分别与所述计算设备相连。gpu和计算设备之间,通过pcie p2p(peer to peer)的数据传输方式,实现gpu和计算卡间直接的数据交互,减少数据搬移导致的资源损耗和时间损耗。

5、本专利技术与现有技术相比,其显著优点在于,通过在“冯·诺依曼”架构和“非冯·诺依曼”架构之间设计专门的通信系统,显著降低高速分子动力学计算所需带宽,保证了不同架构设备之间的流水线计算,从而提高了系统整体的计算速度。同时基于pcie的p2p通信方式,提高gpu和计算加速设备间的通信带宽,降低传输时延,减少运算时间和功耗损失。

本文档来自技高网...

【技术保护点】

1.一种面向分子动力学计算的PCIe通信系统。其特征在于,其专用于分子动力学计算,整个通信系统由PCIe Switch、GPU以及分子动力学计算专用计算设备三部分组成;所述PCIe通信系统应部署于适合进行高性能计算的服务器中。

2.如权利要求1所述PCIe通信系统,其特征在于,所述三部分连接结构为:PCIe Switch的上游端口需要与服务器的CPU相连接;下游端口则分别与GPU和分子动力学计算设备相连。PCIe Switch在分子动力学计算中实现PCIe P2P中转,在收到位于其地址空间下的TLP包后,其能以较低的延时转发至对应下游链路同时,该PCIe Switch下游的各设备均需要支持实现PCIe P2P的功能。

3.如权利要求1所述分子动力学计算专用计算设备,其特征在于,该设备基于“非冯·诺依曼”架构进行设计,并在该设备内部,基于PCIe协议设计相应应用层协议及其滑窗处理模块,能够对其他设备传输来的特定数据格式进行分析和处理,实现“冯·诺依曼”架构和“非冯·诺依曼”架构间的数据交互。

4.如权利要求3所述滑窗处理,其特征在于,本专利技术实施例采用的分胞形状经过特定处理,使得前后两次传输中重叠部分的原子可以在分子动力学计算设备中实现栈操作。且该栈可以在一定控制下,对已出栈的数据实现恢复,从而还原出栈的原子数据,实现了数据的滑窗,将通信带宽需求降低为原需求带宽的三分之一,显著降低了单步计算中传输至分子动力学计算设备的数据量大小,减少传输时间。

5.如权利要求1中的服务器,其特征在于,其内部可以安装多块GPU和分子动力学专用计算设备进行并行计算,实现更高的计算并行度。

...

【技术特征摘要】

1.一种面向分子动力学计算的pcie通信系统。其特征在于,其专用于分子动力学计算,整个通信系统由pcie switch、gpu以及分子动力学计算专用计算设备三部分组成;所述pcie通信系统应部署于适合进行高性能计算的服务器中。

2.如权利要求1所述pcie通信系统,其特征在于,所述三部分连接结构为:pcie switch的上游端口需要与服务器的cpu相连接;下游端口则分别与gpu和分子动力学计算设备相连。pcie switch在分子动力学计算中实现pcie p2p中转,在收到位于其地址空间下的tlp包后,其能以较低的延时转发至对应下游链路同时,该pcie switch下游的各设备均需要支持实现pcie p2p的功能。

3.如权利要求1所述分子动力学计算专用计算设备,其特征在于,该设备基...

【专利技术属性】
技术研发人员:刘杰纪植赵卓影张鑫莫平辉彭远超官大为陶佑源
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1