一种面向分子动力学计算的PCIe通信系统技术方案

技术编号：42087879 阅读：8 留言：0更新日期：2024-07-19 17:03

本发明专利技术涉及人工智能和集成电路设计领域，公开了一种面向分子动力学计算的PCIe通信系统。本发明专利技术为分子动力学计算的FPGA或ASIC等“非冯·诺依曼”架构计算设备，设计基于PCIe的通信系统。该系统通过PCIe Switch进行连接，实现计算设备和GPU间的P2P通信，并通过特定滑窗算法设计，显著减少分子动力学通信数据量，实现高精度、高速度的分子动力学计算。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能和集成电路设计领域，提供一种面向分子动力学计算的pcie通信系统，用以加速分子动力学计算。

技术介绍

1、分子动力学是一套分子模拟方法，属于计算科学中不可或缺的一部分，该方法依靠牛顿力学来模拟分子体系的运动，来进一步分析体系热力学性质及其他宏观性质。其主要可分为势能面(potential energy surface,pes)推理和牛顿运动方程积分两个部分。近年来，基于机器学习的分子动力学计算用深度学习的方法拟合高维势函数，可以做到既准确又快速的分子动力学模拟计算。在分子动力学计算的过程中，势能面推理部分占整个计算的绝大部分耗时，却由于硬件上的限制，难以进一步提升其计算速度。

2、在现有分子动力学模拟计算中，通常使用中央处理器(central processingunit，cpu)和图形处理器(graphics processing unit，gpu)进行分子动力学计算。但由于cpu、gpu等采用计算与存储相分离的“存算分离”芯片架构(“冯·诺依曼”架构)，存在“存储墙”和“通信墙”瓶颈，大量的运算时间和功耗被消耗在了cpu、gpu与存储器之间频繁的数据交互中，严重制约了人工智能的算力提升。

3、为解决上述“存储墙”瓶颈，现有做法是通过在现场可编程门阵列(fieldprogrammable gate array，fpga)或专用计算芯片(application specific integratedcircuit，asic)等“非冯·诺依曼”架构的高性能硬件计算设备中，替代原gpu中

技术实现思路

1、为满足因采用fpga/asic等“非冯·诺依曼”高性能硬件计算设备(以下简称计算设备)所带来的巨大通信需求，保证上下位机之间的通信速度与所述计算设备的计算速度相匹配，本专利技术提供了一种面向分子动力学计算的pcie通信系统，通过优化通信结构和降低所述计算设备与cpu/gpu通信的数据量，实现分子动力学整体计算速度的提升。

2、本专利技术采用如下技术方案：

3、第一方面，在所述计算设备中，本专利技术基于高速的pcie协议，在pcie物理层、数据链路层、事务的三层结构基础上，定制适合分子动力学计算的应用层通信协议，通过设计适合分子动力学计算的滑窗算法，减少单步分子动力学计算的传输数据量，使得通信速度可以匹配上下位机之间的流水线计算，从而提升分子动力学的计算速度。

4、第二方面，在所述分子动力学计算的通信系统中，每台服务器中均配有合适数量的分子动力学所述计算设备，同时在服务器pcie架构中，将pcie switch设计为中间交换设备，其上游端口(upstream port)与服务器的cpu相连，下游端口(downstream port)分别与所述计算设备相连。gpu和计算设备之间，通过pcie p2p(peer to peer)的数据传输方式，实现gpu和计算卡间直接的数据交互，减少数据搬移导致的资源损耗和时间损耗。

5、本专利技术与现有技术相比，其显著优点在于，通过在“冯·诺依曼”架构和“非冯·诺依曼”架构之间设计专门的通信系统，显著降低高速分子动力学计算所需带宽，保证了不同架构设备之间的流水线计算，从而提高了系统整体的计算速度。同时基于pcie的p2p通信方式，提高gpu和计算加速设备间的通信带宽，降低传输时延，减少运算时间和功耗损失。

本文档来自技高网...

【技术保护点】

1.一种面向分子动力学计算的PCIe通信系统。其特征在于，其专用于分子动力学计算，整个通信系统由PCIe Switch、GPU以及分子动力学计算专用计算设备三部分组成；所述PCIe通信系统应部署于适合进行高性能计算的服务器中。

2.如权利要求1所述PCIe通信系统，其特征在于，所述三部分连接结构为：PCIe Switch的上游端口需要与服务器的CPU相连接；下游端口则分别与GPU和分子动力学计算设备相连。PCIe Switch在分子动力学计算中实现PCIe P2P中转，在收到位于其地址空间下的TLP包后，其能以较低的延时转发至对应下游链路同时，该PCIe Switch下游的各设备均需要支持实现PCIe P2P的功能。

3.如权利要求1所述分子动力学计算专用计算设备，其特征在于，该设备基于“非冯·诺依曼”架构进行设计，并在该设备内部，基于PCIe协议设计相应应用层协议及其滑窗处理模块，能够对其他设备传输来的特定数据格式进行分析和处理，实现“冯·诺依曼”架构和“非冯·诺依曼”架构间的数据交互。

4.如权利要求3所述滑窗处理，其特征在于，本专利技术实

5.如权利要求1中的服务器，其特征在于，其内部可以安装多块GPU和分子动力学专用计算设备进行并行计算，实现更高的计算并行度。

...

【技术特征摘要】

1.一种面向分子动力学计算的pcie通信系统。其特征在于，其专用于分子动力学计算，整个通信系统由pcie switch、gpu以及分子动力学计算专用计算设备三部分组成；所述pcie通信系统应部署于适合进行高性能计算的服务器中。

2.如权利要求1所述pcie通信系统，其特征在于，所述三部分连接结构为：pcie switch的上游端口需要与服务器的cpu相连接；下游端口则分别与gpu和分子动力学计算设备相连。pcie switch在分子动力学计算中实现pcie p2p中转，在收到位于其地址空间下的tlp包后，其能以较低的延时转发至对应下游链路同时，该pcie switch下游的各设备均需要支持实现pcie p2p的功能。

3.如权利要求1所述分子动力学计算专用计算设备，其特征在于，该设备基...

【专利技术属性】
技术研发人员：刘杰，纪植，赵卓影，张鑫，莫平辉，彭远超，官大为，陶佑源，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人