用于存储器模型一致性的多播和反射存储器行为制造技术

技术编号：38347201 阅读：17 留言：0更新日期：2023-08-02 09:27

本公开涉及用于存储器模型一致性的多播和反射存储器行为。在各种示例中，存储器模型支持多播，其中存储器访问操作的单个请求被传播到与多个处理元件相关联的多个物理地址(例如对应于相应的本地存储器)。因此该请求使从每个处理元件的存储器读取数据和/或向每个处理元件的存储器写入数据。在一些示例中，存储器模型向进程公开多播。这包括提供单独的多播和单播指令或具有用于指示多播或单播的一个或更多个参数(例如指示虚拟地址)的共享指令。附加地或替代地，使用多播还是单播处理一个或更多个请求对于进程和/或应用程序可能是不透明的，或者由系统以其他方式确定。可以对使用多播的处理请求施加一个或更多个约束以维持一致的存储器接口。一致的存储器接口。一致的存储器接口。

全部详细技术资料下载

【技术实现步骤摘要】
用于存储器模型一致性的多播和反射存储器行为

技术介绍

[0001]计算过程可以利用多个处理元件，例如图形处理单元(GPU)的流式多处理器(SM)，来执行处理操作。为此，处理元件可以提供对存储器访问的请求，这可能涉及使用存储器模型从存储器读取和/或向存储器写入。存储器模型可以允许处理元件在读取和写入数据时进行协调，这对于支持并行或以其他方式协调处理是至关重要的。例如，在存储器分布在多个GPU的系统中，GPU的每个SM可以从GPU的本地存储器或另一个GPU的远程存储器读取和/或写入GPU的本地存储器或另一个GPU的远程存储器。为了促进SM之间的协调，存储器模型可以实现虚拟寻址方案，其中虚拟地址(VA)跨GPU映射到物理地址(PA)。为了保持一致性，每个VA可以映射到特定的PA，以便任何SM可以使用VA来请求使用特定PA执行存储器操作。
[0002]当处理元件正在执行协调处理时，一些处理操作可能涉及从多个处理元件接收数据和/或向多个处理元件提供数据。例如，全归约操作可能涉及从每个处理元件收集数据以跨设备执行归约(例如，求和、最大值等)并将结果广播到每个处理元件。收集数据可能需要每个处理元件的存储器访问请求并且广播结果可能再次需要每个处理元件的存储器访问请求。因此，所需的请求数量可能会随着参与处理元件的数量、延迟和/或带宽要求的增加而增加。这种开销在深度学习中可能特别有影响，其中全归约已成为高频执行的关键操作。

技术实现思路

[0003]本公开的实施例涉及用于存储器模型一致性的多播和反射存储器行为。公开了提供来自处理元件的多播...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法，包括：接收与存储器访问操作的请求相对应的第一数据，所述请求指示虚拟地址VA；使用所述数据执行所述VA的地址转换，所述地址转换包括将所述VA转换为至少与多个处理元件PE中的第一PE相对应的第一物理地址PA以及与所述多个PE中的第二PE相对应的第二PA中的至少一部分；以及传输与所述地址转换的结果相对应的第二数据，所述传输使得响应于所述请求而使用所述第一PA和所述第二PA在一个或更多个存储器上进行存储器访问。2.根据权利要求1所述的方法，其中所述第一数据的所述接收、所述地址转换的所述执行以及所述第二数据的所述传输是由存储器管理单元MMU响应于所述MMU接收到来自所述第一PE的请求而执行的。3.根据权利要求1所述的方法，其中所述地址转换至少基于将所述VA指派给多播VA空间，并且使用所述多个PE中的一个或更多个将至少一个VA指派给单播VA空间，所述单播VA空间与所述多播VA空间是分开的。4.根据权利要求1所述的方法，其中所述VA的所述转换至少基于在所述多个PE中的一个或更多个上运行的一个或更多个应用程序将所述VA指派给包括所述第一PE和所述第二PE的多播组而用于多个设备。5.根据权利要求1所述的方法，其中所述转换至少基于分析与存储器访问操作的请求相关联的一个或更多个模式而用于多个设备，所述存储器访问操作的请求至少基于与所述VA相对应的所述存储器访问操作的请求。6.根据权利要求1所述的方法，其中所述请求来自所述第一PE，所述第一PE具有对所述VA的写访问，并且所述第二PE具有对所述VA的只读访问。7.根据权利要求1所述的方法，其中所述一个或更多个存储器包括在第一设备上的第一存储器和在第二设备上的第二存储器，所述第一设备包括所述第一PE，所述第二设备包括所述第二PE。8.根据权利要求1所述的方法，其中所述第二数据的所述传输是到交换机，并且所述交换机使用所述第二数据来传播导致所述存储器访问的所述请求。9.根据权利要求1所述的方法，其中所述地址转换是所述VA到一个或更多个中间地址的第一地址转换，并且所述转换包括所述一个或更多个中间地址到所述第一PA和所述第二PA的第二地址转换。10.一种计算机实现的方法，包括：接收与存储器访问操作的请求相对应的数据，所述请求指示虚拟地址VA；使用所述数据将所述VA映射到多个设备；以及将所述请求传播到所述多个设备中的每一个，所述传播使得响应于所述请求，所述多...

【专利技术属性】
技术研发人员：G，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人