多瓦片、多芯片处理布置中的同步制造技术

技术编号：21855453 阅读：48 留言：0更新日期：2019-08-14 01:37

一种操作系统的方法，包括被划分成多个域的多个处理器瓦片，其中在每个域内，瓦片通过时间确定性互连的相应实例彼此连接，并且在域之间，瓦片通过非时间确定性互连彼此连接。所述方法包括：执行计算级，然后在每个域内执行相应的内部屏障同步，然后在每个域内执行内部交换阶段，然后执行外部屏障同步以在不同域之间同步，然后在域之间执行外部交换阶段。

Synchronization in Multi-tile and Multi-Chip Processing Layout

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】多瓦片、多芯片处理布置中的同步
本公开涉及在包括多瓦片处理布置的处理器中同步多个不同瓦片的工作负载，每个瓦片包括其自己的处理单元和存储器。具体地，本公开涉及批量同步并行(BSP)通信方案，其中瓦片组中的每个瓦片必须在组中的任何瓦片可以继续到交换阶段之前完成计算阶段。
技术介绍
多线程处理器是能够彼此并行执行多个程序线程的处理器。处理可以包括对多个不同线程是共同的一些硬件(例如共同指令存储器、数据存储器和/或执行单元)；但是为了支持多线程，处理器还包括一些特定于每个线程的专用硬件。专用硬件至少包括可以一次执行的多个线程中的每个的相应上下文寄存器文件。当谈到多线程处理器时，“上下文”指的是彼此并行执行的线程的相应一个的程序状态(例如程序计数器值、状态和当前操作数值)。上下文寄存器文件指的是用于表示相应线程的这种程序状态的相应寄存器集合。寄存器文件中的寄存器不同于通用存储器，因为寄存器地址固定为指令字中的位(bit)，而存储器地址可以通过执行指令来计算。给定上下文的寄存器通常包括用于相应线程的相应程序计数器，以及相应操作数寄存器集，用于临时保持在由该线程执行的计算期间作用于相应线程并由相应线程输出的数据。每个上下文还可以具有相应的状态寄存器，用于存储相应线程的状态(例如它是暂停还是正在运行)。因此，每个当前运行的线程都具有自己独立的程序计数器，并可选地具有操作数寄存器和状态寄存器。多线程的一种可能形式是并行(parallelism)。即是说，除了多个上下文之外，还提供了多个执行流水线：即，用于要并行执行的每个指令流的独立执行流水线。但是，这需要在硬件方面进行大量...

【技术保护点】
1.一种操作系统的方法，包括被划分成多个域的多个处理器的瓦片，其中在每个域内，瓦片通过时间确定性互连的相应实例彼此连接，并且在域之间，瓦片通过非时间确定性互连彼此连接；所述方法包括：在跨越域的一些或所有瓦片的参与组中的每个相应的一个上，执行计算级，其中相应的瓦片执行相应的一个或多个瓦片上计算，但既不向也不从组中的任何其他瓦片传送计算结果；在所述一个或多个域中的每个相应的一个域内，执行相应的内部屏障同步以要求相应的域中的所有参与瓦片在相应的域中的任何参与瓦片被允许继续到内部交换阶段之前已经完成计算阶段，从而在所述一个或多个域中的单独每一个域内部的所有参与瓦片之间建立共同时间参考；在相应的内部屏障同步之后，在所述一个或多个域中的每个内执行所述内部交换阶段，其中相应的域内的每个参与瓦片通过时间确定性互连向和/或从同一域内的一个或多个其他参与瓦片传送其相应计算的一个或多个结果，但既不向也不从任何其他所述域传送计算结果；执行外部屏障同步以要求所述域的所有参与瓦片在任何参与瓦片被允许继续到外部交换阶段之前已经完成内部交换阶段，从而在跨越域的所有参与瓦片之间建立共同时间参考；和在所述外部屏障同步之后...

【技术特征摘要】
【国外来华专利技术】2017.10.20 GB 1717294.11.一种操作系统的方法，包括被划分成多个域的多个处理器的瓦片，其中在每个域内，瓦片通过时间确定性互连的相应实例彼此连接，并且在域之间，瓦片通过非时间确定性互连彼此连接；所述方法包括：在跨越域的一些或所有瓦片的参与组中的每个相应的一个上，执行计算级，其中相应的瓦片执行相应的一个或多个瓦片上计算，但既不向也不从组中的任何其他瓦片传送计算结果；在所述一个或多个域中的每个相应的一个域内，执行相应的内部屏障同步以要求相应的域中的所有参与瓦片在相应的域中的任何参与瓦片被允许继续到内部交换阶段之前已经完成计算阶段，从而在所述一个或多个域中的单独每一个域内部的所有参与瓦片之间建立共同时间参考；在相应的内部屏障同步之后，在所述一个或多个域中的每个内执行所述内部交换阶段，其中相应的域内的每个参与瓦片通过时间确定性互连向和/或从同一域内的一个或多个其他参与瓦片传送其相应计算的一个或多个结果，但既不向也不从任何其他所述域传送计算结果；执行外部屏障同步以要求所述域的所有参与瓦片在任何参与瓦片被允许继续到外部交换阶段之前已经完成内部交换阶段，从而在跨越域的所有参与瓦片之间建立共同时间参考；和在所述外部屏障同步之后，执行外部交换阶段，其中一个或多个参与瓦片与另一个域通过非时间确定性互连传送一个或多个所述计算结果。2.根据权利要求1所述的方法，其中通过非时间确定性互连的传送被排队，但是瓦片之间通过时间确定性互连的传送不被排队。3.根据权利要求1或2所述的方法，其中在时间确定性互连上，每对发送瓦片和接收瓦片之间的传送通过以下方式执行：从接收瓦片发送消息，和控制接收瓦片在发送瓦片发送之后的预定时间间隔内监听发送瓦片的地址，其中预定时间间隔等于发送瓦片和接收瓦片之间的总预定延迟，时间间隔由具有关于延迟的预定信息的编译器设置。4.根据任何前述权利要求所述的方法，其中：在物理层、传输层或网络层上，非时间确定性互连是有损的，而时间确定性互连是无损的。5.根据任何前述权利要求所述的方法，其中每个域是不同的相应芯片，时间确定性互连是内部芯片上互连，并且非时间确定性互连是芯片之间的外部互连。6.根据权利要求1至4中任一项所述的方法，其中每个域包括多个芯片，时间确定性互连是外部无损芯片间互连，并且非时间确定性互连是外部有损互连。7.根据任何前述权利要求所述的方法，包括执行一系列重复的迭代，每个包括计算级的相应实例，接着是内部屏障同步的相应实例，接着是内部交换阶段的相应实例，接着是外部屏障同步的相应实例，接着是外部交换阶段的相应实例；其中，不允许每个连续的迭代继续进行，直至执行了紧接在前的迭代的外部屏障同步。8.根据任何前述权利要求所述的方法，包括执行一顺序的计算阶段的实例，每个接着是内部交换阶段的相应实例，然后是内部屏障同步的相应实例，其中外部屏障同步接着所述顺序中计算阶段的最后实例。9.根据权利要求7和8所述的方法，其中一个或多个所述迭代中的每一个包括相应顺序的计算阶段的多个实例，每个接着是内部交换阶段的相应实例，然后是内部屏障同步的相应实例，其中相应的外部屏障同步接着相应顺序中计算阶段的最后实例。10.根据任何前述权利要求所述的方法，其中内部屏障同步和外部屏障同步中的每一个通过执行包括操作码和操作数的同步指令来执行，其中操作码将同步指令的模式指定为内部或外部，并且其中操作码在执行时使时间确定性互连中的硬件逻辑在操作数指定内部模式时协调内部屏障同步的性能，并且使非时间确定性互连中的硬件逻辑在操作数指定外部模式时协调外部屏障同步的性能。11.根据任何前述权利要求所述的方法，包括将多个预定义区域之一选择为参与瓦片，每个区域包括所述多个...

【专利技术属性】
技术研发人员：丹尼尔·约翰·佩勒姆·威尔金森，斯蒂芬·菲利克斯，理查德·卢克·索斯维尔·奥斯本，西蒙·克里斯蒂安·诺尔斯，艾伦·格雷汉姆·亚历山大，伊恩·詹姆斯·奎因，
申请(专利权)人：图核有限公司，
类型：发明
国别省市：英国,GB

全部详细技术资料下载我是这个专利的主人