用于脉动阵列计算的错误检查制造技术

技术编号：39053671 阅读：10 留言：0更新日期：2023-10-12 19:47

本公开的方面涉及一种计算单元，所述计算单元实施脉动阵列并且被配置用于在处理脉动阵列上的数据时检测错误。与脉动阵列通信的校验和电路被配置成在所述脉动阵列处理输入数据时计算校验和并且执行错误检测。代替在输入矩阵中预生成校验和，可以通过所述校验和电路将输入矩阵直接馈送到所述脉动阵列中。在输出侧，所述校验和电路可以生成校验和，并且将校验和与由所述脉动阵列生成的输出矩阵中的校验和进行比较。可以在不延迟所述脉动阵列的操作和不预处理所述输入矩阵的情况下对生成所述输出矩阵的操作进行错误检查。述输出矩阵的操作进行错误检查。述输出矩阵的操作进行错误检查。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于脉动阵列计算的错误检查
[0001]相关申请的交叉引用
[0002]本申请是2021年8月24日提交的第17/410,558号美国专利申请的延续，所述美国专利申请要求2021年7月16日提交的标题为“用于脉动阵列计算的错误检查(Error Checking For Systolic Array Computation)”的第63/222,549号美国临时申请的申请日的权益，这些申请的公开内容特此以引用方式并入本文中。

技术介绍

[0003]脉动阵列是处理元件的阵列，所述处理元件诸如处理器、微处理器，或配置成处理一些数据的专用电路。脉动阵列的相邻处理元件可以通过例如印刷电路板上的一个或多个互连，例如导线或其他物理连接进行连接。
[0004]基于算法的容错(ABFT)是指在执行不同类型的算术或逻辑算法——诸如矩阵乘法、傅立叶变换等——期间检测和校正错误的方案或技术。在矩阵乘法的情况下，例如，对于输入矩阵A、B和输出矩阵C，A
×
B＝C，用于矩阵乘法的ABFT包括生成用于A的校验和行和用于矩阵B的校验和列。用于A的校验和行中的每个元素是对矩阵A的相应列中的元素执行的线性运算的结果，例如，将矩阵A的列中的每个元素相加以生成矩阵A的校验和行中的校验和值。类似地，列B中的每个校验和值是对矩阵B的相应行中的元素执行的线性运算的结果。
[0005]在矩阵A和B(与其对应校验和行/列)相乘之后，输出矩阵包括表示矩阵A和B相乘的乘积的子矩阵，以及校验和行与校验和列。作为矩阵乘法的ABFT的一部分，将矩阵C的校...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算单元，包括：处理元件的二维脉动阵列，所述脉动阵列被配置成沿着所述脉动阵列的第一方向从第一输入矩阵接收第一输入元素，并且沿着所述脉动阵列的第二方向从第二输入矩阵接收第二输入元素；第一校验和电路，所述第一校验和电路被配置成当所述脉动阵列接收所述第一输入元素时从所述第一输入元素生成一组或多组第一校验和；第二校验和电路，所述第二校验和电路被配置成当所述脉动阵列接收所述第二输入元素时生成一组或多组第二校验和；所述脉动阵列进一步被配置成从所述第一输入矩阵、所述第二输入矩阵、所述一组或多组第一校验和以及所述一组或多组第二校验和来生成输出矩阵；以及输出校验和电路，所述输出校验和电路被配置成接收所述输出矩阵，并且从所述输出矩阵确定在生成所述输出矩阵时出现一个或多个错误。2.根据权利要求1所述的计算单元，其中，所述输出矩阵包括：数据子矩阵，所述数据子矩阵包括由所述脉动阵列使用所述第一输入元素和所述第二输入元素生成的值；输出校验和行；以及输出校验和列；以及其中，为了确定在生成所述输出矩阵时出现一个或多个错误，所述输出校验和电路被配置成：从所述数据子矩阵的至少一行生成行校验和；将所述行校验和与所述输出校验和列中的校验和相比较；以及从所述行校验和与所述输出校验和列中的所述校验和的所述比较来确定在生成所述输出矩阵时出现错误。3.根据权利要求2所述的计算单元，其中，为了确定在生成所述输出矩阵时出现一个或多个错误，所述输出校验和电路进一步被配置成：从所述数据子矩阵的至少一列生成列校验和；将所述列校验和与所述输出校验和行中的校验和相比较；以及从所述列校验和与所述输出校验和行中的所述校验和的所述比较来确定在生成所述输出矩阵时出现错误。4.根据权利要求3所述的计算单元，其中，为了确定在生成所述输出矩阵时出现一个或多个错误，所述输出校验和电路进一步被配置成：从所述数据子矩阵的至少一行生成行校验和；将所述行校验和与所述输出校验和列中的校验和相比较；以及从所述行校验和与所述输出校验和列中的所述校验和的所述比较来确定在生成所述输出矩阵时出现错误。5.根据权利要求2所述的计算单元，其中，为了将所述行校验和与所述输出校验和列中的所述校验和相比较，所述输出校验和电路进一步被配置成确定所述行校验和与所述输出校验和列中的所述校验和之间的绝对差是否在预定阈值内。6.根据权利要求1所述的计算单元，其中，所述计算单元进一步包括一个或多个校验和处理元件，所述一个或多个校验和处理元件被配置成从所述第一与第二校验和电路中的一个或两个接收校验和。
7.根据权利要求1所述的计算单元，其中，所述第一与第二校验和电路中的一个或两个被配置成基于控制信号将第一或第二校验和发送到所述脉动阵列以进行处理。8.根据权利要求7所述的计算单元，其中，所述第一与第二校验和电路中的所述一个或两个的所述控制信号的定时基于跨所述脉动阵列加载第一或第二输入值的时间步数。9.根据权利要求1所述的计算单元，其中，所述计算单元进一步被配置成响应于确定在生成所述输出矩阵时出现一个或多个错误，向连接到所述计算单元的一个或多个装置发送出现一个或多个错误的指示。10.根据权利要求9所述的计算单元，其中，所述脉动阵列进一步被配置成：在发送出现一个或多个错误的所述指示之后，从所述一个或多个装置接收调整电压，所述调整电压高于所述计算单元的临界电压。11.根据权利要求10所述的计算单元，其中，所述脉动阵列进一步被配置成接收低于所述计算单元的所述临界电压的第一电压，直到响应于发送所述指示而接收到所述调整电压。12.根据权利要求11所述的计算单元，其中，所述第一与第二校验和电路中的一个或两个被配置成接收高于所述临界电压的第二电压。13.根据权利要求10所述的计算单元，其中，所述第一与第二校验和电路中的一个或两个包括2输入2级流水线式加法器电路，所述加法器电路被配置成延迟所述第一与第二校验和中的一个或两个的...

【专利技术属性】
技术研发人员：尹度铉，诺曼，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人