一种超级计算机性能波动判定方法技术

技术编号：36909569 阅读：19 留言：0更新日期：2023-03-18 09:28

本发明专利技术涉及一种超级计算机性能波动判定方法，包括：获取计时指令开销，所述计时指令开销为计时指令自身耗时开销；获取被测时间，所述被测时间为执行被测程序所测得的时间，包括物理周期间隔、墙钟时间间隔；通过所述被测时间与所述计时指令开销，获取实际时钟消耗，所述实际时钟开销包括实际物理周期间隔、实际墙钟时间间隔；获取最短测试间隔；输出性能波动判定条件，其中，通过威尔克森秩和检验方法进行显著性差异检验，并以被接受的差异为参数，输出所述性能波动判定条件；可以在超级计算机中，判断计数器的读数波动是否为性能波动。判断计数器的读数波动是否为性能波动。判断计数器的读数波动是否为性能波动。

全部详细技术资料下载

【技术实现步骤摘要】
一种超级计算机性能波动判定方法

[0001]本专利技术涉及性能检测领域，具体地说，是一种超级计算机性能波动判定方法。

技术介绍

[0002]超级计算机的性能波动是在重复运行固定的计算过程时忽快忽慢。有许多因素可以引发性能波动，这些因素广泛地存在于计算机系统的各个层次中，包括硬件的缺陷、CPU频率的变化、操作系统噪音以及网络的不稳定等。正因如此，性能波动十分难以发现和定位。
[0003]性能波动会严重影响超级计算机的整体性能。有研究者发现在超级计算机上运行HPL测试时，由于英特尔CPU缓存一致性组件的缺陷引起的性能波动使得HPL的性能比预期下降了28％。因此，准确定位引发性能波动的原因对于提升大规模并行应用在计算集群上的性能是十分有必要的。
[0004]对性能波动的现象进行判定，是高精度性能波动检测的关键技术。具体来说，在超级计算机中，检测性能波动时需要插入计时指令，然而，计时指令的频率越高，性能波动检测就越容易受到计时指令自身的干扰。这种干扰主要体现在两个方面：1)在插入计时指令后，被测程序的指令执行特征发生变化；2)计时指令受到被测程序指令的影响，其自身的执行时间出现波动。当前，为了应对计时过程中存在的干扰，人们普遍采取增加被测程序循环次数的方法，来降低计时指令的频率。但是，这种方法降低了性能波动测试的精度，使得微小的性能波动难以被发现。因此，亟需一种能在高精度检测中判断检测结果的异常是否为性能波动算法。
[0005]基于以上背景，本专利技术提供了基于威尔克森秩和检验的超级计算机性能波动判定...

【技术保护点】

【技术特征摘要】
1.一种超级计算机性能波动判定方法，其特征在于，包括：获取计时指令开销，所述计时指令开销为计时指令自身耗时开销；获取被测时间，所述被测时间为执行被测程序所测得的时间，包括物理周期间隔、墙钟时间间隔；通过所述被测时间与所述计时指令开销，获取实际时钟消耗，所述实际时钟开销包括实际物理周期间隔、实际墙钟时间间隔；获取最短测试间隔；输出性能波动判定条件，其中，通过威尔克森秩和检验方法进行显著性差异检验，并以被接受的差异为参数，输出所述性能波动判定条件。2.根据权利要求1所述的超级计算机性能波动判定方法，其特征在于，所述计时指令开销为纳秒级开销，包括墙钟时钟开销L
ts
、物理时钟开销L
cy
；其中：3.根据权利要求1所述的超级计算机性能波动判定方法，其特征在于，获取被测时间，所述被测时间包括物理周期间隔、墙钟时间间隔，其中，所述被测时间为执行一轮被测程序所需时间：cy
n,r,1
、cy
n,r,2
分别代表物理周期计数第一次计时与第二次计时；ts
n,r,1
、ts
n,r,2
分别代表墙钟时间计数第一次计时与第二次计时；lcy
n,r
为物理周期间隔，lts
r,n
为墙钟时间间隔，r表示计时测试已进行的轮数，n为每轮测试循环次数的计数器。4.根据权利要求1所述的超级计算机性能波动判定方法，其特征在于，实际时钟消耗的计算为：5.根据权利要求1所述的超级计算机性能波动判定方法，其特征在于，获取所述最短测试间隔，计算：将U
r,n
和T
r,n
分别从小到大排序，各自按需取上下分位数值U
r,n,up
、U
r,n,dn
、T
r,n,up
、T
r,n,dn
；为U
0,r
和T
0,r<...

【专利技术属性】
技术研发人员：廖秋承，林新华，左思成，高亦沁，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人