日本夺回超算TOP500榜首,我的朋友、中国科学院计算技术研究所研究员包云岗博士有如下解读:
研制计算机主要有三个难点:
(1)单节点的运算能力。日本的Fugaku定制了一颗基于ARM v8指令集的SoC处理器A64fx。我看了这颗处理器一些公开的参数,不管是集成度、运算性能还是访存带宽,都是相当强悍。
比如A64fx直接把互连网络(计算机另一个难点,下面会介绍)的接口Tofu-D集成到芯片中了。所以可以直接数据直接从芯片就可以送到互连网络中,而不像传统那样需要先到PCIe总线,然后再转到互连网络上。
当然处理器的运算能力也是出色,支持2个512位的向量运算单元,这对提升芯片性能帮助大。而且还支持不同精度的定点和浮点运算,这确实和GPU很像了。
访存能力也是强,集成了4个HBM2。作为对比,Google的TPUv2也只有集成2个HBM,去年发布的TPU v3也是集成了4个HBM2。
综合来看,A64fx处理器是一颗全能型选手,既可以做高性能计算,也可以做AI计算,而且都还不错。这个设计还是很牛的。
(2)互连网络。高性能计算机的互连网络也是核心的部件,中美的计算机一般都是采用商用的InfiniBand,但日本的互连网络设计是他们的强项。这次也是沿用了Tofu-D互连网络,将15万个节点(730万个处理器核)连接,而且直接芯片中直接集成了Tofu-D接口,这进一步提升了互连网络的率。
(3)功耗散热控制。Fugaku的功耗是28MW,也没有看到相关资料介绍它在这方面有特别设计。之前中国的神威太湖之光在散热方面采用的液冷技术,是在计算机领域中的一个突破。
结论:日本的Fugaku大亮点还是那颗A64fx处理器,互连网络发挥稳定,功耗散热控制中规中矩。
以上是根据目前我了解的一些信息所得出的结论,后续如果更多信息再更新。