全球首台Arm超算光荣退役!下一代已接任,配备384块英伟达Grace CPU

  新智元报道

  编辑:桃子

  【新智元导读】世界上首个基于 Arm 架构的超算,完成 6 年使命之后,终于要退役了。这台被部署在英国最强超算 Isambard 2,帮助世界推动了模拟分子、天气预报的研究,下一代超算已经接任。

  世界上首台基于 Arm 架构的超算,现如今终于退役了。

  2018 年 5 月,这台拥有 10000 个核心的系统 Isambard 2 首次部署。

  它使用了由 Cavium 开发、台积电制造的 64 位 Armv8 ThunderX2 处理器,外加几个 Nvidia P100 GPU。

  Isambard 2 这一项目,是由来自布里斯托尔大学微电子小组负责人 Simon McIntosh-Smith 教授领导。

  他在社交媒体上,公布了这一消息。

  而且,下一代 Isambard 3 超算,将使用 HPE 提供的基于 NVIDIA Grace ARM 的 CPU 上线接任。

  据称,二代 Isambard 超算将于当地时间 9 月 30 日上午 9 点关闭,因此用户必须在截止日期之前,删除数据。

  6 年使命已完成,超算光荣退役

  Isambard 2 并不是第一台在 2024 年退役的超算。

  橡树岭国家实验室的 Summit 超级计算机,也将于今年 11 月退役。

  这台超算同样在 2018 年建成,随之被功能更强大的 Frontier 超算所取代。

  众所周知,超级计算机的购置成本,高达数百万美金,甚至操作成本也是非常高。

  然而,随着技术的进步,一些科技大厂为了紧追前沿,就不得不淘汰较老的设备,即便是其运作依旧良好。

  这是因为,最新的硅芯片能提供更优性能、效率,进而让研究人员更快取得突破。

  因此,即便重新投入建设新超算,也是物有所值。

  Isambard 3 下一代超算备齐

  全新 Isambard 3 超算仍基于 Arm 架构搭建,但这一次,它将配备 34,272 核的 NVIDIA Grace CPU。

  这一超算,首次两项在 2023 年 5 月。

  Isambard 3 被部署在英国布里斯托尔和巴斯科学园,预计其性能和能效将是 Isambard 2 的 6 倍。

  它将成为欧洲最节能的系统之一,将为医疗和科学研究提供动力。

  据报道,它能够达到 2.7 petaflops(FP64)峰值性能,功耗不到 270KW,跻身世界第三大最环保的非加速超级计算机之列。

  同样,这一项目由布里斯托尔大学牵头(作为 GW4 Alliance 一部分),巴斯大学、卡迪夫大学和埃克塞特大学也参与其中。

  对此,Arm 高级 VP 基础设施总经理 Mohamed Awad 表示,从气候变化到医学,超算已经让学术界和行业领袖能够应对世界一些极大的挑战。

  推动生命科学、医学等领域的突破

  Isambard 3 的打造,将帮助科学界在 AI、生命科学、医学、天体物理、生物技术方面取得突破。

  它就可以训出结构异常复杂的模型,比如风力发电场、聚变反应堆,进而帮助研究人员揭示清洁和绿色能源新进展。

  与此同时,Isambard 3 还将继续前一代模拟分子水平机制的工作,以便更好地了解帕金森氏症。

  而且,也是为了找到治疗骨质疏松症和新冠肺炎的新方法。

  这些密集型应用,在 Grace CPU 加持下,将能发挥出最大的极致性能。

  布里斯托尔大学高性能计算教授 Simon McIntosh-Smith 称:

Isambard 3 应用程序性能效率是其前身 6 倍,可与许多速度最快的 50 个 TOP500 系统相媲美,将为科学家们提供一个革命性的全新超级计算平台,以推进突破性研究。

  不过目前,Isambard 3 超算没有进入 Top500 最强超级计算机排行榜,但在 24 年 6 月的 Green500 排行榜上获得了第二名,成为当今最高效超算。

  此外,Isambard 3 超算将增加 5280 个处理器,使其性能提高 32 倍,并在可能在下一次运行中跻身 Top500 榜单的前 10 名。

  世界 TOP 500 超算,Frontier 第一

  每年,世界 TOP 500 超算榜单,都会公布今年超算的最新名单。

  第 63 届 TOP500 排行榜显示,尽管 Frontier 不再是榜单中唯一以百亿亿次浮点运算计算的系统,但依旧夺得榜首。

  而另外一个值得注意的点是,一个全新超算冲进了前 10 名。

  Frontier 被部署在美国田纳西州橡树岭国家实验室,依旧是视觉上最强大系统,其 HPL 得分为 1.206 百亿亿次浮点运算/秒。

  该系统总共有8,699,904 个 CPU 和 GPU 核心,采用 HPE Cray EX 架构。

  而且,它采用了针对高性能计算(HPC)和 AI 优化的第三代 AMD EPYC CPU 和 AMD Instinct MI250X 加速器,并依靠 Cray 的 Slingshot 11 网络进行数据传输。

  此外,这台机器的能效比达到了 52.93 十亿次浮点运算/瓦特,使 Frontier 在 GREEN500 排行榜上位列第 13 位。

  与上一份榜单一样,位于美国伊利诺伊州阿贡国家实验室的 Aurora 系统在 TOP500 中排名第二。

  尽管目前正在调试且尚未完全完成,Aurora 现在成为第二台正式突破百亿亿次级障碍的系统,HPL 得分为 1.012 百亿亿次浮点运算/秒。

  这一结果,相比上一份榜单的 585.34 千万亿次浮点运算/秒有所提升。

  此外,前十名榜单中,还有三台美国超算——Eagle、Summit、Eos NVIDIA DGX SuperPOD。

  正如开篇所述,Summit 超算将于今年退役。

  还有日本著名的超算富岳(Supercomputer Fugaku),从 2020 年 6 月-2021 年 11 月,一直占据榜首位置。

  它部署在日本神户,HPL 得分为 442 千万亿次浮点运算/秒,它仍是美国以外排名最高的系统。

  值得一提的是,唯一跻身前十名的新系统,来自瑞士国家超级计算中心(CSCS)的 Alps 计算机,位列第六。该系统的 HPL 得分为 270PFlop/S。

  参考资料:

  https://www.tomshardware.com/tech-industry/supercomputers/isambard-2-the-worlds-first-arm-based-supercomputer-retires-after-six-years-of-service-isambard-3-will-tap-nvidias-grace-cpu-superchips

  https://www.top500.org/