Tachyum 投标建造 20 台 Exaflops 超级计算机

Tachyum 周二表示,它已向能源部提交了一份在 2025 年建造 20 exaflops 超级计算机的投标。该机器将基于该公司的下一代 Prodigy 处理器,具有可用于不同类型工作负载的专有微架构.

能源部希望在 2025 年之前交付 20 exaflops 的超级计算机,其功耗为 20MW-60MW。该系统将安装在橡树岭国家实验室 (ORNL),并将补充该实验室今年早些时候上线的 Frontier 系统。

Tachyum 没有透露它向 DoE 提出了哪些硬件,只是说它拥有128 核 Prodigy 处理器今天以及其路线图中性能更高的 Prodigy 2 处理器,因此可以肯定地说,到 2025 年它将拥有后者,并且能够应对即将推出的系统。

Tachyum 的 Prodigy是一款通用同质处理器,最多可容纳 128 个专有的 64 位 VLIW 内核,每个内核具有两个 1024 位矢量单元和每个内核一个 4096 位矩阵单元。Tachyum 期待其旗舰Prodigy T16128-AIX 处理器(在新标签中打开)为 HPC 提供多达 90 个 FP64 teraflops 以及为 AI 推理和训练提供多达 12 个“AI petaflops”(大概在运行 INT8 或 FP8 工作负载时)。Prodigy 功耗高达 950W,并使用液体冷却。

这一切都发生在 Tachyum 起诉其知识产权提供商 Cadence 之前,原因是其 Prodigy 处理器的性能低于预期。我们不知道当前对该芯片的性能预期是什么。

从理论上讲,Tachyum 可以使用超过 11,000 个 Prodigy 处理器为 exaflops 系统提供动力,尽管这种机器的功耗将是巨大的。据推测,Prodigy 2 比最初的 Prodigy 更有机会满足下一代百亿亿级系统的需求。

目前有一台 exaflops 级超级计算机,橡树岭国家实验室 (ORNL) 的 1.1 exaflops Frontier 系统基于 AMD 的 64 核 EPYC CPU 以及 Instinct MI250X 计算 GPU。正在建造另外两个 exaflops 系统,2 exaflops Aurora 机器由 Intel 的第 4 代 Xeon 可扩展处理器和 Xe-HPC 计算 GPU(又名Ponte Vecchio)以及“>2 exaflops” El Capitan 超级计算机基于AMD 的 Zen 4 架构 EPYC CPU 和 Instinct MI300 GPU。

能源部超级计算计划的一个有趣之处在于,从现在开始,它希望每 12-24 个月而不是每 4-5 年升级一次高性能计算能力。因此,能源部将比现在更渴望采用像 Tachyum's Prodigy 这样的奇特架构。

“我们还希望探索一种方法的开发,从单一收购转向一种模型,以实现更快速的部署系统升级周期,以实现更快的硬件和软件创新,”能源部的一份文件读。“一种可能的策略包括增加对现有基础设施的重用,以便升级是模块化的。目标是重新构想系统架构和有效的采购流程,允许不断向设施注入技术进步(例如,每 12-24 个月而不是“而不是每 4-5 年一次)。了解这些方法的权衡是本 RFI 的一个目标,我们邀请响应包括这种模块化升级方法的感知好处和/或缺点。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢