现在,大多数计算都在 GPU 上完成。AMD 正努力在 x86 市场超越英特尔,而基于 Arm 的 CPU 则在 NVIDIA 和超大规模厂商的推动下快速增长。
AMD 正在迅速抢占英特尔在 x86 数据中心处理器领域的份额。
3. 其团队的出色执行力;
4. 英特尔失去半导体制程技术主导地位。
就单位数量而言,2024 年第三季度,AMD 和英特尔的服务器 CPU 总出货量为 550 万台。这意味着年均出货量约为 2200 万台。排名前四的超大规模厂商约占其中的一半,即每家每年约 250 万台。(注:不同 CPU 的平均售价可能差异很大。例如,AMD 服务器 CPU 的售价几乎是英特尔的两倍。美元收入是更好的指标,但为了与 Arm 进行比较,我们只有单位数量信息。)
大约一半的数据中心 CPU/GPU 购买是由顶级超大规模企业进行的。
Arm 的 Mohamed 表示,超大规模计算厂商构建自己的 CPU 的主要动机是为了针对特定工作负载进行优化,从而获得更好的功耗/性能。削减英特尔/AMD 的利润率是一个考虑因素,但仅凭这一点可能不足以证明这种转变的合理性。
当然,超大规模企业运行的大部分工作负载是其客户的软件,这些软件目前主要针对 x86 进行了优化。Arm 处理器将首先用于超大规模企业控制的工作负载——搜索、照片、购物、Facebook、法学硕士 (LLM) 等。但看看超大规模企业的网站,他们正在大力推广他们的 Arm 处理器,所以这种情况将会改变。
亚马逊是数据中心中首款采用Arm架构的CPU。Graviton自2018年起已进入第四代。截至2024年中期,亚马逊已生产了超过200万颗Graviton。假设2024年生产了50万颗Graviton,这将约占x86 CPU总采购量的20%。Graviton在其云中用作独立计算实例,并与GPU配合使用。亚马逊首席执行官安迪·贾西(Andy Jassy)于6月30日在CNBC上表示,Graviton的性价比比x86高出30%至40%,而且功耗更低。
谷歌于 2024 年 4 月发布了 Axion 处理器。谷歌云网站声称“Axion 提供业界领先的性能和能源效率”,具体来说“与同类当前一代基于 x86 的实例相比,性能提高了 50%,能源效率提高了 60%”。
微软于 2023 年发布了 Azure Cobalt CPU(以及 Azure Maia AI 加速器)。微软声称与 x86 相比,其性能可节省约 30%。
节省成本固然重要,但电力最终将成为最重要的因素。在为 Frontier LLM 模型构建日益庞大的 AI 数据中心时,电力是最大的挑战。
所有这些 Arm-CPU 都可供云端客户使用,如果性价比优于 x86,那么随着时间的推移,客户会将他们的工作负载从 x86 转移到 Arm。
今年早些时候,Meta和 Arm 宣布他们正在研发 Arm 数据中心 CPU。
摩根大通预计 2025 年 Blackwell GPU 的出货量为 500 万个(2026 年为 750 万个 Blackwell/Rubin 单元)。两个 Blackwell GPU 由 1 个 Grace CPU 控制,这意味着 2025 年 Grace CPU 的出货量将达到 ~250 万个。一位数据中心基础设施行业的专家表示,对于 AI 工作负载,x86 服务器仅用于运行控制平面操作,因此每 100,000 个 GPU 将需要 5 到 10 个 x86 CPU 机架。一个 CPU 机架可容纳 42 个 1U 服务器,每个 1U 服务器可以配备 1 或 2 个 x86。计算一下,这意味着每 100,000 个 GPU 需要 210 到 840 个 x86 CPU,而每 100,000 个 GPU 有 50,000 个 Grace CPU。因此,对于 AI 工作负载,Grace CPU 的数量是 x86 的 50 倍到 100 倍。
此前,我们看到 x86 数据中心的出货量约为 2200 万台。考虑到超大规模厂商生产的 250 万台 Grace CPU 和大约 100 万台基于 Arm 的 CPU,Arm 2025 年的市场份额约为 15%,而不是 Arm 预测的近 50%。
数据中心中其余未直接连接到 GPU 的 CPU 有一半被交付给超大规模计算厂商——这些厂商都采用 Arm CPU。这些厂商的性价比更高,很可能会以更低的价格将客户转移到 Arm。
麦肯锡今年 4 月发布了对 2030 年数据中心增长的预测。
如果 2025 年非 AI 工作负载由约 500 万个 GPU 完成,那么到 2030 年,这一需求将扩展到约 1800 万个 GPU,届时将需要约 900 万个 Arm CPU。(根据 GPU 的计算方式,实际 Arm CPU 数量可能会更少)。
因此,到 2030 年,数据中心 CPU 总数将达到约 4800 万个,其中 Arm 的份额将高达 1900 万个。这些数字虽然粗略,但足以表明,未来十年内,Arm 必将挑战数据中心 CPU 的主导地位。推动这一趋势的两个主要因素是:1)超大规模企业将云端工作负载从 x86 转移到 Arm;2)基于 Nvidia 的 AI 数据中心使用的 Arm CPU 数量将是 x86 的 50 到 100 倍。
美元份额更重要,但我们没有Arm的平均售价数据。x86的美元份额很可能会高于其出货量份额,但趋势仍在朝着Arm份额随着时间的推移稳步增长的方向发展。AMD从Nvidia手中夺取AI领域的大量份额将减缓Arm的份额增长,因为AMD很可能会使用x86而不是Arm进行GPU协同处理。