CPU,悄悄回到了AI算力的舞台中央

2026/06/04 02:04
🌐zh-Hans

不是 CPU 比 GPU 更快了,而是 AI 的「工作负载」变了。

CPU,悄悄回到了AI算力的舞台中央
原文标题:《CPU,悄悄回到了 AI 算力的舞台中央》
原文作者:徐珊,极客公园

过去三年,AI 算力的故事几乎围绕 GPU 展开。

从英伟达的 H100、H200,到 GB200、GB300,再到云厂商们抢着扩建的十万卡集群——所有的产业叙事都在讲一件事:算力的瓶颈在 GPU。CPU 在这个故事里,长期被默认是一个不那么重要的「配套」角色,它跟在 GPU 后面,负责一些 GPU 不愿意做的活儿。

但 2026 年开始,这个叙事出现了一些裂缝。

6 月 1 日,英特尔在北京推出了至强 6+ 处理器,专为云原生、智能体 AI 与网络密集型工作负载打造。这是 Intel 18A 制程的首款数据中心 CPU。

在英特尔自己的描述里,至强 6+ 承担的不是 GPU 的「配套」,而是 AI 基础设施的「控制平面」,负责编排、并发、数据流动。

「AI 的扩展之道,不在于各部件的叠加,而在于系统的协同运作。」英特尔公司执行副总裁兼数据中心事业部总经理 Kevork Kechichian 在沟通会上说,「随着 AI 走向智能体时代,编排、并发与数据流动成为了新的限制因素。

这再次强化了一个核心事实:CPU 依然是现代 AI 基础设施的控制平面。」

这不只是英特尔一家的判断。今年 2 月,独立半导体研究机构 SemiAnalysis 发布了一份名为「CPU 回归」的 2026 年数据中心 CPU 版图报告,给出的判断同样直接。在 AI 训练与推理大规模铺开的当下,CPU 正在以一种与过去三年截然不同的方式被重新需要

只是这个「回归」,需要打开来看,它不是 CPU 重新当主角,而是 CPU 在一个新的位置上被重新定义。

一、GPU 中心论的裂缝

要理解 CPU 为什么「回来」,得先回到 AI 工作负载本身正在发生的变化。

过去两年,AI 算力的主流叙事是训练,大模型训练规模每年涨四到十倍,训练需要的是海量的并行计算,这件事 GPU 是绝对的主角。但训练并不是 AI 工作负载的全部。

按英特尔在沟通会上的判断,整个 AI 算力的工作负载大致可以分成三类:

第一类是基础工作负载。存储、数据库、Web、微服务、CDN,这些不是 AI,但是 AI 跑起来需要的底层服务。这部分仍然是传统 CPU 的主战场。

第二类是训练。前沿大模型的训练,几乎完全依赖 GPU 和专用加速器。这是过去三年所有人争抢的部分。

第三类是推理与智能体。这个部分正在快速增长,且与训练有显著不同

第三类的关键差别在于工作负载本身的形态。训练是把模型从无到有「算出来」的过程,并行度极高,对单点峰值算力的需求极高。但推理和智能体不是——它要把已经训好的模型,部署到真实业务里去跑

这意味着大量的事情不是「算」,而是编排:调度多个模型协作、管理上下文、协调不同 agent 之间的数据流、处理用户的并发请求、保证延迟可预测。

这些事情,GPU 并不擅长。

「在该场景下,我们能看到结合了 GPU 级的加速,但主体仍是以传统 CPU 为核心的工作负载。」Kevork Kechichian 在沟通会上说。

这件事背后还有一个更具体的产业事实。SemiAnalysis 在「CPU 回归」报告里举过一个例子:微软为 OpenAI 建设的「Fairwater」数据中心里,一栋 48 兆瓦的 CPU 与存储大楼,支撑着一个 295 兆瓦的 GPU 集群

也就是说,为了让那个 295 兆瓦的 GPU 集群真正跑起来,需要成千上万颗 CPU 在旁边处理 GPU 产生的 PB 级数据流、调度任务、管理存储。

GPU 的算力被推得越高,它产生的「周边算力需求」越大。而这些周边算力的需求,最终落在 CPU 上。

也就是说,CPU 的回归不是「CPU 重新比 GPU 更快」。而是当 AI 算力的形态从「训练一个大模型」扩展到「运行成千上万个智能体」时,编排和数据流动这件事,重新成为了瓶颈。GPU 解决不了这件事,CPU 解决得了。

这是过去三年的 AI 叙事里,被忽视的另一面。

二、至强 6+ 押的是一条什么路

英特尔押的判断,反映在至强 6+ 的产品定义上。

最直观的一个数字是,最多 288 个核心,且全部是能效核(E-core)。

E-core 和 P-core 是英特尔过去几年在 CPU 架构上做的分叉。P-core 是性能核,追求单核性能极致,传统服务器 CPU 的设计目标。E-core 是能效核,单核性能弱一些,但面积小、功耗低,可以在同样的芯片面积里塞更多的核。

至强 6+ 把这个分叉推到了极致。288 个能效核,这意味着英特尔在一颗 CPU 上押的不是「每个核多快」,而是「一颗 CPU 上能塞多少个核」。

这个产品定义的逻辑是:智能体 AI 的工作负载不是单核能跑多快的问题,是能不能同时跑成千上万个轻量任务的问题。当一台服务器需要同时编排几百个 agent、处理几千个推理请求、维持上万个并发连接时,288 个 E-core 的吞吐能力远比 64 个 P-core 的单核性能更重要。

这是一个反主流的产品定义。过去几十年,服务器 CPU 的主流叙事都在拼单核性能,主频更高、IPC 更强、缓存更大。E-core 路线本质上承认:那个叙事可能要结束了。

但有几件事必须放进来一起看。

第一,E-core 路线不是英特尔独有。AMD 在 2023 年就推出了 Bergamo,基于密度优化的 Zen 4c 核心,AWS 的 Graviton 系列、Ampere 的 AmpereOne 系列也早就走的是「高密度核心 + 能效优先」的路线。Ampere 在 2024 年公布的 AmpereOne Aurora 路线图里,核心数已经做到了 512 个。

也就是说,至强 6+ 是英特尔在追赶一个已经存在的产业方向——英特尔不是引领者,是回到产业方向的玩家

第二,至强 6+ 是 Intel 18A 制程的首款数据中心 CPU,这件事在英特尔自己的语境里,可能比「288 核 E-core」还要重要。

Intel 18A 是英特尔过去几年最大的赌注。它承担的不只是一颗 CPU 的事,而是 Intel Foundry,英特尔代工业务,能不能站住的事。如果 18A 制程不能给市场一个能打的产品,Intel Foundry 的故事就讲不下去。

至强 6+ 用 18A 制程做出来、能效核数推到 288 个、对外宣布「性能密度业界领先」,这是英特尔交给市场的答卷之一。它能不能被市场认可、能不能在与台积电 N2、三星 2nm 的同代竞争里站住,是另一个问题。

第三,至强 6+ 的客户名单里出现了几个有产业意义的名字——爱立信用至强 6+ 在测试 5G 核心网,德意志电信旗下的 T-Systems 用至强 6+ 搭私有智能体 AI 基础设施。这两个客户都是数据中心 CPU 的传统稳健采购方,他们的采购选择本身就是一个市场信号

把这三件事合在一起看,至强 6+ 押的是这样一条路:用 18A 制程拿到能效优势,用 288 个 E-core 拿到核心密度,押 AI 推理和智能体场景里「高密度、高能效、高吞吐」这一类工作负载。

这不是 CPU 重回算力主舞台的故事,而是 CPU 找到一个新位置的故事。

三、这件事到底成不成立

英特尔讲的这个「CPU 回归」的故事,到底成不成立?需要看产业里其他几个变量。

第一个变量是 GPU 厂商的反应。

英伟达在过去两年也在做和「编排」相关的事,Grace CPU + Hopper GPU 的组合,本身就是英伟达在补 CPU 这一环。如果 GPU 厂商自己把「CPU + GPU」的整体方案做成主流,那 CPU 厂商作为独立角色的位置会被压缩。这是英特尔讲「CPU 是控制平面」这个叙事最大的对手,不是 AMD,是英伟达自己

第二个变量是云厂商的自研 CPU。

AWS Graviton 已经在 AWS 自己的数据中心里规模化部署,承担了 AWS 内部相当一部分通用计算工作负载。微软在做 Cobalt,谷歌在做 Axion,阿里在做倚天,几乎所有主要的云厂商都在自研 ARM 架构的服务器 CPU

这些自研 CPU 走的也是「高密度、能效优先」的路线——和至强 6+ 在产品定义上是直接竞争关系。

也就是说,至强 6+ 想拿下的那块市场,云厂商们正在自己做。英特尔需要证明:在云厂商自研 CPU 之外,仍然有足够大的市场。比如电信运营商、私有云、垂直行业的数据中心。

第三个变量是 18A 制程本身。

至强 6+ 是 Intel 18A 的首款数据中心 CPU,这本身意味着这颗芯片承担了远超产品本身的产业意义。如果 18A 制程在量产良率、性能稳定性、客户验证上出现问题,至强 6+ 的市场表现就会被拖累。反过来,如果 18A 表现稳定,至强 6+ 反而可能给 Intel Foundry 带来一些喘息空间。

但 18A 不是真空里跑——台积电的 N2 制程 2026 年下半年开始量产,三星 2nm 也在路上。Intel 18A 想拿到的不只是「做出来」,是「做出来之后还能领先」,这是一个更高的标准。

把这三个变量合在一起,至强 6+ 的最终成色,不只取决于它自己,它取决于英伟达会不会把 CPU 角色自己吃掉、云厂商会不会继续自研 CPU、Intel 18A 会不会在和台积电、三星的同代竞争里站住。

这是为什么「CPU 回归」这件事,从产业级的判断上看是成立的,从英特尔自己能不能拿到这波回归红利的角度看,仍然是未知数

CPU 在 AI 算力舞台上的位置之争,已经持续了三年。

过去三年的剧本是「GPU 是中心,CPU 是配套」。这个剧本到 2026 年开始松动——不是 CPU 重新比 GPU 更快,而是 AI 算力本身在变。当 AI 从「训练一个模型」扩展到「运行成千上万个智能体」,编排、并发、数据流动这些事重新成为系统瓶颈,CPU 在这个位置上变得不可替代。

英特尔押了这件事,至强 6+ 是它交出的答卷。但这件事会不会成立、英特尔自己能不能拿到这波红利,最终要在 2027、2028 年的客户机房里给出答案。AMD、ARM 阵营、云厂商自研 CPU、英伟达自己做 CPU,每一个变量都可能改变剧本的走向。

CPU 的回归是真的,但谁来主导这场回归,还没定。

原文链接
QQlink

암호화 백도어 없음, 타협 없음. 블록체인 기술 기반의 탈중앙화 소셜 및 금융 플랫폼으로, 사용자에게 프라이버시와 자유를 돌려줍니다.

© 2024 QQlink R&D 팀. 모든 권리 보유.