这一周,台北国际电脑展COMPUTEX可谓精彩。
前一天,黄仁勋站在GTC大会的舞台上,出人意料的接连发布Vare CPU、RTX Spark,宣布“这是40年来,PC产品线首次全面重新设计。”台下坐着微软、戴尔、惠普、联想、华硕的全球高管,他们将在今年秋季推出搭载英伟达RTX Spark芯片的笔记本电脑。
后一天,英特尔反手杀入英伟达的腹地,发布:数据中心CPU至强6+,288核,18A制程;Crescent Island数据中心GPU,160GB显存,风冷部署。
作为全球GPU霸主,英伟达杀入了英特尔的主场:CPU和PC;而英特尔这个CPU老牌王者,也盯上了英伟达的AI算力地盘。
AMD倒是乐得坐山观虎斗。AMD客户端业务高级副总裁拉胡尔·蒂库(Rahul Tikoo)表示欢迎竞争。不过,之前AMD一直宣称自己是全球唯一一家同时具备高性能CPU和高性能GPU研发能力的半导体公司。现在好了,全球唯三。
这一周的数据中心,算是彻底乱起来了。如果只是把这场交锋解读为产品矩阵的完善或技术路线的竞争,那就太浅了。更关键的核心是:为什么两大巨头,双向奔赴彼此的主场?
01
复仇者联盟,归来
历史上,英伟达试图做过PC处理器。
2011年,英伟达在CES上宣布Project Denver,这是老黄首次公开涉足PC处理器领域。2012年,微软推出Surface RT,搭载英伟达Tegra 3芯片。2013年Surface 2沿用Tegra 4。这两款设备是英伟达ARM SOC首次进入Windows PC的尝试。但因为Windows RT生态不成熟、应用兼容性差,英伟达最终铩羽而归。
这次推出RTX Spark是在一个很特殊的历史节点上。
三个理由。
第一,GPU市场的到顶了。现在英伟达在GPU市场的占有率超过80%,在AI训练芯片市场超过90%,数字是非常强势,但天花板肉眼可见,英伟达在这个赛道上已经没有太多增长空间。欲登更高山,必须先下山。
第二,AI PC是全新的入口。传统PC的逻辑是:CPU是核心,GPU是配角。所有软件为x86设计,所有计算经过CPU调度。英特尔是这个生态的定义者,英伟达最多是个“增强显卡”的供应商。但是AI PC不一样,现在AI PC成为了AI本地运行载体,这时候GPU的并行计算能力变的关键。英伟达既掌握着CUDA生态,又掌握着全球最强的GPU技术,还掌握着AI开发者最熟悉的工具链。在AI PC这个新赛道上,英伟达有天然的起点优势,他不需要从头建立生态,只需要把现有的AI能力封装成PC可以使用的形态。
第三,苹果的前车之鉴。苹果用M系列芯片证明了:当你同时掌握硬件和软件的定义权,你就能打造出竞争对手无法复制的体验。英伟达做的同样是这个模式,桌面、笔记本、工作站三件套,全部100% Windows兼容、100% CUDA、100% Tensor Core。按照英伟达的说法,微软会为此修改 Windows 任务栏用户界面。上百家软件供应商和游戏开发商同意开发Arm移植版。Adobe 正在“从底层重构”Photoshop和Premiere来适配RTX Spark。
这一次,黄仁勋显然是有备而来,组合了一个“复仇者联盟”:微软、联发科、ARM。联发科,长期主导入门级消费芯片市场,高端始终难以突破,PC芯片领域一直徘徊在中低端梯队。Arm,在移动端称王,但是PC市场被X86垄断,高通也和微软带头做Windows on Arm,但Windows用户对Arm PC一直有顾虑。微软,Copilot+ PC已经把AI电脑的概念打了出来,但目前很多AI PC体验仍然偏轻,云端Copilot到本地Copilot之间缺一座桥。
英伟达的加入,刚好补上了这块短板。AI性能高达1 PetaFLOP,128GB统一内存,可本地运行120亿参数、上下文长度达100万token的大语言模型。
1 PetaFLOP是什么概念?英伟达2020年卖的数据中心GPU A100的FP16峰值是312 TFLOPS。一颗笔记本芯片,四年后翻了不止三倍。这对微软来说是Windows AI PC体验质变的机会,对ARM是打穿x86垄断的机会,对联发科是切入高端PC市场的机会。四方的利益,在AI PC上形成了交集。但很微妙的是,在数据中心市场,英伟达最大的客户是:Azure、AWS、Google Cloud。英伟达是“卖铲人”,把产品卖给所有人。RTX Spark的核心卖点是本地AI算力,1 PetaFLOP的AI推理能力,本地跑模型、本地跑Agent。如果本地算力足够强,用户为什么还要上云?为什么还要Azure?黄仁勋在帮微软站台的同时,其实也在松动微软云业务的地基。这就是今天科技行业悖论的地方,所有人都是合作伙伴,所有人也都是潜在对手。
再来看英伟达的Vare CPU。英伟达为什么要花费巨大资源自研数据中心CPU?黄仁勋在发布Vera CPU时说了一句话,被业界反复引用:“CPU不再仅仅是支持模型运行;它正在驱动模型。”这句话背后,是英伟达对AI时代计算架构的重新理解。
英伟达做Vera CPU,不是为了抢英特尔传统CPU的市场,而是不能让CPU成为自己GPU的绊脚石。在智能体AI工作负载中,CPU需要频繁调度GPU资源、处理超长上下文、管理海量的工具调用。这些任务的延迟要求是纳秒级的,如果CPU响应慢,整个系统的吞吐量都会下降。现在的瓶颈在于:任务编排、工具调用、超长上下文管理、海量状态维护,这些全都压在CPU上,PU集群价值数百亿美元,但如果CPU跟不上调度节奏,这些GPU会因为等待任务分配而大量闲置。
算力越强,浪费越多。所以,Vera CPU定位很清晰:不是x86的替代品,而是“为Agent制造的CPU”。我们来看Vare CPU的设计重点:第一,极致带宽,1.2TB/s内存带宽,比高端x86 CPU高出2-3倍;第二,超低延迟,通过NVLink与GPU直接互联,避免PCIe瓶颈;第三,高能效,LPDDR5X内存,功耗比传统DDR5低50%。
英伟达不会让自己的算力帝国被一颗CPU卡住。老黄的意思很明显:未来的数据中心建立在“英伟达inside”的基础上,而不是“x86 inside”的基础上。Vera CPU目前已进入全面量产阶段,预计今年第三季度正式投产。OpenAI、Anthropic、SpaceX已确认成为首批部署客户。英伟达预计,本财年CPU营收将达到200亿美元,这意味着英伟达将在CPU市场与AMD、英特尔形成正面竞争。
02
数据中心,才是主战场
陈立武接英特尔CEO的时候,这家公司正陷在泥潭里。制程工艺被台积电甩开,股价低迷,核心员工流失。他需要做的事情很多,但他必须先回答一个问题:英特尔的核心价值到底是什么?陈立武在COMPUTEX上说了一个核心的观点:CPU(尤其是x86架构CPU)是整个算力体系的基石。英特尔将在四个核心领域创造万亿美元的价值,分别是,个人电脑、边缘市场和代理式AI、数据中心、新兴的智能中心。
这次,英特尔亮相的数据中心CPU和GPU,打的是是英伟达的腹地——数据中心。
首先来看英特尔的至强6+。CPU本来就是英特尔的主场,几十年的x86生态、数十年的客户关系、无数企业级软件为至强优化,这是AMD和英伟达都难以复制的优势。
至强6+采用288核,18A制程,超大规模并行设计。配备最高576MB三级缓存,面向云原生、AgenticAI和网络密集型等负载需求,可以提供更高的能效和更稳定的持续性能。单个液冷机架占用32U计算空间,就能提供36864个核心;机架功耗仅约100kW,足以承载高密度智能体部署。与过往同等性能的服务器机架相比,功耗已经大幅降低。据新华三相关工作人员介绍,新华三与英特尔合作,推出了UniServer R6900 G7 AI训推一体化方案,由于至强6+的多核优势,方案采用纯CPU部署35B参数大语言模型,能够实现价格仅为常规GPU方案的一半。在至强6+之后,英特尔又亮出了Crescent Island。具体来看,Crescent Island基于Xe3P微架构,属于Xe系列高性能方向,采用LPDDR5X显存(不是HBM),最高达到480GB,同时350W风冷部署(不是液冷),主打能效比。英特尔的核心策略是:避开英伟达在高端训练市场的绝对优势,选择推理赛道作为突破口。
这是英特尔明智的地方,不直接做高端训练GPU与英伟达GB300正面竞争。
为什么?答案很简单:挑战太大。
英伟达有完整的GPU产品线,包括:H100、H200和H20,以及Blackwell架构的GB200和GB300。英伟达的优势建立在三个基础上:第一,CUDA生态。所有训练框架(PyTorch、TensorFlow、JAX)和推理框架(TensorRT、vLLM、TGI)都针对英伟达GPU做了深度优化。第二,高带宽显存。GB300的HBM3e显存带宽达8TB/s,GB300集群可支撑万亿参数大模型的实时训练。第三,软件栈完整性。从驱动到框架到部署工具,英伟达提供一站式解决方案。
高端训练GPU的核心竞争要素从来不是硬件参数,而是软件生态。这种生态壁垒,不是英特尔花几年时间就能建立的。Gaudi系列的表现已经证明了这一点。尽管硬件规格不差,但软件生态的短板让Gaudi在市场上始终未能形成气候。
这次英特尔的战略有点类似:农村包围城市。英特尔选择推理赛道的原因很很明显,训练市场的窗口已经关闭了。英伟达和AMD建立了足够深的护城河,但是推理市场随着大模型落地带来了海量的中小规模推理需求,这些需求对成本敏感、对部署简便性要求高,恰好是Crescent Island的用武之地。我们回头来看Crescent Island的关键词:480GB LPDDR5X显存、350W热设计功耗、风冷部署。解决的正是企业客户最关心的问题:功耗、散热、部署成本。
如果说,英伟达的推理GPU是高端市场的低成本方案,用性能收取相对合理的价格。那么,英特尔的Crescent Island是低端市场的高端方案。用相对低的功耗和部署成本,提供“足够用”的AI推理能力。英特尔赌的是当推理成为AI应用的主流场景时,今天积累的市场份额将转化为更大的话语权。
03
AMD怎么办?
在本周的这场交锋里,AMD没有出现,但是AMD也在暗中经历价值重估。
2026年第一季度,AMD交出了一份令人惊艳的财报:营收103亿美元,同比增长38%,净利润13.8亿美元,同比增长95%。数据中心业务营收58亿美元,同比暴增57%,占公司总营收的比例已上升至约57%。
从2025年Q1到2026年Q1,AMD数据中心业务走过了一条教科书式的加速曲线:37亿美元→43亿美元→58亿美元。AMD数据中心业务的增长由两条腿驱动:EPYC服务器CPU和Instinct GPU加速卡。两者在2025至2026年的AI基础设施投资潮中均获得了强劲的市场需求。Oracle Cloud、谷歌云相继宣布采用第五代EPYC处理器构建新一代实例;Instinct GPU方面,MI300系列在AI推理和训练市场中持续扩大客户基础。AMD在2026年最具战略意义的产品动作,是一个名为Helios的全机柜AI系统。这套系统被定位为直接对标英伟达Grace Blackwell和Vera Rubin系统的竞品——后者的整机柜售价超过300万美元。
Lisa Su在财报电话会上说了一句超出常规财报措辞尺度的话:“AMD有信心2027年实现数据中心人工智能业务年营收数百亿美元。”
这是一个相当激进的承诺。但如果AMD能够将Helios系统成功推向市场,并在ROCm软件生态上持续缩小与CUDA的差距,这个承诺并非不可能实现。
04
算力新秩序的黎明
2026年的数据中心芯片市场,呈现出一幅前所未有的图景。
英伟达从GPU霸主向系统级算力平台供应商转型,携RTX Spark和Vera CPU双线进攻。英特尔以至强6+和Crescent Island反击,同时在制程工艺和架构设计上寻求突破。AMD在CPU和GPU双线并进,以Helios和ROCm生态为抓手,试图在两强之间开辟自己的生态位。
这是一场关乎未来十年数字经济主导权的交锋。谁能赢得智能体AI时代的算力基础设施,谁就能在下一个计算时代占据核心位置。
目前来看,但变数依然存在。芯片通胀正在推高整个产业成本,供应链紧张态势短期难以缓解。Arm与x86的架构之争鹿死谁手,尚未可知。芯片政策变数和中国本土芯片厂商的崛起,将为这场比拼增添更多不确定性。
唯一确定的是,在AI变幻莫测的时代,没有厂商敢继续安于一隅。