本文作者:nasi

《情欲直播系统》

nasi 前天 4
《情欲直播系统》摘要: 钠斯网络专注于直播系统源码开发,支持私有化部署与自建流媒体,产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等,提供全套解决方案与源码交付,助力企业...
钠斯网络专注于直播系统源码开发,支持私有化部署与自建流媒体,产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等,提供全套解决方案与源码交付,助力企业快速搭建稳定高效的直播平台。

CES 现场,苏姿丰投下震撼弹:四年内 AI 算力将提高 1000 倍! 濒临英伟达的阻滞,AMD 不再忍受,平直祭出 Helios「太阳神」机架与 MI455X 芯片,以单代性能暴涨 10 倍的「暴力好意思学」正面硬刚。从 Yotta 级诡计宏图到 128GB 合股内存的 PC 怪兽《情欲直播系统》,AMD 正用一场史无先例的算力狂飙,试图澈底重写 AI 宇宙的权柄版图。

6 日是好意思国拉斯维加斯举办的破钞电子展(CES)主旨演讲日,更是全球科技产业权柄版图剧烈动荡的一天。

几个小时前,身着标志性皮衣的英伟达 CEO 黄仁勋刚刚走下舞台,留住了令竞争敌手窒息的 Vera Rubin 平台和 Agentic AI 的渊博愿景,仿佛一位刚刚查看完邦畿的君主。

关系词,聚光灯并未就此灭火。

之后,总计的眼神转向了 AMD 的掌门东谈主苏姿丰(Lisa Su)。

这位老是身着干练西装、在男性主导的半导体宇宙中杀出重围的女性,正准备在发布会上,向阿谁看似不可校服的「绿色帝国」发起这一代最利害的冲锋。

这是算力宇宙「双城记」的缩影。

一边是英伟达,试图通过封闭的生态、极致的垂直整合构建起不可高出的「围墙花圃」,将数据中心酿成只属于它的玄色方尖碑;

另一边是 AMD,试图通过缔盟、灵通要领和堆料极致的硬件,指示着包括 OpenAI、微软、Meta 在内的「复仇者定约」,试图在铁幕上撕开一谈口子。

这场发布会早已超越了摩尔定律的线性叙事。

AMD 在今天发布的除了芯片自己,更是一整套试图龙套英伟达驾御的蓝图。

《情欲直播系统》

在深入解读 AMD 的解围之前,咱们必须先扫视那谈横亘在 AMD 心头的巨大暗影——英伟达刚刚发布的 Vera Rubin 平台。

了解敌手的强劲,才能领悟 AMD 这次反击的豪壮与战略价值。

以天体裁家之名,阻滞寰宇

就在 AMD 发布会开动前,黄仁勋展示了英伟达的下一代核武:Vera Rubin。

这个名字自己就充满了隐喻—— Vera Rubin 是证实暗物资存在的闻未来体裁家,而英伟达正试图掌控 AI 寰宇中那些「看不见」但决定一切的力量:数据流动的引力。

笔据现场裸露的信息,Vera Rubin 平台严丝合缝、甚而精密得令东谈主窒息。

它由三个中枢组件组成,每一个齐直指 AMD 的要害:

( 1 ) Rubin GPU:这是英伟达的金冠明珠。

诚然具体工艺细节被严格守密,但其配备了下一代 HBM4(高带宽内存)。这一事实,足以让通盘行业颤抖。 HBM4 不单是是速率的提高,更是容量的质变,平直处理了大模子查验中的「内存墙」问题。

《情欲直播系统》

( 2 ) Vera CPU:这是英伟达基于 Arm 架构深度自研的怪兽。

它领有 88 个自界说 Arm 中枢和 176 个线程。 英伟达的意图大致是:通过超等芯片的遐想,将 Vera CPU 与 Rubin GPU 在物理层面「焊死」在沿路,逐渐在高端 AI 劳动器中剔除 x86 架构的 CPU(也便是 AMD 和 Intel 的主阵脚)。

《情欲直播系统》

( 3 ) NVL144 机架:这是英伟达「数据中心即诡计机」理念的终极样貌。

单机架领有 144 颗 GPU,通过 NVLink 6 互联,带宽达到了惊东谈主的 260TB/s。 这是一台巨大的、单一的、吞吃电力的超等诡计机。

《情欲直播系统》

英伟达传递的信息冷情而明确:在将来的 AI 数据中心里,不需要插拔,不需要兼容,甚而不需要其他品牌的 Logo。你买的不是芯片,而是英伟达界说的「算力单位」。

Agentic AI 从查验到 Agent 的战略转向

更令 AMD 感到压力的是英伟达在软件叙事上的升级。

黄仁勋在演讲中不再只评述查验,而是大谈特谈 Agentic AI。

当 AI 模子从单纯的聊天机器东谈主进化为能自主诡计、调用器具、处理复杂任务的智能体时,推理算力的需求将不再是线性的,而是指数级的。

一个 Agent 为了完成一个任务,可能需要在后台进行数千次的推理、反想和模拟。

英伟达宣称,Rubin 平台能将推理 Token 的成本缩小 10 倍。

这种「降维打击」般的开心,直击了 OpenAI 等客户的痛点——他们每天齐在为天文数字般的电费和算力成本发愁。

英伟达试图告诉市集:惟有我的软硬件一体化平台,才能承载这种能够「想考」的 AI。

在这样的布景下,苏姿丰登场了。

她濒临的是一个近乎完整的敌手,一个不仅驾御了面前,还试图界说将来的帝国。

AMD 的绝地反击,Helios 与万倍增长的贪心

灯光渐暗,大屏幕上亮起了 AMD 标志性的橙红色晴朗。

PPT 的第一页是一句充满了防护性却又极具紧要意味的口号:「Solving the World's Most Important Challenges」(处理宇宙上最要紧的挑战)。

《情欲直播系统》

苏姿丰莫得躲藏房间里的大象,而是平直切入正题:算力需求的爆炸。

Yotta Scale:摩尔定律的墓志铭与回生

AMD 平直抛出了意见:Yotta Scale Compute(尧字节级诡计)。

尧塔浮点运算(Yottaflop),代表每秒一亿亿亿次浮点运算(10² ⁴ FLOPS)。

面前,最强的 El Capitan 照旧百亿亿次浮点运算(1.742 Exaflops,即 10¹ ⁸ FLOPS)

AMD 的方针是将来 5 年,10 万台 El Capitan 级超等诡计机。

《情欲直播系统》

面前,宇宙最强超等诡计机 El Capitan,占地约 697 平淡米,很是于两个网球场大小

笔据 AMD 的里面数据,AI 算力需求正在履历每年前所未有的暴涨。

PPT 第 8 页昭着写着:「10,000x Increase in AI Compute」。

《情欲直播系统》

苏姿丰说:「不仅查验算力每年增长 4 倍,在当年两年里,推理 Token 的数目增多了 100 倍。」

《情欲直播系统》

这一数据平直对抗了英伟达对于「推理成本」的叙事—— AMD 相似看到了 Agentic AI 的将来,但他们的处理有规划绝对不同。

AMD 试图用更灵通、更巨大的边界来处理问题。

Helios AI Rack:灵通架构的图腾

发布会的隆盛是一个名为「Helios」的 AI 机架的揭幕。

《情欲直播系统》

以希腊别传中的太阳神定名,Helios 承载了 AMD 照亮黯淡、龙套驾御的隐喻。

若是说英伟达的 NVL72 是一座封闭的玄色方尖碑,那么 Helios 便是 AMD 试图构建的「巴别塔」——一座由全东谈主类(除了英伟达)共同成就的高塔。

为了更直不雅地领悟这场对决,咱们将 Helios 与英伟达的 NVL 平台进行了详备对比:

《情欲直播系统》《情欲直播系统》

Helios 机架不单是是硬件的堆叠,它是 AMD 战略的集大成者。

Zen 6 的初度说明与 x86 的信守:在 PPT 的参数列表中,昭着写着「4,600 'Zen 6' CPU Cores」。

这是一个巨大的彩蛋,亦然 AMD 对英伟达 Vera CPU 最有劲的对抗。

当英伟达试图将宇宙推向 Arm 架构时,AMD 信守并升级了 x86 架构。

对于那些在这个星球上领罕见以亿计基于 x86 代码财富的企业来说,不需要为了 AI 重写总计的底层代码。

31TB HBM4 内存的暴力好意思学:这是一个让现场发出惊呼的数字。

对于大模子查验而言,显存容量常常比诡计速率更早成为瓶颈。

AMD 连接沿用了「大显存」策略,试图用海量的 HBM4 来容纳更巨大的 MoE 模子,从而减少跨卡通讯的频率。

这是一种通俗粗暴但极为灵验的策略:若是你的互联速率不如 NVLink,那就把内存作念大,减少互联的需求。

MI455X:参数怪兽与模组化的到手

看成 Helios 的腹黑,AMD Instinct MI455X被阐扬推向舞台中央。

《情欲直播系统》

10 倍性能跃迁:比较于前代 MI355X,MI455X 已矣了 10 倍的性能提高。

这是一个激进的数字,不时期际升级在 2-3 倍,10 倍的宣称意味着架构级的重构。

这主要收获于新的 CDNA 架构和制程红利。

《情欲直播系统》

OAM 模组化遐想的宝石:不同于英伟达越来越倾向于将 CPU 和 GPU 焊死在一块主板上,AMD 依然强调即插即用的纯真性。

这意味着客户不错保留原有的劳动器机箱,只升级诡计模组。

这对于成本敏锐的云劳动商来说,是极具眩惑力的「反锁定」策略。

他们不需要因为升级 GPU 而扔掉通盘机柜的电源和散热系统。

将来路子图:MI500 与千倍提高

AMD 展示了直到 2027 年的路子图,这种透明度在短暂万变的半导体行业极为冷漠。

《情欲直播系统》

2026 年:MI400 系列(即今天的 MI455X)。2027 年:MI500 系列。这将基于CDNA 6 架构,袭取 2nm 工艺,配备 HBM4E 内存。

AMD 开心在 4 年内已矣 1000 倍的 AI 性能提高。

《情欲直播系统》

这是在告诉本钱市集和客户:「咱们有永远的技能储备,不会在英伟达的快速迭代中掉队。咱们是长跑选手,不是投契者。」

数据中心的血管,互联技能的障翳干戈

若是说 GPU 是跑车,那么互联技能便是高速公路。

英伟达之是以无敌,不单是是因为跑车快,更是因为他们修了特有的高速公路(NVLink),只允许自家的车跑,而且还要收昂然的过路费。

本次发布会上,AMD 最中枢、亦然最具壅塞力的战略反击,便是齐集全行业修建一条免费、通用的高速公路——UALink ( Ultra Accelerator Link ) ,以及升级蓝本的国谈——Ultra Ethernet ( 超以太网 ) 。

拆解 NVLink 的霸权:为何它是英伟达确切的护城河?

在技能圈,NVLink 被视为英伟达最深的护城河,甚而杰出了 CUDA。

它允许 GPU 之间像大脑神经元一样分享内存,延伸极低。

莫得 NVLink,几千张 GPU 堆在沿路只是一堆沙子;

有了 NVLink,它们才是一颗超等大脑。

英伟达的策略是:若是你想用最高效的集群,就必须买全套英伟达有规划。

NVLink 不兼容任何其他厂商的芯片,它是一个封闭的物理层条约。

UALink:技能解围

AMD 在 PPT 中特别辟出一页先容灵通生态。

这背后是一个名为UALink Consortium的纷乱定约。

Scale Up(节点内膨胀)的利剑:UALink。

这是平直对标 NVLink 的技能。

它由 AMD、英特尔、微软、Meta、谷歌、博通等巨头共同制定。

UALink 1.0 范例支撑多达 1024 个加快器在一个 POD 内互联,这在边界上甚而超越了英伟达刻下的 NVSwitch 才调。

内存一致性:UALink 最环节的特点是支撑显存池化。

这意味着 AMD 的 GPU 不错探听合并集群内其他 GPU 的内存,就像探听我方的一样。

这对于查验万亿参数模子至关要紧,亦然此前惟有 NVLink 能作念到的事情。

这是一个典型的「合纵连横」故事。

OpenAI、微软、Meta 这些巨头最怯生生的不是技能瓶颈,而是供应商锁定。

若是将来的 AI 基础关节绝对依赖英伟达的特有要领,这些科技巨头的议价权将归零。

因此,Helios 机架不单是是 AMD 的居品,它是通盘「反英伟达定约」的意志体现。

以太网的逆袭:UEC vs InfiniBand

除了 UALink,发布会中屡次提到Ultra Ethernet ( UEC ) 。

这是另一场关乎死活的干戈:节点间互联。

InfiniBand 的统领:英伟达在收购 Mellanox 后,驾御了高性能蚁集 InfiniBand。 它延伸极低,无损传输,是 AI 查验的黄金要领。以太网的进化:AMD 莫得选定自研特有蚁集,而是押注以太网的进化。 UEC 旨在处理传统以太网在 AI 负载下的丢包和拥塞问题。成本的逻辑:InfiniBand 昂然且封闭,而以太网低价且通用。 笔据规划,UEC 有规划的每 GFLOP 成本比 InfiniBand 低 27%。

若是 UEC 得胜,意味着客户不错用低廉通用的以太网交换机(比如博通、想科的居品)来组建超等诡计机,而不需要购买昂然的英伟达 Quantum InfiniBand 交换机。

这恰是 Helios 机架的杀手锏:更低的总领有成本(TCO)。

对于那些要购买数万张显卡的客户来说,这省俭下来的钱可能高达数十亿好意思元。

端侧的野望,Ryzen AI Max 与「Mac Studio 杀手」

视野从云霄的数据中心拉回,苏姿丰将展示要点转向了 PC。

在 AI 时期,PC 正在酿成「私东谈主 AI 助理」的物理载体。

《情欲直播系统》

Ryzen AI Max:龙套内存墙的 128GB 豪赌

AMD 发布了震撼级的居品——Ryzen AIMax 系列。

《情欲直播系统》

这款芯片看似只是札记本处理器,但其参数却令东谈主赞佩,尤其是阿谁恐怖的数字:128GB 合股内存。

《情欲直播系统》

为什么这很要紧?

在当年,x86 处理器的内存和显存是分离的,且容量有限。

想在札记本上运行一个像 Llama 3 70B 这样的大模子简直是不可能的,因为显存不够。

苹果的 M 系列芯片(M3 Max/Ultra)之是以受征战者接待,便是因为合股内存架构允许大模子平直在腹地运行。

AMD Ryzen AI Max 平直对标苹果,成为首款能运行 2350 亿(235B)参数模子的 x86 处理器。

这意味着,征战者不错在一台 Windows 札记本上,灵通运行企业级的超大模子,而无需联网。

性能对比:耻辱英特尔,追逐苹果,挑战英伟达

现场的 PPT 充满了炸药味,AMD 简直把市面上总计的竞争敌手齐拉出来打了一遍:

《情欲直播系统》

对比 Intel Core Ultra 9:Ryzen AI 400 系列在内容创作上快 1.7 倍,多任务处理快 1.3 倍。

这记号着 x86 阵营里面话语权的升沉。

对比 Apple M5:这是一个果敢的比较。

AMD 宣称 Ryzen AI Max 在 AI Token 生成速率上快 1.4 倍。

对于那些苦于苹果生态封闭、又珍贵其合股内存架构的征战者来说,这是独一的替代品。

对比 Nvidia DGX Spark:最令东谈主不测的是,AMD 将札记本芯片与英伟达的责任站级别居品对比。

在每好意思元 Token 生成后果上,Ryzen AI Max 是英伟达 DGX Spark 的 1.7 倍。

AMD 态状了一个诱东谈主的将来:每一个征战者、每一个创作家,齐能在我方的书桌上领有一台「小型超算」。

不再需要昂然的云霄 API,不再驰念阴私透露,你的 Ryzen AI Max 便是你的特有 GPT。

这对于 OpenAI 等公司来说亦然利好——若是端侧算力富余强,无数的推理任务不错从云霄卸载到用户腹地,从而省俭天文数字般的云劳动器成本。

Halo Platform:征战者的「军火库」

除了硬件,AMD 还发布了 Ryzen AI Halo 处理器,专为 AI 征战者遐想。

《情欲直播系统》

它是一个平台。

它预装了 ROCm 软件栈(AMD 的 CUDA 替代品),优化了 PyTorch、Hugging Face 等框架,况且已矣了 Day-0 支撑主流模子(Llama, GPT-OSS, Flux 等)。

《情欲直播系统》

AMD 终于相识到,软硬联接才是王谈。

他们试图用雷同苹果的体验,将征战者从 CUDA 的引力场中拉出来,给他们一把「铲子」,让他们在 AMD 的地皮上挖掘 AI 的金矿。

盟友的站台,不单是是生意互吹

在发布会的后半程,PPT 上出现了一张密密匝匝的 Logo 墙。

《情欲直播系统》

但其中最瞩宗旨,莫过于 OpenAI。

诚然奥特曼莫得躬行出场站台,而是 OpenAI 总裁 Greg Brockman 代为出席,但 OpenAI 看成中枢相助伙伴出面前第一位,自己便是最热烈的信号。

这是一场对于糊口的博弈。

OpenAI 的战抖与 AMD 的契机

为什么 OpenAI 需要 AMD?

谜底很通俗:怯生生。

OpenAI 对算力的饥渴还是到了病态的进度。

Brockman 平直摊牌,在 OpenAI 里面,「算力一直在被争抢」。

对此,苏姿丰玩笑谈:「我每次见到你,你齐会告诉我:你们还需要更多算力。」

偶然,她抛出一个环节问题:「需求真实有这样大吗?」

Brockman 的回答很是平直:

当年几年里,OpenAI 的算力边界简直每年齐在翻倍甚而三倍增长,而且这种趋势不会放缓。

他甚而用 ChatGPT,作念了一页幻灯片,分析了 OpenAI如何让推理更省算力,包括更高带宽、更强性能、更低的 HBM 内存占用。

《情欲直播系统》

据报谈,GPT-6 及后续模子的查验需要数万张甚而数十万张 B200。

若是只依赖英伟达,OpenAI 的红运就绝对掌持在黄仁勋手中。

英伟达不错决定谁先拿到芯片,谁能拿到些许,甚而以什么价钱拿到。

议价权:引入 AMD 看成「二供」,是 OpenAI 乃至微软逼迫英伟达降价、或者至少不直爽加价的独一妙技。

哪怕 AMD 的芯片只可达到英伟达 80% 的性能,只消它存在,英伟达就不成暗渡陈仓地垄料订价。

供应链安全:当台积电的 CoWoS 产能被英伟达订满时,AMD 提供了一个备选项(尽管他们也争抢台积电产能,但 AMD 的 Chiplet 遐想霸术使其能诳骗不同的封装技能,增多了供应链的弹性)。软件生态的破局:ROCm 的进化与 PyTorch 的到手

除了 OpenAI,咱们还看到了 Hugging Face、PyTorch、Databricks 等名字。

这是 AMD 对外界质疑最有劲的恢复。

多年来,对于 AMD 最大的诟病便是「硬件一流,软件三流」。

ROCm(Radeon Open Compute)一直被以为是 CUDA 的顽劣效法者,Bug 多、文档少。

但在这次发布会上,AMD 展示了 ROCm 的庸碌袭取。

《情欲直播系统》

这一变化的幕后推手是 PyTorch 2.0。

跟着 PyTorch 等高层框架的普及,底层的 CUDA 依赖正在被剥离。

对于大多数征战者来说,只消 PyTorch 代码能跑,下面是 A 卡照旧 N 卡还是越来越不要紧了。

OpenAI 的 Triton 话语更是加快了这一历程,它允许征战者编写的代码自动优化到不同的硬件后端。

这恰是 AMD「农村包围城市」战略的体现:既然无法在底层 CUDA 上打败你,那就把战场拉到表层的 PyTorch 和 Triton 上,在那里,全球是对等的。

算力干戈,才刚刚开动

苏姿丰抛出了一个让全场呆住的判断:「五年内,全球将有 50 亿东谈主每天齐在使用 AI 。」

《情欲直播系统》

冷静:是每天齐在用!

这意味着算力需求将赓续指数级增长。

2025 年,全球 AI 用户已杰出 10 亿!而且,这不是 AI 的尽头:将来主动式和自动化 AI 还将指数级增长,引爆更多推理算力需求。

AMD 的另一个环节判断是:AI 正在从云霄,走向个东谈主电脑。

《情欲直播系统》

李飞飞平直态状了将来的游戏体验。

她的公司 World Labs 旗下的居品 Marble,只需要一丝像片,就能让模子自动构建一个完整的3D 宇宙。

现场演示中,只消用手机唾手拍几张像片,AI 就能自动生成 3D 场景。

《情欲直播系统》

游戏、造谣宇宙、创作门槛,会被澈底打穿。

这长远影响 PC 的使用体验。

更激进的,是主动式智能体。

来岁开动,你的电脑,可能真实会「替你打工」:

《情欲直播系统》

除了 PC,AMD 还在同步押注物理 AI 等场景。

那处需要 AI 算力,AMD 就会出面前那处。

《情欲直播系统》

这一次,AMD 是确切的 All in AI。

当苏姿丰在台上展示LUMI超等诡计机(由 AMD 驱动的前欧洲最快超算)在时事模拟上的孝顺时,更是进一步输出了价值不雅。

《情欲直播系统》

反英伟达定约的实质

本次 CES 发布会,实质上是「反英伟达定约」的一次誓师大会。

英伟达的路子:雷同于早期的 IBM 或面前的苹果。

封闭、昂然、体验极致、利润独吞。

Vera Rubin 平台将这种封闭推向了极致,从 CPU 到 GPU 再到网卡和交换机,全部自研,全部特有。

AMD 的路子:雷同于安卓。

灵通、繁杂但充满活力、性价比高、利润分享。 它齐集了博通(蚁集)、英特尔(CPU 互联)、微软(软件)等总计被英伟达边际化的巨头。

客户的选定:短期内,为了追求极致性能(如查验 GPT-6),巨头们依然会咬牙购买英伟达的 Rubin。

但在推理侧和中等边界查验中,Helios 和 MI455X 提供了极具吸引力的替代有规划。

发布会遏抑了,苏姿丰在一派掌声中退场,留住了死后大屏幕上阿谁巨大的「Together we advance_」的口号。

《情欲直播系统》

这一刻,AI 算力的分手路口

对于全球科技产业而言,2026 年的这天兴味超卓。

咱们并不但愿看到一个惟有一个玩家的游戏。

当英伟达试图用 Vera Rubin 将通盘 AI 产业封装进它的玄色机柜时,AMD 用 Helios 在墙上凿出了一扇窗。

若是说英伟达是算力时期的「罗马帝国」,不仅修路(NVLink),还造车(GPU),甚而开动制定交通轨则(Agentic AI),那么 AMD 便是阿谁试图保管贸易目田的「生意联邦」。

OpenAI 需要这扇窗,微软需要这扇窗,在这个星球上每一个渴慕低成本、普惠 AI 算力的征战者齐需要这扇窗。

这场「AI 算力干戈」莫得尽头,Yotta Scale 只是下一个开动。

正如沙漠中每一粒沙子齐可能成为将来的芯片《情欲直播系统》,算力的宇宙里,也毫不应该惟有一种声息。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享