灰熊直播系统维护

nasi 昨天 4

默认

摘要： 钠斯网络专注于直播系统源码开发，支持私有化部署与自建流媒体，产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等，提供全套解决方案与源码交付，助力企业...

钠斯网络专注于直播系统源码开发，支持私有化部署与自建流媒体，产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等，提供全套解决方案与源码交付，助力企业快速搭建稳定高效的直播平台。

灰熊直播系统维护

导读

CES 2026最具热度的演讲，无疑属于英伟达创始东说念主兼CEO黄仁勋。这位被业界称为"黄衣教主"的业界首脑抛出中枢判断："物理AI的‘ChatGPT时刻’，行将到来。"

作家 | 小小

来源 | 网易科技

CES 2026最具热度的演讲，无疑属于英伟达创始东说念主兼CEO黄仁勋。这位被业界称为"黄衣教主"的业界首脑，定于好意思国时候1月5日下昼1点开讲，却让慕名而至的听众早早体验了"改日热度"——网易科技上昼11点到达时，场外列队队伍已弯曲近500米。有前来参会的中国KOL惊叹："咱们等的不仅是黄仁勋，更是在等一个谜底：改日十年，东说念主与机器将如何从头单干。而有些谜底，似乎只在现场才能听见。"

黄仁勋比预定时候晚了约十分钟登上舞台。他抛出中枢判断："物理AI的‘ChatGPT时刻’，行将到来。"

黄仁勋指出，揣测打算机行业正经验十年一遇的"平台重置"：咱们正从"编程软件"时间跨入"检会软件"时间，揣测打算的基础时候栈（所谓的"五层蛋糕"），每一层都在被从头发明。

2025年被黄仁勋界说为"智能体系统"普及的元年。AI不再只是是事前录制的轨范，而是具备推理、有筹画、以致在实时运行中进行"念念考"的智能体。他极度致意了中国开源模子DeepSeek R1的粉碎，以为开源力量正让AI变得无处不在，使智能不再抛下任何东说念主。

黄仁勋演讲的重头戏在于"物理AI"。英伟达正竭力于让AI意会重力、惯性、因果联系等物理定律。为此，黄仁勋发布了寰球首个会念念考、会推理的自动驾驶AI——Alpamayo。它不仅能开车，还能像东说念主类一样阐发"为什么这样开"。这标志着AI庄重从屏幕后的对话框，走向现实寰球的自动驾驶汽车与东说念主形机器东说念主。

面对AI揣测打算量每年10倍的暴增，黄仁勋祭出了新一代架构Rubin。这不仅是一颗芯片，而是包含Vera CPU、Rubin GPU、NVLink-6等六大中枢组件的全栈翻新。

黄仁勋强调，英伟达的扮装已从芯片供应商挽回为"全栈AI体系"的构建者。通过开源模子、数据及NeMo开荒库，英伟达正通过"三台揣测打算机"（检会、推理、模拟）的架构，为全球提供构建物理AI的底座。这场竞赛不仅关乎速率，更关乎谁能以更低的资本、更高的能效，将东说念主类闲雅带入万物皆有智能的新时间。

以下为黄仁勋CES 2026演讲实录（经剪辑略有修改，小标题为后加）：

时间定调：两大"平台迁徙"与AI的重塑之力

拉斯维加斯，新年快乐！接待来到CES。

约略每十到十五年，揣测打算机行业就会经验一次重置。平台会发生一次根人道的挽回，从大型机到个东说念主电脑，再到互联网、云揣测打算、迁徙开荒。每一次，应用生态都会对准一个新的平台，这即是所谓的"平台迁徙"。每次，你都要为新的揣测打算平台编写新的应用轨范。但这一次，事实上，有两个平台迁徙在同期发生。

当咱们迈向东说念主工智能时间时，应用轨范将构建在AI之上。滥觞，东说念主们以为AI自身即是应用，事实也如实如斯。但改日，你将要在AI之上构建应用轨范。除此以外，软件的运行方式和开荒方式也发生了根人道篡改。

揣测打算机工业的通盘基础时候栈正在被从头发明。你不再"编程"软件，而是"检会"软件；你不再在CPU上运行它，而是在GPU上运行它。曩昔的应用轨范是事前录制、事前编译并在你的开荒上运行的，而现在的应用轨范能够意会高下文，每一次、每一个像素、每一个token都是从零运转生成的。由于加快揣测打算，由于东说念主工智能，揣测打算已经被澈底重塑。阿谁"五层蛋糕"（指时候栈）的每一层如今都在被从头发明。

这意味着，曩昔十年积攒的价值约十万亿好意思元的揣测打算机基础设施，现在正被当代化更正，以适合这种新的揣测打算方式。每年罕有千亿以致上万亿好意思元的风险投资正在涌入，用于当代化更正和发明这个新寰球。

这也意味着，一个百万亿好意思元范围的产业，其研发预算中有几个百分点正在转向东说念主工智能。东说念主们问钱从那处来？这即是来源。从传统AI到当代AI的当代化更正，研发预算从经典依次转向现在的东说念主工智能依次，海量投资正涌入这个行业，这阐发了为什么咱们如斯劳苦。

曩昔这一年也不例外。2025年是不可念念议的一年。看起来似乎系数事情都在合并时候发生，事实上可能也如实如斯。第一件事天然是彭胀定律（Scaling Laws）。2015年，我以为第一个信得过会产生影响的模子BERT出现了，它如实带来了巨大影响。

2017年，Transformer架构问世。直到五年后的2022年，"ChatGPT时刻"才发生，它叫醒了寰球对东说念主工智能可能性的相识。那之后一年发生了一件相当穷苦的事。ChatGPT的第一个推理模子o1面世，"测试时缩放"这个认识也随之产生。

咱们不仅预检会让模子学习，还在后检会阶段通过强化学习让它学习新的手段。现在咱们还有了测试时缩放，这本色上是"念念考"的另一种说法，包括实时进行念念考。东说念主工智能的每一个阶段都需要巨大的揣测打算量，而揣测打算定律仍在捏续彭胀，谎言语模子捏续变得更好。

开源翻新：前沿模子与智能体普及

与此同期，另一个粉碎发生了，这个粉碎发生在2024年：智能体系统运转出现。到2025年，它运转普及，扩散到简直每个边际。具备推理才气、能查找信息、进行探讨、使用器具、有筹画改日、模拟闭幕的智能体模子，蓦地运转措置相当穷苦的问题。我最可爱的智能体模子之一叫作念Cursor，它澈底篡改了英伟达里面的软件开荒方式。智能体系统将信得过从这里升起。

天然，还有其他类型的AI。咱们知说念谎言语模子并不是唯一的信息类型。寰宇中凡有信息之处、凡有结构之处，咱们都能教一种话语模子去意会那种信息，意会其表征，并将其回荡为一种AI。其中最穷苦的一种是物理AI，即能够意会天然定律的AI。天然，物理AI也触及AI与寰球交互。但寰球自身蕴含着被编码的信息，这即是"AI物理"。在物理AI的语境下，你有与物理寰球交互的AI，也挑升会物理定律物理AI。

终末，昨年发生的最穷苦事情之一是开源模子的跳跃。咱们现在可以知说念，当开源、当洞开创新、当全寰球每个行业、每家公司的创新同期被激活时，AI将无处不在。与此同期，开源模子在2025年信得过升起了。

事实上，昨年咱们看到了DeepSeek R1的跳跃，这是第一个开源推理系统。它让寰球大吃一惊，现辞寰球各地有各式不同类型的开源模子系统。开源模子已经达到了前沿水平，固然仍逾期前沿模子约略六个月，但每六个月就有新模子出现，而且这些模子越来越智谋。

正因为如斯，你可以看到开源模子的下载量呈现爆炸式增长，因为初创公司、大公司、探讨员、学生，简直每个国度都想参与AI翻新。

智能——数字模样的智能——怎么可能抛下任何东说念主呢？因此，开源模子昨年真的澈底篡改了东说念主工智能，通盘行业将因此被重塑。

其实咱们对此早有猜测。你可能传闻过，几年前，咱们运转建造和运营我方的AI超等揣测打算机——DGX Cloud。许多东说念主问，你们要进军云揣测打算业务吗？谜底是含糊的。咱们建造这些DGX超等揣测打算机是供我方使用的。闭幕是，咱们罕有十亿好意思元的超算在运行，以便开荒咱们的开源模子。

它运转迷惑全球九行八业的情态，因为咱们在繁密不同界限进行着前沿的AI模子职业：咱们在卵白质、数字生物学（La Proteina）方面的职业，用于合成和生成卵白质；OpenFold 3，用于意会卵白质结构；EVO 2，用于意会和生成多种卵白质；以及开源的细胞表征模子的着手。

Earth-2 AI，意会物理定律的AI；咱们在ForecastNet方面的职业；咱们在Cordiff方面的职业，真的澈底篡改了东说念主们进行天气预告的方式。Nemotron，咱们现在正在那里进行独创性的职业。第一个夹杂Transformer SSM模子，速率快得惊东说念主，因此可以进行永劫候念念考，或者快速念念考（不那么永劫候）并产生相当相当智能的谜底。你们可以期待，咱们在不久的将来发布Nemotron 3的其他版块。

Cosmos，一个前沿的洞开寰球基础模子，意会寰球如何运作。Groot，一个东说念主形机器东说念主系统，触及关节放纵、迁徙性、清爽。这些模子，这些时候现在正在被集成，何况在每一种情况下，都对寰球开源。今天，咱们也将谈谈Alpamayo，咱们在自动驾驶汽车方面所作念的职业。

咱们不仅开源模子，还开源用于检会这些模子的数据，因为唯独这样，你才能信得过信任模子的产生经过。咱们开源系数模子，咱们匡助你基于它们进行繁衍开荒。咱们有一整套库，称为NeMo库：物理NeMo库、Clara NeMo库、BioNeMo库。每一个都是AI的生命周期管理系统，让你能够处理数据、生成数据、检会模子、创建模子、评估模子、为模子种植驻守栏，一直到部署模子。每一个库都极其复杂，而且全部开源。

因此，在这个平台之上，英伟达亦然一个前沿AI模子构建者，咱们以一种相当特殊的方式构建：咱们完全以洞开的方式构建，以便让每家公司、每个行业、每个国度都能成为这场AI翻新的一部分。

这些模子不仅具备前沿才气、是开源的，它们还在各种排名榜上名列三甲。咱们挑升会多模态文档（即PDF）的穷苦模子。寰球上最有价值的内容都存储在PDF中，但需要东说念主工智能来发现里面有什么、解读内容并匡助你阅读。

因此，咱们的PDF检索器、PDF解析器是寰球级的。咱们的语音识别模子皆备是寰球级的。咱们的检索模子，本色上是当代AI时间的搜索、语义搜索、AI搜索、数据库引擎，亦然寰球一流的。是以咱们时时占据榜首。

系数这些都是为了服务于你构建AI智能体的才气。这真实一个独创性的发展界限。当ChatGPT刚出刻下，东说念主们以为其产生的闭幕很真义，但幻觉也很严重。产生幻觉的原因在于，它可以记着曩昔的一切，但无法记着改日和当前的一切。是以它需要基于探讨来"接地气"。

在回话问题之前，它必须进行基础探讨。能够推理是否需要探讨、是否需要使用器具、如何将问题判辨成更多依次。ChatGPT能够将这些依次组合成一个序列，来完成它从未作念过、从未被检会过的事情。这即是推理的魅力所在。咱们可以碰到从未见过的情况，并将其判辨成咱们曩昔经验过、知说念如何处理的情况、知识或轨则。

因此，AI模子现在具备的推理才气极其强劲。智能体的推理才气为系数这些不同的应用掀开了大门。咱们不再需要在第一天就检会AI模子知说念一切，就像咱们不需要在第一天就知说念一切一样。咱们应该能够在职何情况下，推理出如何措置某个问题。谎言语模子现在已经完结了根人道的飞跃。

使用强化学习、念念维链、搜索、有筹画等不同时候和强化学习的才气，使咱们具备了这种基本才气，何况现在也完全开源了。

但信得过了不得的是，另一个粉碎发生了，我第一次看到它是在Perplexity（AI搜索公司）那里。我第一次顽强到他们同期使用多个模子。我以为这完全是天才之举。AI在推理链的任何重要，能调用寰球上系数优秀的AI来措置它想措置的问题。这即是为什么AI本色上是多模态的，它们意会语音、图像、文本、视频、3D图形、卵白质。

它亦然"多模子"的，意味着它们应该能够使用最恰当任务的任何模子。因此，它本色上是"多云"的，因为这些AI模子位于系数这些不同的所在。它如故"夹杂云"的，因为若是你是一家企业公司，或者你构建了一个机器东说念主或任何开荒，有时它在边缘，有时在无线基站，有时在企业里面，或者是在病院等需要实时处理数据的所在。换言之，由于改日的应用构建在AI之上，这即是改日应用的基本框架。

这个基本框架，这种能够完成我所态状的、具备多模子才气的智能体AI的基本结构，现在已经极地面推动了各种AI初创公司的发展。

通过咱们开源的模子和器具，现在你也可以自负定制我方的AI，教它那些唯独无二的手段。这恰是咱们开荒Nemotron、NeMo等开源模子的筹画。你只需要在AI前边加一个智能路由管理器，它会把柄你的提示，自动摄取最合适的模子来措置问题。

这样的架构带来什么？你得到的AI既能完全按你的需求定制，可以教它公司特有的手段，这些可能恰是你的中枢上风，而且你也有对应的数据和专科知识去检会它；同期，它又能长期保捏时候最先，随时用上最新的才气。

简便来说，你的AI既能高度个性化，又能即开即用，长期保捏在前沿。

为此，咱们作念了一个最简便的示例框架，叫"AI Route Blueprint"，已经集成到全球多家企业的SaaS平台中，恶果很可以。

这是不是很不可念念议？使用话语模子。使用事前检会好的、专有的、前沿的话语模子，与定制的话语模子结合到一个智能体框架、一个推理框架中，允许你拜谒器具和文献，以致可能结合到其他智能体。这基本上即是AI应用或当代应用的基本架构，而咱们创建这些应用的才气相当快。

珍摄，即使你给它从未见过的应用轨范信息，或者以一种并非完全如你所想的结构呈现，它仍然能进行推理，并尽最大奋力通过数据和信息去尝试意会如何措置问题。这即是东说念主工智能。

这个基本框架现在正在被整合，而我刚才态状的一切，咱们有幸与一些寰球最先的企业平台公司和解。例如Palantir，他们通盘AI和数据处理平台正在集成，并由英伟达加快。还有寰球最先的客户服务和职工服务平台ServiceNow、全球顶级的云霄数据平台Snowflake。CodeRabbit，咱们在英伟达里面平淡使用。CrowdStrike，正在创建AI来检测和发现AI恫吓。NetApp，他们的数据平台现在上头有英伟达的语义AI，以及智能体系统，用于客户服务。

但穷苦的是：这不仅是你现在开荒应用的方式，它还将成为你平台的用户界面。是以，不论是Palantir、ServiceNow如故Snowflake，以及咱们正在和解的许多其他公司，智能体系统即是界面。它不再是在方格里输入信息的Excel，也许也不再只是是号召行。现在，系数这些多模态信拒绝互都成为可能。你与平台交互的方式变得愈加简便，就像你在与东说念主交互一样。因此，企业AI正在被智能体系统澈底篡改。

物理AI解围：教授机器意会与交互的确寰球

下一件事是物理AI。这是你们听我褒贬了好几年的界限。事实上，咱们已经为此职业了八年。问题是：如何将揣测打算机内通过屏幕和扬声器与你交互的智能体，造成能与寰球交互的智能体？这意味着它能意会寰球运作的学问：物体恒存性（我移开视野再追思，物体还在那里）、因果联系（我推它，它会倒下）。

它意会摩擦力、重力以及惯性，知说念一辆重型卡车在路上行驶需要更多时候才能停驻，一个球会连续滚动。这些想法对小孩来说都是学问，但对AI来说完全是未知的。因此，咱们必须创建一个系统，让AI能够学习物理寰球的学问、学习其礼貌，天然也能从数据中学习。而数据至极稀缺。何况需要能够评估AI是否灵验，这意味着它必须在环境中进行模拟。若是AI莫得才气模拟物理寰球对其算作的响应，它怎么知说念我方实行的算作是否适应预期？

这个基本系统需要三台揣测打算机：一台是咱们熟知的、英伟达制造的用于检会AI模子的揣测打算机；第二台是用于推理模子的揣测打算机。推理模子本色上是在汽车、机器东说念主、工场或任何边缘所在运行的机器东说念主揣测打算机；但必须有另一台为模拟设计的揣测打算机，因为模拟是英伟达简直系数事情的中枢，这是咱们最驾轻就熟的所在。模拟如实是咱们所作念的一切物理AI职业的基础。

是以咱们有三台揣测打算机，以及运行在这些揣测打算机上、让它们变得有用的多个时候栈和库。Omniverse是咱们的数字孪生、基于物理的模拟寰球。Cosmos是咱们的基础模子，不是话语基础模子，而是寰球基础模子，何况也与话语对皆。你可以问"球怎么样了？"，它会告诉你球正在街上滚动。天然，还有机器东说念主模子，咱们有两个：一个叫Groot，另一个叫Alpamayo。

对于物理AI，咱们必须作念的最穷苦的事情之一即是创建数据来检会AI。这些数据从何而来？不像话语那样，因为咱们创造了一堆被以为是"的确情况"的文本，AI可以从中学习。咱们如何教授AI物理寰球的"的确情况"？尽管有多半的视频，但远远不及以捕捉咱们需要的交互的种种性和类型。

因此，一些伟大的头脑麇集在一齐，将底本用于揣测打算的资源回荡为数据。现在，愚弄以物理定律为基础和条目、以的确情况为基础和条目的合成数据生成时候，咱们可以有摄取地、巧妙地生成数据，然后用来检会AI。例如，咱们可以愚弄Cosmos基础模子，生成基于物理、物理上合理的环绕视频，AI现在可以从中学习。

我知说念这很不可念念议。Cosmos是寰球最先的基础模子、寰球基础模子。它已被下载数百万次，辞寰球各地使用，让寰球为这个物理AI的新时间作念好准备。咱们我方也在使用它，用它来创建咱们的自动驾驶汽车系统，用于场景生成和评估。通过揣测打算机模拟，咱们能够灵验地行驶数十亿、数万亿公里。

今天，咱们通知推出Alpamayo，寰球上首个会念念考、会推理的自动驾驶汽车AI。Alpamayo是端到端检会的，从录像头输入到驱动输出。检会数据包括它我方行驶的多半里程、东说念主类驾驶示范，以及由Cosmos生成的多半里程。除此以外，还罕有十万个相当仔细标记的例子，以便咱们教汽车如何驾驶。

Alpamayo特有之处在于。它不仅接受传感器输入并驱动主张盘、刹车和加快器，还会推理它行将采选什么步履。它会告诉你它将采选什么步履，采选该步履的原因，天然还有轨迹。系数这些都径直耦合，并通过东说念主类检会数据和Cosmos生成数据的巨大组合进行专门检会。闭幕相当不可念念议。

不仅汽车能像你祈望的那样驾驶，而且驾驶得相本日然，因为它径直从东说念主类示范中学习。但在每一个场景中，当它碰到某个场景时，它会进行推理，告诉你它将作念什么，并推理它为什么要作念。这之是以如斯穷苦，是因为驾驶的"长尾"问题。

咱们不可能简便地采集寰球上每个国度、每种情况、系数东说念主口可能碰到的系数可能的场景。但是，每个场景若是被判辨成一系列更小的场景，很可能都是至极常见的、你能意会的。因此，这些长尾场景将被判辨成汽车知说念如何处理的至极常见的情况，它只需要进行推理。

咱们八年前就运转研发自动驾驶汽车了。原因在于咱们很早就相识到，深度学习和东说念主工智能将澈底重塑通盘揣测打算时候栈。若是咱们想要意会如何引颈我方、如何教化行业走向这个新改日，就必须精明构建通盘时候栈。

揣测打算跃进：Rubin平台与全栈芯片的终精深构

正如我之前提到的，AI是一个"五层蛋糕"。最底层是地盘、电力和外壳。在机器东说念主界限，最底层即是汽车自身。往上一层是芯片：GPU、采集芯片、CPU等等。再往上是基础设施层。在物理AI这个具体案例中，基础设施即是Omniverse和Cosmos。然后在表层是模子层。我刚才展示的模子就属于这一层，这个模子叫作念Alpamayo。今天，Alpamayo庄重开源了。

咱们联想有一天，说念路上的十亿辆汽车都将完结自动驾驶。你可以摄取租用别东说念主运营的自动驾驶出租车，也可以领有我方的车让它为你驾驶，或者摄取我方驾驶。但每一辆车都将具备自动驾驶才气。每一辆车都将由AI驱动。是以在这个案例中，模子层是Alpamayo，而应用层之上即是梅赛德斯-疾驰汽车。

一言以蔽之，这个时候栈是英伟达初次尝试构建的完好意思时候栈。咱们一直为此奋力，相当原意英伟达的首款自动驾驶汽车将于第一季度在好意思国启航，然后欧洲是第二季度，亚洲约略是第三、第四季度。强劲之处在于，咱们将箝制用Alpamayo的后续版块进行更新。

毫无疑问，在我看来，这将成为最大的机器东说念主产业之一。它教授了咱们多半对于如何匡助寰球其他地区构建机器东说念主系统的深切意会。通过我方构建通盘基础设施，咱们知说念了机器东说念主系统需要什么样的芯片。

在这个具体案例中，是下一代双Thor处理器。这些处理器专为机器东说念主系统设计，具备最高等别的安全才气。梅赛德斯-疾驰CLA刚刚被NCAP评为寰球上最安全的汽车。

据我所知，这是唯逐一个每一瞥代码、芯片、系统都经过安全认证的系统。通盘模子系统基于此，传感器是种种且冗余的，自动驾驶汽车时候栈亦然如斯。Alpamayo时候栈是端到端检会的，领有惊东说念主的手段。但是，除非无尽期地驾驶，不然没东说念主知说念它是否皆备安全。

因此，咱们通过另一个软件时候栈、一个完好意思的自动驾驶时候栈来为其种植驻守栏。阿谁完好意思的时候栈被构建为完全可追忆的。咱们花了约略五年（践诺上是六七年）来构建阿谁第二时候栈。这两个软件时候栈互相照射。

然后咱们愚弄Alpamayo进行策略和安全评估。若是是一个我不太自信的情况，安全策略评估器决定咱们将反璧到一个更简便、更安全的驻守栏系统，那么就回到经典的自动驾驶时候栈。这是寰球上唯一同期运行这两个自动驾驶时候栈的汽车。系数安全系统都应该具备种种性和冗余性。

咱们的愿景是，有朝一日每一辆汽车、每一辆卡车都将是自动驾驶的。咱们一直执政着阿谁改日奋力。这通盘时候栈是垂直集成的。天然，在梅赛德斯-疾驰的案例中，咱们一齐构建了通盘时候栈，咱们将部署汽车、运营时候栈，只消咱们还存在，就会爱戴这个时候栈。

但是，就像咱们公司所作念的其他一切一样，咱们构建通盘时候栈，但通盘时候栈对生态系统洞开。与咱们和解构建L4级和自动驾驶出租车的生态系统正在彭胀，无处不在。我完全信赖，这已经是咱们的一项巨伟业务，因为客户用它来检会、处理检会数据，以及检会他们的模子。在某些案例中，一些公司用它来生成合成数据。有些公司基本上只制造汽车里面的揣测打算机和芯片，有些公司与咱们进行全栈和解，有些则和解部分重要。

通盘系统现在是洞开的。这将成为第一个大范围、主流的AI物理AI市集。从非自动驾驶汽车到自动驾驶汽车的转化点，很可能就在此时运转，并在改日十年内发生。我至极确信，寰球上很大比例的汽车将是自动驾驶或高度自动驾驶的。

但是，我刚才态状的这个基本时候（使用三台揣测打算机、愚弄合成数据生成和模拟），适用于系数模样的机器东说念主系统。可能只是一个关节、一个机械臂，可能是迁徙机器东说念主，也可能是完好意思的东说念主形机器东说念主。是以，下一个旅程将是机器东说念主。这些机器东说念主将会有各式不同的尺寸。

这些机器东说念主身上有袖珍Jetson揣测打算机，它们是在Omniverse里面检会出来的。机器东说念主模拟器叫Isaac Sim和Isaac Lab。咱们有许多建造机器东说念主的一又友，包括New Robot、AG Bot、LG、卡特彼勒（他们有史上最大的机器东说念主）、Serve Robot、Agility、波士顿能源、Franka以及Universal Robots等。

例如来说，Cadence将CUDA-X集成到他们系数的模拟器和求解器中。他们将使用英伟达的物理AI来进行不同的物理安装和工场模拟。AI物理正被集成到这些系统中。是以，不论是电子设计自动化如故系统设计自动化，以及改日的机器东说念主系统，咱们将领有基本上与创造你们换取的时候，现在将澈底转换这些设计时候栈。

在芯片设计界限，Synopsys和Cadence是完全不可或缺的。Synopsys在逻辑设计和IP界限最先，而Cadence在物理设计、布局布线、仿真和考证方面最先。Cadence在仿真和考证方面作念得相当出色。他们两家都正在进入系统设计和系统仿真的界限。是以改日，咱们将在Cadence和Synopsys里面设计芯片，并在这些器具里面模拟一切。

西门子也在作念不异的事情。咱们将把CUDA-X物理AI、智能体AI、NeMo、Nemotron深度集成到西门子的寰球中。原因如下：最先，咱们设计芯片，改日这一切都将由英伟达加快。咱们将有智能体芯片设计师和系统设计师与咱们和解，他们匡助咱们进行设计，就像咱们今天有智能体软件工程师匡助咱们的软件工程师编码一样。

然后咱们必须能够制造机器东说念主。咱们必须建造坐褥它们的工场、设计拼装它们的坐褥线。而这些制造工场本色上将是巨型机器东说念主。是以，机器东说念主将在揣测打算机中被设计，在揣测打算机中被制造，在揣测打算机中被测试和评估。咱们现在创造的时候已经达到了充足锻真金不怕火和强劲的水平，可以反过来匡助他们澈底转换它们所在的行业。

放眼全球的模子方法，毫无疑问，OpenAI是面前最先的token生成器。今天，OpenAI生成的token数目远超其他任何模子。第二大群体，可能即是开源模子了。我猜跟着时候的推移，因为有如斯多的公司、如斯多的探讨东说念主员、如斯多不同类型的界限和模态，开源模子将成为范围最大的群体。

在此经过中，离不开Rubin。这个平台的出身，是为了搪塞咱们濒临的一个根人道挑战：AI所需的揣测打算量正在飙升，对英伟达GPU的需求也在飙升。这种飙升是因为模子每年都在以10倍、一个数目级的范围增长。更不必说，o1模子的引入是AI的一个转化点。推理不再是一次性给出谜底，现在是一个念念考经过。为了教授AI如何念念考，强化学习和极其多半的揣测打算被引入了后检会阶段。它不再是监督式微调（也称为效法学习或监督检会），现在有了强化学习，本色上是揣测打算机通过自我尝试不同迭代来学习如何实行任务。闭幕，用于预检会、后检会、测试时缩放的揣测打算量爆炸式增长。

现在，咱们进行的每一次推理，都可能生成2个token而不是1个，你可以看到AI在"念念考"。它念念考得越久，浅薄能给出更好的谜底。因此，测试时缩放导致生成的token数目每年加多5倍。

与此同期，AI的竞赛正在强烈进行。每个东说念主都在试图达到下一个水平，登上新的前沿。而每当他们到达新的前沿，上一代AI生成token的资本就运转下跌，降幅约略是10倍。每年下跌10倍这件事践诺上阐发了不同的情况：它标明竞赛如斯强烈，每个东说念主都在奋力达到下一个水平，何况如实有东说念主正在达到阿谁水平。

因此，系数这一切本色上都是一个揣测打算问题。你揣测打算得越快，就能越早达到下一个水温文前沿。系数这些事情都在同期发生，是以咱们决定，必须每年都推动揣测打算时候的水平，一年都不可逾期。

咱们一年半前出货GB200。面前，咱们正在进行GB300的大范围坐褥。若是Rubin想要在本年实时推出，它现在就必须已经投产。是以今天，我可以告诉你们：Rubin已进入全面坐褥阶段。

咱们还推出了基于Rubin架构的新一代揣测打算集群DGX SuperPOD，包含1152个GPU，区分在16个机架中，每个机架有72个Rubin GPU。

咱们设计了六种不同的芯片。最先，咱们公司里面有一个原则：每一代新平台不应该有超越一两个芯片发生变动。但问题来了：咱们知说念摩尔定律已经基本放缓，因此咱们每年能得回的晶体管数目，不可能跟上模子每年10倍的增长速率，不可能跟上每年生成的token数目5倍的增长，也不可能跟上令牌资本如斯激进的下跌速率。

若是行业要连续前进，要想跟上这样的速率是不可能的。除非咱们采选激进的极致协同设计，基本上即是在系数芯片、通盘时候栈上同期进行创新。为此，咱们决定，在这一代平台上从头设计每一个芯片。

最先是Vera CPU。在一个受功率管制的寰球里，它的性能是上一代的两倍，每瓦性能是寰球上其他最先进CPU的两倍。它的数据速率是狂放的，专为处理超等揣测打算机而设计。Grace曾是一款出色的CPU，而Vera则将单线程性能、内存容量和系数方面都显贵升迁了。这是一次巨大的飞跃。

Vera CPU结合到Rubin GPU！这是一个巨大的芯片，有88个CPU中枢，这些中枢设计为支捏多线程。但Vera的多线程特色设计得让176个线程中的每一个都能得回其完好意思的性能，是以本色上就像有176个中枢，但唯独88个物理中枢。这些中枢采选了一种叫作念空间多线程的时候设计，性能惊东说念主。

其次是Rubin GPU。它的浮点性能是Blackwell的5倍，但晶体管数目唯独Blackwell的1.6倍。这几许阐发了面前半导体物理的水平。若是咱们不进行协同设计，不在通盘系统的每一个芯片层面进行极致的协同设计，咱们怎么可能完结这种性能水平？

第三，咱们作念的一件伟大的发明叫作念NVFP4 Tensor Core。咱们芯片中的Transformer引擎不单是是咱们放入数据通路的某种4位浮点数，它是一个完好意思的处理器单位，懂得如何动态、自适合地调治其精度和结构，以处理Transformer的不同头绪，从而在可以赔本精度的所在完结更高的朦拢量，在需要的时候复原到最高的可能精度。这种动态调治才气无法通过软件完结，因为它运行得太快了。是以必须在处理器里面自适合地完成。这即是NVFP4的深嗜。

咱们已经发表了对于NVFP4的论文。它所达到的朦拢量和精度保捏水平是完全不可念念议的。这是独创性的职业。改日行业但愿咱们将这种格式和结构定为行业模范，我少量也不会感到有时。这完全是翻新性的。这即是为什么咱们能够在晶体管数目仅加多1.6倍的情况下，完结如斯巨大的性能飞跃。

第四，咱们转换了通盘HGX机箱。这个节点以前有43条电缆，现在0条；6根水管，现在0根。以前拼装这个需要两小时，现在则只消五分钟，而且100%液冷。

第五，将这些结合到顶层机架交换机、处理东西向流量的，叫作念Spectrum-X网卡。这是寰球上毫无疑问最好的网卡。Mellanox的算法、芯片设计、系数互连、其上运行的系数软件栈、RDMA，皆备是无与伦比的寰球最好。现在它还具有可编程的RDMA和数据旅途加快器功能，让咱们的和解伙伴（如AI实验室）可以创建我方的算法来决定如安在系统中迁徙数据。

第六，ConnectX-9和Vera CPU是协同设计的。人所共知，ConnectX-8和Spectrum-X澈底篡改了用于东说念主工智能的以太网时候。AI的以太网流量要密集得多，要求更低的蔓延，流量的瞬时激增是传统以太网从未见过的。是以咱们创建了Spectrum-X，即AI以太网。两年前咱们通知了Spectrum-X。今天，英伟达已成为全球有史以来最大的采集公司。

它相当告捷，在各式设施中平淡使用，正在席卷通盘AI界限。其性能令东说念主难以置信，尤其是当你领有一个200兆瓦的数据中心，或者一个千兆瓦的数据中心（价值数百亿好意思元，一个千兆瓦数据中心约略500亿好意思元）时。若是采集性能能让你极度得回10%的收益——以Spectrum-X为例，完结25%更高的朦拢量并不荒原——只是是10%的升迁，就价值50亿好意思元。等于采集资本完全免费了。这即是为什么每个东说念主都在使用Spectrum-X的原因。

第七，现在，咱们发明了一种新式的数据处理方式，它的处理器叫作念BlueField-4，允许咱们管理一个相当弘大的数据中心，穷苦其不同部分，以便不同用户可以使用不同部分，确保系数资源在需要时都可以被凭空化。这样，你就能卸载许多凭空化软件、安全软件以及南北向流量的采集软件。是以，BlueField-4是每个揣测打算节点的模范成就。

第八是NVLink-6交换机。每个机架交换机里面有四个芯片，每颗芯片都有历史上最快的SerDes。寰球才刚刚达到200Gb/s，而这是每秒400Gb/s的交换机。这之是以如斯穷苦，是因为它能让每个GPU都能同期与其他系数GPU进行通讯。这个位于机架背板上的交换机，使咱们能够以至极于全球互联网数据总量两倍的速率迁徙数据。全球互联网的横截面带宽约略是每秒100太字节，而这个是每秒240太字节，让每个GPU都能同期与其他系数GPU协同职业。

后头是NVLink脊柱，基本上是两英里长的铜缆。铜是咱们所知的最好导体。这些都是屏蔽铜缆、结构铜缆，是揣测打算系统中有史以来使用最多的。咱们的SerDes以每秒400Gb的速率驱动这些铜缆从机架顶部一直到机架底部。这里面统统有长3200米、5000根铜缆，这使NVLink脊柱成为可能。这项转换信得过开启了咱们的HGX系统，咱们决定创建一个行业模范系统，让通盘生态系统、咱们系数的供应链都能基于这些组件进行模范化。组成这些HGX系统的组件约略有8万个。

若是咱们每年都篡改它，那将是巨大的豪侈。从富士康到广达、纬创，再到惠普、戴尔、欲望，系数主要的揣测打算机制造商都知说念如何构建这些系统。是以，尽管性能高得多，而且相当穷苦的少量是，功耗是前代的两倍，Vera Rubin的功耗是Grace Blackwell的两倍——但咱们仍然能将Vera Rubin塞进这个框架里，这自身即是一个古迹。

进入系统的空气流量大致换取。更穷苦的是，进入的水温换取，45摄氏度。在45摄氏度下，数据中心不需要冷水机。咱们基本上是用沸水来冷却这台超等揣测打算机，遵循高得令东说念主难以置信。

是以，这是新的机架：晶体管数目是1.7倍，但峰值推感性能是5倍，峰值检会性能是3.5倍。它们通过顶部的Spectrum-X结合起来。

这是寰球上第一款采选台积电新工艺制造的芯片，这个新工艺是咱们共同创新的，叫作念CoWoS，是一种硅光子集成工艺时候。这使咱们能够将硅光子径直集成到芯片上。这里有512个端口，每个端口200Gb/s。这即是新的以太网AI交换机——Spectrum-X以太网交换机。

几年前咱们推出了Spectrum-X，以便澈底篡改采集结合的方式。以太网如实易于管理，每个东说念主都有以太网时候栈，寰球上每个数据中心都知说念如何处理以太网。而那时咱们使用的另一种时候叫作念InfiniBand，用于超等揣测打算机。InfiniBand蔓延相当低，但它的软件栈和通盘可管感性对使用以太网的东说念主来说相当生分。是以咱们决定初次进入以太网交换机市集。Spectrum-X仍是推出就大获告捷，使咱们成为寰球上最大的采集公司。

生态闭环：从基础设施到行业渗入的全栈布局

但就像我之前说的，AI已经重塑了通盘揣测打算时候栈的每一层。同理可证，当AI运转辞寰球各地的企业部署时，它也必将重塑存储的方式。AI不使用SQL，AI使用语义信息。当AI被使用时，它会创建一种临时的知识、临时的记念，叫作念KV缓存（键值缓存）。但本色上，KV缓存即是AI的职业内存。AI的职业内存存储在HBM内存中。

对于生成的每一个token，GPU都会读入通盘模子、通盘职业内存，产生一个token，然后将这个token存回KV缓存。下一次它再作念不异的事情时，它会再次读入通盘内存，流经GPU，生成另一个token。它就这样重迭进行。显然，若是你永劫候与AI对话，这个内存——这个高下文内存——将会急剧增长。更不必说模子自身在增长，咱们与AI交互的轮次在加多。咱们以致但愿这个AI能奉陪咱们一世，记着咱们与它进行过的每一次对话，对吧？我要求它探讨的每一个结合……天然，分享超等揣测打算机的用户数目也会捏续增长。

因此，这个最初能放进HBM的高下文内存，现在已经不够大了。昨年，咱们创建了Grace Blackwell的快速高下文内存，这即是为什么咱们将Grace径直结合到Hopper，径直结合到Blackwell，以彭胀高下文内存。但即使那样也不够。是以，下一个措置决策天然是走采集。但是，若是有多半AI同期在运行，阿谁采集将不再充足快。

是以谜底很明确：需要一种不同的依次。因此，咱们引入了BlueField-4，以便咱们能够在机架内领有一个相当快速的KV缓存高下文内存存储。这是一种全新的存储系统类别。业界对此相当欢快，因为这是简直系数今天进行多半token生成的东说念主的痛点。AI实验室、云服务提供商，他们真的受困于KV缓存迁徙所导致的采集流量。

因此，咱们创建一个新平台、一个新处理器来运行通盘Dynamo KV缓存/高下文内存管理系统，并将其放在相当蚁合机架其他部分的所在，这完全是翻新性的。

每个这样的机架后头有四个BlueField-4。每个BlueField-4后头有150太字节的高下文内存。分担到每个GPU上，每个GPU将得回极度的16太字节内存。现在，在这个节点里面，每个GPU底本约略有1太字节内存。现在有了这个位于合并东西向流量上、数据速率完全换取（每秒200Gb）的撑捏存储，横跨通盘揣测打算节点的采集结构，你将得回极度的16太字节内存。

Vera Rubin有几个方面真的相当不可念念议。第少量我刚才提到过：通盘系统的能效是前代的两倍。固然功耗是前代的两倍，能耗亦然两倍，但揣测打算才气是数倍于此。进入系统的液体温度仍然是45摄氏度。这使咱们能勤俭全球数据中心约略6%的电力，这是件大事。

第二件大事：通盘系统现在支捏奥密揣测打算，意味着所罕有据在传输中、静态时和揣测打算经过中都是加密的，每个总线现在都是加密的——每个PCIe、每个NVLink、每个HBM……CPU与内存、CPU与GPU之间、GPU与GPU之间，一切现在都是加密的。是以它是奥密揣测打算安全的。这让公司可以坦然，即使他们的模子由别东说念主部署，也永远不会被任何东说念主看到。

这个特定系统不仅能效极高，还有另一个不可念念议之处。由于AI职业负载的特色，它会在蓦地激增。这个叫作念"全归约"的揣测打算层所使用的电流量、能量同期飙升，持续会蓦地激增25%。现在，咱们在通盘系统中完结了功率平滑，这样你就不需要过度成就25%的容量，或者若是你过度成就了，你也不必让那25%的能源被豪侈或闲置。现在，你可以用满通盘功率预算，而不需要过度成就。

终末，天然是性能。让咱们望望它的性能。这些都是构建AI超等揣测打算机的东说念主会可爱的图表。这需要……需要这里的每一个芯片、每一个系统的完全从头设计，并重写通盘软件栈，才使其成为可能。

咱们作念的事情其实围绕三个中枢重要：

第一是检会速率。检会AI模子越快，就能越早把下一代前沿模子推向寰球。这径直决定时候最先性、上市时候和订价权。比如绿色部分代表一个10万亿参数模子（咱们称之为DeepSeek++），需要基于100万亿token进行检会。在不异的检会周期（比如一个月）里，用Rubin平台只需四分之一的系统数目就能完成——在不异的时候里，你能检会更大、更先进的模子。

第二是数据中心遵循。数据中心是AI的"工场"，投资巨大。一个千兆瓦级数据中心可能需要500亿好意思元干涉，而电力是硬性管制。若是你的揣测打算架构每瓦性能更高，不异的电力就能产生更多算力，径直回荡为数据中心的产出和收益。布莱克韦尔平台比较前代完结了约10倍的能效升迁，而鲁宾将在此基础上再次升迁近10倍。

第三是推理资本。也即是践诺生成每个token的资本。Rubin平台将这一资本镌汰到原来的约十分之一。

这即是咱们推动通盘行业走向下一个前沿的方式——让检会更快、能效更高、推理更经济，从而撑捏AI捏续向更大范围、更高水平发展。

如寰球所见，今天的英伟达早已不仅是芯片公司。咱们构建的是完好意思的全栈AI体系——从芯片、系统、基础设施，到模子和应用。咱们的职业是打造完好意思的时候栈，让在座的每一位都能在此基础上，为寰球创造令东说念主咋舌的AI应用。

谢谢寰球到场，祝寰球在CES收成满满！

—— · END · ——

重磅推出：