本年的 CES 黄仁勋主题演讲上,目生的,他莫得先容英伟达的消费级显卡。
面前最新的消费级 GPU,如故昨年在 CES 上谨慎发布的 RTX 50 系列。其中势必有内存大师大加价的原因,面前商场的内存资本,一周之内就能加价 50%-100%,况且多个分析机构示意,加价会握续到 2027 年。
更多的原因如故 AI,就拿 AI 覆按和部署来说。一块 RTX 5090 显卡的最大显存是 32GB,粗率找一个推崇可以的开源大模子,参数皆所以百亿为单元,所需要的显存容量,32G 的上风会比较有限。
但英伟达澄清不会舍弃腹地筹画的商场,本年不发消费级的显卡,有了全新的消费级个东说念主超算。
英伟达在 CES 2026 上展示了全新的 DGX Spark,况且用它完成了多个 AI 研讨的任务。建造者和创作家不需要好听的数据中心,通过 DGX Spark,就可以在腹地通顺运行、微调,以至推理高达 100B 参数的前沿 AI 模子。
咱们之前也共享过 DGX Spark 的上手体验,下载 1200 亿参数的 GPT-OSS 开源模子,或者部署 Qwen 图片生成、Wan 2.2 视频生成,DGX Spark 皆能作念到。
再回来一下 DGX Spark 的主要情况。
中枢架构:基于 NVIDIA Grace Blackwell 架构打造,将数据中心级别的 AI 算力,浓缩到了紧凑的桌面机箱中。
海量内存:单机配备 128GB 调治内存。更为独到的是,它赈济通过 200Gbps 的 ConnectX-7 收罗,将两台 DGX Spark 互连,构成领有 256GB 内存的超等节点。
中枢才智:专为大模子时期瞎想,赈济在腹地运行 100B 参数级别的模子,或者对 70B 参数的 LLM 进行散播式微调。
定位:它不仅是建造者的沙盒环境,而且还要作念 AI 创作家的平台,主如若让高强度的 AI 责任负载,脱离云霄依赖,在腹地安全、低延伸地完成。
本次 CES 更新的最大亮点,在于通过软件升级引入了对 NVFP4 数据标准的全面赈济。NVFP4 的数据标准,概况让新一代模子在保握智能推崇的同期,内存占用裁汰约 40%,费解量大幅栽植。
具体的实测数据,在两个 DGX Spark 设置上运行 Qwen-235B 模子时,使用 NVFP4 比拟 FP8 性能栽植最高可达 2.6 倍。这径直地科罚了,已往使用 FP8 精度时双系统内存粉碎、无法多任务处理的困难。
硬件在桌面上,但造访模样可以很云霄。CES 上展示的 Brev 更新,还科罚了 DGX Spark 腹地算力生动性不及的问题。
面前,建造者可以通过 Brev,安全地烦扰贯串 DGX Spark,就像使用云就业相通方便。此外,Brev 赈济智能路由层。用户可以将处理邮件或专迥殊据等明锐任务,强制保留在腹地 DGX Spark 上运行,而将一般推理任务无缝路由至云霄,兼顾了隐秘安全与云霄算力。
Brev 的引入,科罚了腹地算力不仅能用,还要好用的问题。它的腹地筹画赈济瞻望于 2026 年春季谨慎推出。
这样强的算力能用来作念什么,英伟达在 CES 现场的演示也给出了谜底。
关于视频创作家,这是无边的创意生成加快器。将 AI 视频生成任务从条记本转机到 DGX Spark 上,比拟顶配 M4 Max 的 MacBook Pro,速率达成了高达 8 倍的栽植,信得过作念到了让创作流不再卡顿。
不仅是个东说念主建造者,关于持重腹地安全的企业用户,DGX Spark 也能胜任。英伟达展示了由 Nsight 驱动的腹地 CUDA 编码助手,企业建造者可以在享受 AI 扶植的同期,确保源代码透澈存储在腹地,根绝信息表露风险。
更有好奇的演示是和机器东说念主的伙同。通过与 Hugging Face 的合营,DGX Spark 化身 Reachy Mini 机器东说念主的「大脑」,让机器东说念主具备了及时视听交互才智。面前看起来,用 DGX Spark 来作念具身智能,也不再是大厂的专属。
Hugging Face 产物副总裁 Jeff Boudier 也提到,「怒放模子赋予建造者以我方的模样构建 AI ,而 DGX Spark 将这种才智带到桌面端……让无边的 AI 形成信得过可以互动的存在。」
为了裁汰建造者的门槛,英伟达还在 CES 上联络新增了 6 个 Playbook(实战手册),重心遮掩了当下的热点需求。
Nemotron 3 Nano,英伟达最新的开源智能体大模子,用于腹地 LLM 实际。
Live VLM WebUI,及时视觉话语模子分析,通过输入收罗录像头画面,径直在 DGX Spark 腹地进行视频分析。
Isaac Sim / Lab,机器东说念主仿真与强化学习。
双系统微调,展示了若何期骗两台 DGX Spark,散播式微调 70B 参数的 LLM。
除了 Playbook 的更新,DGX Spark 还预装了历程优化的 NVIDIA AI 软件和 CUDA-X 库。这意味着建造者无需在繁琐的驱动设置,和环境依赖上粉碎时间,开箱即可得到「即插即用」的优化才智,径直运行构建或微调 AI 模子。
DGX Spark 在 CES 2026 上的出现,意味着「大模子腹地化」如故不再是一句空论。岂论是为了数据安全、建造成果,如故为了探索下一代具身智能,DGX Spark 皆在勇猛成为下一代 AI 应用构建的基座。
就像面前百媚直播业务系统管理,如故运行有让 AI 来玩游戏的花式了,改日需要的,可能除了一块能通顺打《黑外传:悟空》的 5090,还会有更多的桌面级 AI 超等筹画机出现。








