本文作者:nasi

岛主直播系统 起点

nasi 昨天 4
岛主直播系统 起点摘要: 钠斯网络专注于直播系统源码开发,支持私有化部署与自建流媒体,产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等,提供全套解决方案与源码交付,助力企业...
钠斯网络专注于直播系统源码开发,支持私有化部署与自建流媒体,产品涵盖短视频系统、语聊系统、教育直播、直播带货、体育赛事直播、IM即时通讯系统等,提供全套解决方案与源码交付,助力企业快速搭建稳定高效的直播平台。

岛主直播系统 起点岛主直播系统 起点

"异日六个季度数据中心收入 5000 亿好意思元。"黄仁勋在 GTC25 上说。

2026 年 1 月 6 日开幕的 CES 2026,老黄又声称 90% 的 ASIC 状貌会失败,这践诺上是对此前谷歌 TPU 为代表的 ASIC 芯片(专用集成电路)的理论"挞伐",一场针对 ASIC 的全面围猎仍是偷偷运行。

好多东说念主会存眷,GPU、ASIC 竞争的终端如何?谜底是取决于半导体构兵的终极弹药库——台积电 CoWoS 先进封装产能。

这意味着,只须对台积电 CoWoS 产能预订、分拨情况,进行颗粒度拆解,就能精确测算出 2026 年 AI 算力芯片的出货样子。

不错说,2026 年"芯片战",系于台积电 115 万片 CoWoS 晶圆产能。

该图片可能由 AI 生成

岛主直播系统 起点

01 构兵的发源

咱们先对 GPU 和 ASIC 的构兵配景作念一些铺垫(有行业基础可跳过本部分)。

东说念主工智能对算力的需求膨胀是共鸣,但必须明确:更先进的运筹帷幄架构、工艺制程和先进封装,是三个要津旅途。

对于架构,谈到最多的是 GPGPU(通用图形处理器),英伟达在这条路上,借助 CUDA 生态的 20 年铺垫,成为通用并行运筹帷幄的满盈王者。

硬件层面,英伟达的中枢火器有两个:HBM 内存极高的带宽、GPGPU 大限制流处理器阵列。从 H200、GB200 到 2026 年 1 月推出的" Vera Rubin ",齐是这条旅途的产物,性能升迁径直与显存带宽、NVLink 互连限制挂钩。

GPGPU 之外,以谷歌 TPU 为代表的 ASIC 芯片,探索出了另一条更精确、定制化的架构——云表推理侧的负载日益固化,为特定算法(如 Transformer)定制的 ASIC 芯片,能够展现出碾压级的能效比,即每瓦性能和总领有成本(TCO)上风。

谷歌的 TPU、亚马逊的 Trainium 齐是这条旅途的前锋。博通、Marvell、Al chip 等野心公司,恰是通过为这些云巨头定制 ASIC 芯片,撕开了 AI 芯片万亿商场的一说念口子。

比拟架构竞争,工艺制程这条旅途显得更好领会,从 7nm、5nm、3nm 到 2025 年底量产的 2nm,每一次制程跃进齐意味着晶体管密度和能效的升迁。

不外,工艺制程是一条高门槛的旅途:进化速率越来越慢,成本越来越贵,2nm 晶圆代工价钱高达 3 万好意思元,入场费已非通盘玩家齐能承受。此外,工艺制程的微缩还将靠近"功耗墙"和"存储墙"。

架构、制程之外,第三个要津旅途是先进封装,以 CoWoS(Chip on Wafer on Substrate)为代表的先进封装是台积电为高性能运筹帷幄打造的"王冠上的明珠"。

岛主直播系统 起点

CoWoS 封装观点图,开首:台积电

CoWoS 的精髓在于异构集成,将多个小芯片,举例运筹帷幄芯粒(GPU/ASIC 中枢)、高带宽内存(HBM)、I/O 芯粒等,通过中介层进行超高密度、超高带宽互连,集成在一个封装内。

岛主直播系统 起点

表 1:CoWoS 中介层面积变化趋势

这种方式不错粉碎单芯片光罩(掩模板)尺寸截止,中介层面积现时可达 2800mm²,径直克己就是晶体管更多,HBM 显存更高。

另外,由于 CoWoS 取舍了硅中介层,上头的微凸块(μBump)间距极小,芯粒间通讯带宽激增,延伸和功耗大幅裁汰。

正因如斯,无论是追求极致性能的英伟达 GPU,照旧追求最好总领有成本的云巨头 ASIC,凡是涉足顶级 AI 算力,齐离不开 CoWoS。

是以,在 2026 年这个时辰点上,当制程进入 2nm 深水区,成本高企,架构道路出现根人道分叉时,CoWoS 先进封装的产能分拨,就成了决定算力疆域的最要津变量,莫得之一。

02 产能图谱:台积电 CoWoS 的供给样子

岛主直播系统 起点

表 2:台积电 CoWoS 产能爬坡情况

从咱们掌持的情况来看,畴昔三年,台积电 CoWoS 产能一起从单月 12K 晶圆,缓缓爬升至 2025 年底的 80K/ 月,2026 年年底的预估指标是 120K/ 月驾御。

取一个全年灵验平均值:96K/ 月,即2026 年台积电 CoWoS 总灵验产能约为:96K/ 月 × 12 个月 = 1150000 片晶圆,这是 AI 芯片战的总弹药基数。

产能分拨原则

这 1150000 万片晶圆如何分拨,背后是一场基于本事、买卖、地缘的复杂棋局。

按照优先级,英伟达行动 CoWoS 最早期、最果敢的共同界说者和投资者,其架构(如 NVLink)与台积电 CoWoS 工艺深度耦合,毫无不测不错拿到最多。

按客户层级,由于 苹果、英伟达、AMD 是台积电前三大 VVIP 级客户,其普遍预支款和始终契约锁定了基础产能。不外,苹果要到 2028 年才有自研 AI 芯片。另外,博通、Marvell 因说合谷歌、AWS、Meta 等云巨头天量 ASIC 订单,已置身顶级 VIP 客户行列。

另外,对台积电来说,除了 ASIC 之外,AMD、英特尔乃至中国客户,齐是制衡英伟达、分布客户风险的蹙迫力量,也会分得一部分产能。

产能分拨明细

总体来看,家具需求最旺、单价最高、本事最起先的英伟达有望拿到其中近 60% 的产能;AMD 的预定量在 90K 驾御,占比接近 8%,比拟 2025 年有 64% 的增量,增幅着实与英伟达一致。

天然单一客户 CoWoS 订单激增,也包含了中介层放大的成分,但对于功绩的孝敬势必是正面的。不外也要强调,更复杂、集成度更高的封装(如集成更多 HBM、更大中介层)初期良率较低,践诺灵验产出需打折。

岛主直播系统 起点

表 3:CoWoS 产能举座预订和分拨情况

通盘这个词 ASIC 阵营,大致不错远隔为博通、世芯(AI Chip)、Marvell 和联发科几家,其中博通是领头羊。

博通 2026 年预定量大幅增至 200K,同比增 122%,主要受谷歌 TPU 外供拉动,但博通主要负责 TPU v6p 以及 v7p,偏向推理的 v7e 由联发科负责,会在 2026 年下半年推出。异日 TPU v8 照旧会盲从 v7 的模式,由博通与联发科两家下单 CoWoS。

博通的 200K 预定量,按客户预订情况大致拆分如下:

第一大客户谷歌 TPU 瞻望分得 200K 当中 60~65%

第二大客户 Meta 的 MTIA简短占博通预订量的 20% 驾御

第三大客户OpenAI 将于年底推出里面代号 Titan 芯片,台积电 N3 制程,瞻望占本年博通预订量的 5-10%,2027 年将达到 20%+

2028 年,苹果的 AI ASIC 芯片 Baltra 也将面世,面前由博通负责高速互联,SerDes IP 以及后端布线,瞻望 2026 年上半年进入流片阶段。

岛主直播系统 起点

表 4:ASIC 阵营的 CoWoS 产能预订和分拨情况

比拟之下,由于 AWS 下一代 Trainium 3 转单世芯(Al chip),Marvell 显得比较失落,主要客户照旧 AWS 的 Trainium 2,好在新客户微软取舍 N3E 制程的 Maia 200 加入,才幸免了下滑,CoWoS 预定量与 2025 年持平。

世芯由于拿到了 AWS Trainium 3 订单,CoWoS 预订量飞腾到 60k,同比增多 200%,大部分预定产能为 N3 制程的 Trainium 3 Anita,加上 Inferentia 2、微软 Maia 100 以及少许的 Intel Gaudi 3。

Annapurna 行动 AWS 的子公司,一直承担 AI ASIC 建筑任务,同期也向台积电径直预定 CoWoS 产能,Trainium 3 的 Mariana 版块有别于 Al chip 的 Anita 版块,同期在台积电投片。

联发科是台积电 2026 年 CoWoS 的新进客户,面前已调拨巨额东说念主力赈济ASIC 业务——异日将成为联发科的要点板块—— 2026 年下半年主要承担侧重推理的 TPU v7e 的出货,并在 2027 年行动出货主力年,同期 2027 年将重复 TPU v8e 的订单,有契机出现 600% 的 CoWoS 同比增幅。

字据咱们了解到的情况,联发科面前已将 AI ASIC 视为异日中枢业务,行动行业巨头,其布局 AI 芯片将很大影响面前 ASIC 野心的行业样子。

剩下的台积电 CoWoS 客户的量级齐小于 1 万片,其中微软自研 ASIC Athena 的早期野心与流片照旧微软我方的团队在小批量鼓励中。

有了产能的分拨数据,基于硅中介层面积,大致就能算出来,2026 年,各家能够出若干颗 GPU/ASIC 芯片。

咱们假定英伟达的 660000 片晶圆当中,10% 分拨给 Hopper 架构,即6.6 万片,按单片切 29 颗来运筹帷幄,瞻望本年举座 H200 的产出量不错达到 190 万颗。

回看举座台积电举座产能分拨,拿下总计 75 万片 CoWoS 产能的 GPGPU 阵营(NV+AMD),在面对还只好 37 万片产能的 ASIC 阵营时,照旧领有满盈的火力上风,以至英伟达一家的火力就起先全球其他企业的总和。

03 算力、营收:GPGPU 具备碾压上风

CoWoS 是一个要津变量,但仅比较 CoWoS 照旧会误判战局——不同的封装决策,比如 single-die 以及 dual-die 决策,将导致中介层面积出现很大的不同。

以 Hopper 为例,由于取舍 single-die,一派 CoWoS 晶圆不错切 29 颗,到了 Blackwell 由于取舍 dual-die 决策,每片晶圆只可切 14 颗。

是以,台积电 CoWoS 的产能增幅,不可单纯界说为 AI 芯片出货量的增多,也要磋议 CoWoS 硅中介层面积不断放大的增量。

岛主直播系统 起点

从 CoWoS 到 SoW,光罩面积及中介层变化,开首:台积电

前边表 1 有提到,硅中介层面积越来越大的变化趋势,是 AI 芯片明确的本事道路,面前中介层面积是光罩面积的 3.3x,2026 年的 Rubin 将升迁到是 4~5.5x,而 2027 年 4-die 合封的 Rubin Ultra 将达到 9~9.5x。

因此,以 CoWoS 的产能(销耗面积)增、减幅度来运筹帷幄企业营收增、减幅度更为准确。

是以,这场 AI 芯片构兵的主导成分,除了要看谁销耗了更多的 CoWoS 产能,也要看谁孝敬了更多的算力,以及谁创造了更多的营收和利润。

算力维度的比较相称直不雅,一颗英伟达 B300 的 FP8 算力达 10PFLOPS,而一颗定制推理 ASIC 的算力可能仅为其几分之一,即等于最强的 TPU v7p 也只好英伟达 B300 的一半,这莫得将本年要推出的 Rubin 磋议在内。

就在 2026 年 1 月 6 日开幕的 CES 上,老黄说 Rubin 的性能比 Blackwell 在推理升迁 5 倍,查考升迁了 3.5 倍,言外之味是 GPU 与 ASIC 的性能差距并莫得放松。

从算力维度不错得出论断——即使 CoWoS 切出来的芯片颗数接近,GPGPU 阵营的总算力很可能仍大幅起先,这是 GPU 通用架构的"蛮力"上风——来自 CoWoS 销耗面积(晶体管)的多寡。

价值维度的比较则更为粗暴,英伟达单颗 GPU 售价高达 3 万好意思元以上,异日会升迁到 4-5 万好意思元。云巨头自研 ASIC 芯片的"成本"即便与 GPU 接近,"里面结算价"确定卖不到 GPGPU 的商场价钱。

以 Anthropic 向博通采购 210 亿好意思元的 100 万颗 TPU 为例,扣除职业器等诸多设立,单颗对外销价在 1.5 万好意思元以下,不到英伟达 Blackwell 系列的一半。

结划算力和价值两个点,不错更明确的得出论断—— AI 芯片是多维度的比拼,不只单比摩尔定律、比芯片工艺制程,还要比谁的面积更大,能放进更多晶体管,最终表当今性能上的离别,也决定了价钱。

英伟达用 60% 的 CoWoS 产能,创造通盘这个词 AI 加快芯片商场 70% 以上的收入和 90% 以上的利润,这才是著作发轫黄仁勋" 6 个季度,5000 亿好意思元"的底气。

04 ASIC 的内容:优化财务报表

英伟达的上风,CUDA 就无谓说了,常常被忽略掉的是搭配的 NVLink、NVSwitch 所组成的系统级上风,用户买的不是芯片,而是一整套最强的"交钥匙"措置决策。

行动对比,ASIC 芯片上风在于,云厂这类超大限制用户,当其软件栈完全自控且责任负载高度特化且平稳(如搜索推选、告白排行、语音识别推理),自研能带来极致的总领有成本(TCO)优化。

不错这么说:AISC 要讲的故事——专用化疏导"去英伟达化",最终优化财务报表。是以,能不可用 ASIC 的要津只好一丝,限制(量)够不够大,莫得其他。

起先,自研 ASIC 的资金、东说念主力插足远大;其次,低廉的 TPU 可不是买来就径直能用的,像 Anthropic 向博通采购 210 亿好意思元径直采购谷歌 TPU 的决策,背后也需要设立一支极为强劲的底层系统工程师团队,并不断进行深度迁徙及适配。

是以,只是开支这一项,也决定了 ASIC 只好超大型云厂、超大限制企业才会使用,但即等于购买现成 ASIC 芯片,也就能拓展到 Anthropic 这体量的大模子企业,很难再往下了。

再者,面前头部 AI 集群的功耗已从几十千瓦迈向兆瓦级,异日芯片功耗将飙升至数千瓦,广博客户无法承受这种限制。而况,在风冷已到极限,液冷(包括冷板、浸没式)成为标配的配景下,数据中心的物理野心和最大集群限制,齐是必须抽象考量的成分。

另外,GPGPU 与 AISC 两者的较量也不限于单芯片,基于 CPO 共封装来措置"功耗墙"和"互连墙",这种系统级的决策,以及华为的 384 颗 NPU 互连的 CloudMatrix 384 这种系统架构鼎新,也齐至关蹙迫。

是以,CoWoS 只是起始,更表层的互连网罗(NVLink, CXL, UCIe)、光引擎(CPO)齐是竞争的要津变量。

而这些变量所需要的普遍成本开销,齐不是小厂不错承受的。

05 终端推演:军火商大赢家

现阶段英伟达为代表的 GPGPU(通用图形处理器)商场,固然部分被侵蚀,但跟着物理 AI 这些界限的鼓励,在可见的 3-5 年,英伟达仍将总揽 AI 查考商场和高性能通用运筹帷幄商场(查考、新兴诈欺、中小企业、科研)。

可是,推理占据异日 AI 算力践诺销耗的大头,且责任负载更固定,恰是 ASIC 的用武之地,ASIC 的势头只会越来越好。

是以人人会看到,为了加固"护城河",英伟达斥资 200 亿好意思元收购 Groq,意图将 LPU 融入我方的本事矩阵中。

与此同期,英伟达也在通过推出更细分界限的家具,如推理专用芯片、更纯简直订阅模式(DGX Cloud)、以及更强劲的系统级措置决策(如 NVL144/288/576),来叮嘱 ASIC 的"包围"。

面前的英伟达依旧处于成心位置,依旧掌持着" AI 芯片构兵"的主动权,他们要措置的中枢问题——市占率与毛利的均衡。

只须英伟达不信守极高的毛利率,舒坦断送毛利疏导商场,他照旧锐不可挡的王者。

ASIC 生态下,谷歌 TPU 外供,鲜艳着 ASIC 从"观点"和"试点"认真迈入"限制化部署",其增长径直与这些云巨头的成本开支绑定。

只须巨头们接续投资 AI 基础方法,且自研芯片的 TCO 上风接续存在,ASIC 芯片对 CoWoS 需求就会接续增长。博通,联发科,Marvell 行动顶级野心职业商将接续受益。

好多东说念主会关注,GPGPU 和 ASIC 对 CoWoS 产能需求变化?

从家具进化的角度来看,2026 年的 Rubin 架构家具,率先取舍 5.5x 光罩面积的中介层,2027 年很快会鼓励到 9.5x,ASIC 家具的满盈性能莫得 GPGPU 那般极致条目,2026 年预估也就在 3.3x,以至在 2027 年也梗概率还如斯。是以论断基本亦然明确的:异日 GPGPU 对 CoWoS 产能的预定量会大幅度增长。

而回到最终芯片的数目上,由于 ASIC 芯片的中介层普遍在 2500mm²,单片 CoWoS 晶圆切出来的芯片数目,是 GPGPU 的两倍,而 GPGPU 面前 CoWoS 预定量是 ASIC 的两倍,是以本年两种类型 AI 芯片的全球出货量,也就大体相称。

至于企业营收,那就与 CoWoS 出货量成正比了,因为性能与面积(晶体管总额)成正比,同制程双颗的 dual-die 性能势必高于 single-die 的芯片。

是以,异日咱们更可能看到的是一个 " GPU+ASIC "的混划算力天下:云巨头用英伟达 GPU 进行前沿模子研发和查考,同期用自研 ASIC 进行成本明锐的大限制推理部署。

换句话说,这场构兵并非一场你死我活的歼灭战,而是一场耐久且复杂的"划界构兵"。

但不管两种生态样子如何岛主直播系统 起点,行动这场芯片战共同且惟一的"军火商",台积电坐拥 CoWoS 产能的订价权,将是无论哪一方告捷齐不可或缺的终极大赢家。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享