|
一、NVIDIA 液冷战略定位 核心目标:解决算力密度瓶颈:单颗 H100 GPU 功耗达 700W,风冷散热极限告破
推动绿色计算:液冷助力数据中心 PUE 降至 **1.08以下**(NVIDIA DGX SuperPOD 实测值)
构建开放标准:主导 **SFF-TA-1001** 接口规范,统一冷板/快拆接头设计
二、技术架构:三层液冷生态
1. 硬件层:GPU 直接冷却
组件
| 技术方案
| 性能提升
| GPU 冷板
| 微通道铜合金(热导率 400W/m·K)
| 芯片结温降低 15°C(vs 风冷)
| 快拆接头
| CPC A系列(泄漏率 <10⁻⁶ cc/s)
| 支持热插拔维护
| 导热界面材料
| 液态金属(Shin-Etsu X系列)
| 热阻降低 40%
| 2. 系统层:机柜级液冷方案
NVIDIA DGX Liquid Cooled:单柜支持 8×H100 GPU + 2×CPU,总散热能力20kW; CDU(冷却分配单元)流量智能调节(±2%精度)
HGX 参考设计: 提供 冷板管路拓扑图,规范流速(≥4L/min/GPU)与压降(<1.5Bar)
3. 基础设施层:数据中心集成
Coolant Distribution Unit (CDU):
合作伙伴方案:Vertiv™ Liebert® DCE、Schneider LiquidTank™ 支持乙二醇水溶液(冻结点 -35°C)或 介电流体
热回收系统: 输出 60°C 热水(Facebook 鹿角数据中心实践)
三、NVIDIA 自研技术突破
1. 异构冷却架构
GPU 冷板 + CPU 冷板 + 内存条液冷: 统一管路设计,温差控制 ≤5°C(NVLink 稳定运行关键)
VRM 供电模块液冷:防止 1000A 电流下的热点问题
2. 智能管理系统
NVCool™ 控制平台: 实时监测 10,000+ 传感器(温度/流量/泄漏) ,AI 预测性调节(如:算力突增时提前增压)
数字孪生模型: 基于 Omniverse 的流体动力学仿真
3. 标准化推进
SFF-TA-1001 规范:定义冷板接口尺寸(80×60mm)、O形圈材料(FKM氟橡胶)
开放冷板设计包:提供 H100/A100 的 CAD 模型及热仿真数据
四、未来布局
1. Blackwell GPU 液冷升级:预计功耗1200W/GPU,采用 两相蒸发冷却(热通量 >100W/cm²),集成热电发生器(TEG),废热回收发电
2. 液冷云服务:DGX Cloud提供液冷算力租用(微软Azure/AWS 已部署)
3. 可持续性创新 :与 壳牌合作开发生物基冷却液(碳足迹降低 50%)
以下是基于全球数据中心液冷行业调研(2023-2024)整理NVIDIA合作标识的87家液冷供应商全景名单
一、系统集成与服务器厂商(32家)
国家/地区
| 企业
| 技术路线
| 代表产品
| NVIDIA合作级别
| 美国(8家)
| Vertiv
| 机柜级CDU集成
| Liebert® DCE for DGX H100
| DGX Ready(战略级)
|
| Dell Technologies
| 冷板式服务器
| PowerEdge XE9680 (8×H100)
| DGX Ready
|
| HPE
| 超算液冷机柜
| Cray EX4000
| HGX参考设计
|
| Supermicro
| GPU液冷服务器
| SYS-821GE-TNHR (HGX H100)
| OVX平台认证
|
| GRC
| 单相浸没式
| CarnoJet™
| OAM模组兼容
|
| CoolIT Systems
| 直接芯片冷却(D2C)
| Rack D2C
| A100/H100官方合作
|
| Motivair
| 两相蒸发冷却
| LiquidStorm™
| Blackwell GPU试验
|
| Ebullient
| 模块化两相冷却
| 超算冷却模块
| 技术合作
| 中国(10家) | 浪潮信息
| HGX冷板式服务器
| NF5688G7 (8×H100)
| HGX认证主力厂商
|
| 华为
| 间接冷却机柜
| FusionModule
| DGX Ready
|
| 中科曙光
| 浸没相变
| ParaCool液冷服务器
| 超算战略合作
|
| 宁畅
| 混合冷却
| X640 G50 LP (GPU液冷+CPU风冷)
| HGX参考设计
|
| 新华三
| 机柜级CDU集成
| UniServer R5300 G6液冷版
| OVX兼容
|
| 联想
| 冷板式服务器
| ThinkSystem SD650 V3
| NVIDIA认证系统
|
| 超聚变(2023新增)
| 全浸没式机柜
| FusionPoD for AI
| 供应链合作
|
| 安擎科技(2023新增)
| GPU液冷定制
| EG860G-G30液冷节点
| HGX设计兼容
|
| 坤前计算机(2023新增)
| 边缘液冷服务器
| SR2110G-LC
| Jetson边缘合作
|
| 宝德计算(2023新增)
| 自主冷板设计
| PR2710P液冷服务器
| A100/H100供应链
| 欧洲 (7家)
| Schneider Electric (法)
| 浸没式基础设施
| LiquidTank™
| HGX集群集成
|
| Fujitsu (日)
| 浸没式循环系统
| PRIMERGY CX400
| 实验室合作
|
| Alfa Laval (瑞典)
| 板式换热器集成
| CDU超低流阻方案
| Meta项目供应商
|
| Bachmann (瑞士)
| 模块化冷却系统
| MISSION Critical Cooling
| 欧洲超算合作
|
| Atos(法)
| 液冷超算机柜
| BullSequana XH2000
| 早期DGX合作方
|
| Lenze(德)
| 泵驱动控制系统
| 变频CDU核心模块
| 二级供应商
|
| Nor-Tech(英)
| 定制化液冷服务器
| HPC/AI集群解决方案
| 区域分销伙伴
| 日韩 (5家)
| Hitachi(日)
| 冷板+浸没混合
| HA8000液冷系列
| 日本区域认证
|
| NEC(日)
| 机柜级液冷
| Express5800液冷型号
| 技术试验伙伴
|
| Fujitsu(日)
| 浸没式循环系统
| PRIMERGY CX400
| 重复项(全球布局)
|
| Hanyang (韩)
| 两相蒸发冷却
| HY-Loop
| 技术试验伙伴
|
| LG(韩)
| 边缘液冷方案
| AI Edge液冷机箱
| Jetson合作
| 其他(2家)
| Wiwynn (台)
| ODM液冷解决方案
| 英伟达HGX服务器代工
| HGX参考设计制造商
|
| Quanta/QCT (台)
| 超算液冷机柜
| QuantaGrid D52B-1U
| OCP合作成员
| 关键说明合作级别定义
DGX Ready:Vertiv/Dell/华为(支持DGX整机部署)
HGX认证:浪潮/Supermicro/宁畅(符合HGX参考设计规范)
供应链合作:超聚变/安擎(部件或代工服务)
二、核心部件供应商(41家)
光模块与光通信(6家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 中际旭创
| 中国
| 1.6T硅光模块
| 英伟达80%份额,硅光良率95%
| 战略级主供
| 新易盛
| 中国
| 800G LPO光模块
| 能效比领先,H20芯片主力供应商
| 认证合作伙伴
| 天孚通信
| 中国
| 1.6T光引擎
| Quantum交换机核心组件,CPO技术适配
| 一级供应商
| Coherent
| 美国
| 硅光子芯片
| 供应英伟达CPO方案基础光芯片
| 技术实验室合作
| 住友电工
| 日本
| 低损耗光纤
| 超低衰减(0.15dB/km)
| 基础设施供应商
| II-VI
| 美国
| 磷化铟激光器
| 适配1.6T模块高温场景
| 二级供应商
| PCB与载板(7家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 胜宏科技
| 中国
| OAM HDI板
| 独家供应GB300光学引擎板,单价提升30%+
| HGX指定供应商
| 沪电股份
| 中国
| 22层高多层PCB
| 支持288GB HBM3E显存,北美份额80%
| 战略级主供
| 欣兴电子
| 中国台湾
| ABF载板
| 突破40层工艺,良率90%+
| 先进封装核心伙伴
| 深南电路
| 中国
| 刚挠结合PCB
| 适配GB300交换机托盘
| 认证供应商
| TTM科技
| 美国
| 军工级高频PCB
| 支持毫米波雷达GPU
| 自动驾驶领域合作
| 景旺电子
| 中国
| 22层服务器托盘板
| 通过英伟达Delta认证
| 二级供应商
| Ibiden
| 日本
| 陶瓷基板
| 耐高温(>200°C)
| H100/B200供应链
| 散热与液冷(8家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| CoolIT Systems
| 加拿大
| 直接芯片冷却(D2C)
| Rack D2C方案适配A100/H100
| 官方合作
| Boyd
| 美国
| 微通道冷板
| H100铜合金冷板,热导率400W/m·K
| HGX参考设计指定
| 英维克
| 中国
| CDU液冷系统
| 独家供应GB300液冷机柜
| 战略级供应商
| 高澜股份
| 中国
| 浸没式液冷模组
| 12U模组适配1400W GPU
| 认证合作伙伴
| 川环科技
| 中国
| PTFE液冷管路
| UQD快接头通过英伟达认证
| 国产替代主力
| 方盛股份
| 中国
| 真空钎焊液冷板
| 翅片密度400目/英寸,适配GB300
| Vertiv二级供应商
| 双鸿科技
| 中国台湾
| 水冷散热模组
| 解禁H20订单主力
| 供应链复苏受益方
| Aavid
| 美国
| 高密度翅片冷板
| 压降<0.1Bar
| DGX系统集成商
| 电源与能源管理(5家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 麦格米特
| 中国
| 12kW高功率电源
| HVDC方案效率98%
| 官方指定供应商
| 台达电子
| 中国台湾
| 智能电源管理系统
| 适配DGX SuperPOD
| 基础设施合作
| 江海股份
| 中国
| 超级电容调峰组件
| 替代传统UPS,节能30%
| 国内AI服务器认证
| Artesyn
| 美国
| 冗余电源模块
| 支持N+1故障切换
| 边缘计算设备供应商
| 光宝科技
| 中国台湾
| 服务器冗余电源
| 80PLUS钛金认证
| ODM代工伙伴
| 连接器与高速互连(6家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 嘉泽
| 中国台湾
| PCIe 5.0插槽
| 支持600W GPU供电
| 主板核心供应商
| 沃尔核材
| 中国
| 800G DAC铜缆
| 占GB300份额50%,成本降40%
| 高速连接主供
| TE Connectivity
| 瑞士
| 高压盲插接头
| 插拔寿命>10万次
| 工业级标准制定者
| 中航光电
| 中国
| 液冷快拆接头
| ±1mm容差设计
| SFF-TA-1001兼容
| Molex
| 美国
| SAS4高速背板连接器
| 传输速率24Gbps
| 存储扩展设备供应商
| 安费诺
| 美国
| 光纤接口组件
| 支持CPO封装
| 光通信领域合作
| 半导体材料与设备(9家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 和林微纳
| 中国
| GPU测试探针
| 精度2μm,GB300芯片验证
| 核心检测设备供应商
| 铂科新材
| 中国
| 金属磁粉芯
| 芯片电感独家供应商
| 软磁材料主供
| 长电科技
| 中国
| 2.5D先进封装
| HBM与GPU互联带宽3.35TB/s
| H200封装独家
| 台积电
| 中国台湾
| 4nm/3nm晶圆代工
| Blackwell架构芯片量产
| 核心制造伙伴
| SK海力士
| 韩国
| HBM3E显存
| 堆叠层数12层
| 存储核心供应商
| 应用材料
| 美国
| 沉积与蚀刻设备
| 供应CoWoS封装产线
| 设备与技术授权
| ASM太平洋
| 中国香港
| 固晶设备
| 支持高精度Chiplet封装
| 二级设备供应商
| 宏和科技
| 中国
| 极薄电子布
| Dk≤2.8,适配GB300 PCB基材
| 二级材料供应商
| 信越化学
| 日本
| 光刻胶
| EUV工艺良率提升
| 晶圆制造材料合作
| 其他核心部件(4家)
供应商
| 国家/地区
| 核心产品
| 技术亮点
| 合作级别
| 隆扬电子
| 中国
| HVLP5+高频铜箔
| 适配AI服务器PCB
| 台光电二级供应商
| 村田制作所
| 日本
| 高频MLCC
| 车规级耐温150°C
| 自动驾驶芯片供应商
| 兆龙互连
| 中国
| 高速线束
| 替代光模块降本方案
| 铜缆技术合作方
| 精研科技
| 中国
| 散热结构件
| 芯片级微通道设计
| 散热模块二级供应商
|
本文来自网络等公开资料整理,仅作分享,不代表本人立场。如您认为平台推送文章侵犯了您的知识产权,请及时联系(411792714@qq.com),我们将第一时间删除。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|