找回密码
 立即注册
搜索
查看: 32|回复: 0

NVIDIA 液冷生态分析及73家供应商全景名单

[复制链接]

409

主题

398

回帖

2473

积分

金牌会员

积分
2473
发表于 5 天前 | 显示全部楼层 |阅读模式
一、NVIDIA 液冷战略定位
核心目标:解决算力密度瓶颈:单颗 H100 GPU 功耗达 700W,风冷散热极限告破  
推动绿色计算:液冷助力数据中心 PUE 降至 **1.08以下**(NVIDIA DGX SuperPOD 实测值)  
构建开放标准:主导 **SFF-TA-1001** 接口规范,统一冷板/快拆接头设计  
二、技术架构:三层液冷生态
1. 硬件层:GPU 直接冷却
组件
技术方案
性能提升
GPU 冷板
微通道铜合金(热导率 400W/m·K)
芯片结温降低 15°C(vs 风冷)
快拆接头
CPC A系列(泄漏率 <10⁻⁶ cc/s)
支持热插拔维护
导热界面材料
液态金属(Shin-Etsu X系列)
热阻降低 40%
2. 系统层:机柜级液冷方案
NVIDIA DGX Liquid Cooled:单柜支持 8×H100 GPU + 2×CPU,总散热能力20kW; CDU(冷却分配单元)流量智能调节(±2%精度)  
HGX 参考设计: 提供 冷板管路拓扑图,规范流速(≥4L/min/GPU)与压降(<1.5Bar)  
3. 基础设施层:数据中心集成
Coolant Distribution Unit (CDU):  
合作伙伴方案:Vertiv™ Liebert® DCE、Schneider LiquidTank™ 支持乙二醇水溶液(冻结点 -35°C)或 介电流体
热回收系统:  输出 60°C 热水(Facebook 鹿角数据中心实践)  
三、NVIDIA 自研技术突破
1. 异构冷却架构
GPU 冷板 + CPU 冷板 + 内存条液冷:  统一管路设计,温差控制 ≤5°C(NVLink 稳定运行关键)  
VRM 供电模块液冷:防止 1000A 电流下的热点问题  
2. 智能管理系统
NVCool™ 控制平台:  实时监测 10,000+ 传感器(温度/流量/泄漏) ,AI 预测性调节(如:算力突增时提前增压)  
数字孪生模型:   基于 Omniverse 的流体动力学仿真  
3. 标准化推进
SFF-TA-1001 规范:定义冷板接口尺寸(80×60mm)、O形圈材料(FKM氟橡胶)  
开放冷板设计包:提供 H100/A100 的 CAD 模型及热仿真数据  
四、未来布局
1. Blackwell GPU 液冷升级:预计功耗1200W/GPU,采用 两相蒸发冷却(热通量 >100W/cm²),集成热电发生器(TEG),废热回收发电  
2. 液冷云服务:DGX Cloud提供液冷算力租用(微软Azure/AWS 已部署)  
3. 可持续性创新 :与 壳牌合作开发生物基冷却液(碳足迹降低 50%)  

以下是基于全球数据中心液冷行业调研(2023-2024)整理NVIDIA合作标识的87家液冷供应商全景名单
一、系统集成与服务器厂商(32家)
国家/地区
企业
技术路线
代表产品
NVIDIA合作级别
美国(8家)
Vertiv
机柜级CDU集成
Liebert® DCE for DGX H100  
DGX Ready(战略级)

Dell Technologies
冷板式服务器
PowerEdge XE9680 (8×H100)  
DGX Ready  

HPE
超算液冷机柜
Cray EX4000
HGX参考设计

Supermicro
GPU液冷服务器
SYS-821GE-TNHR (HGX H100)
OVX平台认证

GRC
单相浸没式
CarnoJet™
OAM模组兼容  

CoolIT Systems
直接芯片冷却(D2C)
Rack D2C
A100/H100官方合作

Motivair
两相蒸发冷却
LiquidStorm™
Blackwell GPU试验  

Ebullient
模块化两相冷却
超算冷却模块
技术合作  
中国(10家)浪潮信息
HGX冷板式服务器  
NF5688G7 (8×H100)   
HGX认证主力厂商

华为
间接冷却机柜
FusionModule
DGX Ready  

中科曙光
浸没相变
ParaCool液冷服务器
超算战略合作

宁畅
混合冷却
X640 G50 LP (GPU液冷+CPU风冷)  
HGX参考设计

新华三
机柜级CDU集成
UniServer R5300 G6液冷版
OVX兼容

联想
冷板式服务器
ThinkSystem SD650 V3
NVIDIA认证系统

超聚变(2023新增)
全浸没式机柜
FusionPoD for AI
供应链合作


安擎科技(2023新增)
GPU液冷定制
EG860G-G30液冷节点  
HGX设计兼容

坤前计算机(2023新增)
边缘液冷服务器
SR2110G-LC
Jetson边缘合作

宝德计算(2023新增)
自主冷板设计
PR2710P液冷服务器
A100/H100供应链
欧洲 (7家)
Schneider Electric (法)
浸没式基础设施
LiquidTank™   
HGX集群集成

Fujitsu (日)
浸没式循环系统
PRIMERGY CX400  
实验室合作

Alfa Laval (瑞典)
板式换热器集成
CDU超低流阻方案  
Meta项目供应商   

Bachmann (瑞士)
模块化冷却系统
MISSION Critical Cooling
欧洲超算合作

Atos(法)
液冷超算机柜
BullSequana XH2000
早期DGX合作方

Lenze(德)
泵驱动控制系统
变频CDU核心模块
二级供应商

Nor-Tech(英)
定制化液冷服务器
HPC/AI集群解决方案
区域分销伙伴
日韩 (5家)
Hitachi(日)
冷板+浸没混合
HA8000液冷系列
日本区域认证

NEC(日)
机柜级液冷
Express5800液冷型号
技术试验伙伴

Fujitsu(日)
浸没式循环系统
PRIMERGY CX400
重复项(全球布局)

Hanyang (韩)
两相蒸发冷却  
HY-Loop
技术试验伙伴

LG(韩)
边缘液冷方案
AI Edge液冷机箱
Jetson合作
其他(2家)
Wiwynn (台)
ODM液冷解决方案
英伟达HGX服务器代工
HGX参考设计制造商

Quanta/QCT (台)
超算液冷机柜
QuantaGrid D52B-1U
OCP合作成员
关键说明合作级别定义
DGX Ready:Vertiv/Dell/华为(支持DGX整机部署)  
HGX认证:浪潮/Supermicro/宁畅(符合HGX参考设计规范)  
供应链合作:超聚变/安擎(部件或代工服务)  
二、核心部件供应商(41家)
光模块与光通信(6家)
供应商
国家/地区
核心产品
技术亮点
合作级别
中际旭创
中国
1.6T硅光模块
英伟达80%份额,硅光良率95%
战略级主供
新易盛
中国
800G LPO光模块
能效比领先,H20芯片主力供应商
认证合作伙伴
天孚通信
中国
1.6T光引擎
Quantum交换机核心组件,CPO技术适配
一级供应商   
Coherent
美国
硅光子芯片
供应英伟达CPO方案基础光芯片
技术实验室合作
住友电工
日本
低损耗光纤
超低衰减(0.15dB/km)
基础设施供应商
II-VI
美国
磷化铟激光器
适配1.6T模块高温场景
二级供应商   
PCB与载板(7家)
供应商
国家/地区
核心产品
技术亮点
合作级别
胜宏科技
中国
OAM HDI板
独家供应GB300光学引擎板,单价提升30%+
HGX指定供应商
沪电股份
中国
22层高多层PCB
支持288GB HBM3E显存,北美份额80%
战略级主供
欣兴电子
中国台湾
ABF载板
突破40层工艺,良率90%+
先进封装核心伙伴
深南电路
中国
刚挠结合PCB
适配GB300交换机托盘
认证供应商
TTM科技
美国
军工级高频PCB
支持毫米波雷达GPU
自动驾驶领域合作
景旺电子
中国
22层服务器托盘板
通过英伟达Delta认证
二级供应商
Ibiden
日本
陶瓷基板
耐高温(>200°C)
H100/B200供应链
散热与液冷(8家)
供应商
国家/地区
核心产品
技术亮点
合作级别
CoolIT Systems
加拿大
直接芯片冷却(D2C)
Rack D2C方案适配A100/H100
官方合作  
Boyd
美国
微通道冷板
H100铜合金冷板,热导率400W/m·K
HGX参考设计指定
英维克
中国
CDU液冷系统
独家供应GB300液冷机柜
战略级供应商
高澜股份
中国
浸没式液冷模组
12U模组适配1400W GPU
认证合作伙伴  
川环科技
中国
PTFE液冷管路
UQD快接头通过英伟达认证
国产替代主力
方盛股份
中国
真空钎焊液冷板
翅片密度400目/英寸,适配GB300
Vertiv二级供应商  
双鸿科技
中国台湾
水冷散热模组
解禁H20订单主力
供应链复苏受益方
Aavid
美国
高密度翅片冷板
压降<0.1Bar
DGX系统集成商
电源与能源管理(5家)
供应商
国家/地区
核心产品
技术亮点
合作级别
麦格米特
中国
12kW高功率电源  
HVDC方案效率98%
官方指定供应商
台达电子
中国台湾
智能电源管理系统
适配DGX SuperPOD
基础设施合作   
江海股份
中国
超级电容调峰组件
替代传统UPS,节能30%
国内AI服务器认证
Artesyn
美国
冗余电源模块
支持N+1故障切换
边缘计算设备供应商
光宝科技
中国台湾
服务器冗余电源
80PLUS钛金认证
ODM代工伙伴
连接器与高速互连(6家)
供应商
国家/地区
核心产品
技术亮点
合作级别
嘉泽
中国台湾
PCIe 5.0插槽
支持600W GPU供电
主板核心供应商
沃尔核材
中国
800G DAC铜缆
占GB300份额50%,成本降40%
高速连接主供
TE Connectivity
瑞士
高压盲插接头
插拔寿命>10万次
工业级标准制定者
中航光电
中国
液冷快拆接头
±1mm容差设计
SFF-TA-1001兼容
Molex
美国
SAS4高速背板连接器
传输速率24Gbps
存储扩展设备供应商
安费诺
美国
光纤接口组件  
支持CPO封装
光通信领域合作
半导体材料与设备(9家)
供应商
国家/地区
核心产品
技术亮点
合作级别
和林微纳
中国
GPU测试探针
精度2μm,GB300芯片验证
核心检测设备供应商  
铂科新材
中国
金属磁粉芯
芯片电感独家供应商
软磁材料主供
长电科技
中国
2.5D先进封装
HBM与GPU互联带宽3.35TB/s
H200封装独家
台积电
中国台湾
4nm/3nm晶圆代工
Blackwell架构芯片量产
核心制造伙伴
SK海力士
韩国
HBM3E显存
堆叠层数12层
存储核心供应商
应用材料
美国
沉积与蚀刻设备
供应CoWoS封装产线  
设备与技术授权
ASM太平洋
中国香港
固晶设备
支持高精度Chiplet封装
二级设备供应商  
宏和科技
中国
极薄电子布
Dk≤2.8,适配GB300 PCB基材
二级材料供应商
信越化学
日本
光刻胶
EUV工艺良率提升
晶圆制造材料合作
其他核心部件(4家)
供应商
国家/地区
核心产品
技术亮点
合作级别
隆扬电子
中国
HVLP5+高频铜箔
适配AI服务器PCB
台光电二级供应商  
村田制作所
日本
高频MLCC
车规级耐温150°C
自动驾驶芯片供应商  
兆龙互连
中国
高速线束  
替代光模块降本方案
铜缆技术合作方  
精研科技
中国
散热结构件
芯片级微通道设计
散热模块二级供应商


本文来自网络等公开资料整理,仅作分享,不代表本人立场。如您认为平台推送文章侵犯了您的知识产权,请及时联系(411792714@qq.com),我们将第一时间删除。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表