对话工业级3D打印叠序宇宙COO曲先生:英伟达H200叩门,散热的课谁来补

5月22日下午,我们在苏州一栋科技园的楼里见到了工业级3D打印新势力企业叠序宇宙的COO曲先生。他的办公室不大,桌上散落着几个金属块——拿在手里才能看出端倪:极其复杂的内部水路像毛细血管一样交错。“这是我们给一家云厂商打的液冷模块样品。”他递过来,“看着还行吧?”

前一天,英伟达刚发布Q1财报:816亿美元,同比增长85%。同一天,美国商务部批准10家中国企业采购H200。AI圈一片欢呼。

曲先生的反应有点扫兴:“好消息。但我高兴完了想的是——H200来了,给H200散热的冷板,国内有几个厂商能做?”

这句话成了接下来两个小时对话的起点。

记者:您这个说法挺泼冷水的。大家都觉得H200进中国是重大利好,您第一反应是“散热跟得上吗”?

曲先生:不是泼冷水,可能我做制造业做久了,习惯了先看这件事能不能落地。

H200的TDP是700W,实际运行我们预计800W到1000W,这还只是开始,下一代B200可能奔着1200W去。国内绝大多数数据中心的基础设施是按700W的标准设计的。H200装进去,不是不能用,是跑不满。

记者:跑不满是什么意思?大家可能不理解。

曲先生:就是花30万买一张H200,因为散热不行,实际只能跑出25万的性能。中间的差价,我管它叫“算力税”。

记者:算力税?

曲先生:芯片温度高了会自动降频,这是保护自己的机制,叫thermal throttling。比如某个区域温度超过了阈值,那个区域的频率就会降下来,算力就打折了。H200对均温性的要求更苛刻——芯片表面温差不能超过2度,否则热点区域就会触发降频。你看着买了一张100分的卡,实际跑出来70分、80分。这个损失,很多人没算过账。

记者:国内液冷产业链现在到底什么水平?能具体说吗?

曲先生:十个字吧,中低端很强,高端有短板。CDU、管路这些国内厂商做得不错,英维克、高澜都很强。但高端冷板——直接贴在GPU上那个最关键的部件——面向800W以上的精密微通道冷板,说实话,国产化率可能不到20%。

记者:不到20%?

曲先生:对。高端冷板的精密制造,主要靠CNC——五轴精密机床加工微通道。全球顶级的五轴机床,德国的、日本的、瑞士的,国产有进步但在精度和稳定性上还有差距。而且高端机型出口是管制的。这就卡死了:即便你有设计能力,也可能因为没有设备而做不出来。

记者:那为什么不买国外的冷板?

曲先生:CoolIT、Motivair这些海外供应商当然能做,贵不说——关键是,冷板是“基建”。你选定一个供应商,整个数据中心的管路接口、CDU参数、运维流程都是围绕它适配的。一旦批量部署,再想换供应商,切换成本极高。如果高端冷板的供应链始终捏在海外手里,算力自主可控就始终缺了一块。

记者:平时看不见,出了问题才致命。

曲先生:对。平时看不见。

记者:叠序是做什么的?

曲先生:我们用金属3D打印直接造液冷模块。3D打印做的是加法——从金属粉末一层一层长出来,理论上几乎没有形状限制。水路可以贴着芯片的发热面随形走:热点密的地方水路加密、加弯,低温区稀疏布设省流阻。这个叫随形冷却。

记者:效率提升多少?

曲先生:我们实测的数据,冷却效率提升40%。

记者:40%怎么来的?三个原因?

曲先生:(想了想)换热面积增加是第一个——基于最优路径,随形水路在三维空间任意弯折,换热面积是传统直槽的2到3倍,目前3D打印是唯一能突破传统散热性能极限的方式。第二个是热阻降低——传统冷板水路和芯片表面隔着1到2毫米金属基板,随形冷却可以把这个距离压到0.3毫米以下。第三个是均温性——传统直槽“入口凉、出口热”,温差3到5度;随形通过分叉汇流,可以把温差压到1.5度以内。

记者:这三个因素哪个贡献最大?

曲先生:不好说。不同场景权重不一样。如果是热点特别集中的芯片,热阻降低的贡献更大;如果是发热均匀的芯片,换热面积的贡献更大。一般来说,三个因素的叠加效应比较均衡。

记者:3D打印的精度够吗?冷板要直接贴在GPU上,对平整度、尺寸精度要求都很高。

曲先生:这个我们也走过弯路。早期3D打印的精度确实不行,表面粗糙度太高,直接影响和GPU的接触。后来我们在设备上加了AI视觉闭环监控——实时监控每一层的打印质量,有缺陷自动修正。这样可以保证打印质量,叠加我们的精加工技术,尺寸精度粗糙度等已不是问题。

记者:客户是谁?

曲先生:数据中心运营商、云厂商、智算中心建设方。目前我们在谈的有几家,具体名字不方便说,签了保密协议。但其实也可以理解——谁建智算中心,谁就是我们的潜在客户。

记者:他们买单的意愿强吗?3D打印冷板的成本比传统CNC高多少?

曲先生:成本确实是个问题。单件成本目前还是比CNC高的,大概高30%到50%。但我们算的不是单件账,是总账。

记者:怎么说?

曲先生:第一,40%的冷却效率提升,放在一个万卡集群里,每年省下来的电费可能就有几千万。第二,迭代速度——H200之后还有B200,CNC重新设计冷板要数周,我们修改数字模型数天就能打样。第三,供应链安全——如果哪天高端CNC设备被进一步管制,3D打印这条线是通的。这三笔账加起来,很多客户觉得值得。

记者:您说“算力自主可控不能只算芯片账,还得算散热账”。这个话您跟政策层面的人聊过吗?他们有什么反应?

曲先生:聊过一些。坦率说,大部分人第一反应是“哦,散热也很重要”,然后就没有然后了。

记者:感觉您的语气有些无奈?

曲先生:不是失望,可能我表达得还不够有力。但我确实认为,液冷模块应该被列入AI算力基础设施的关键零部件清单。一个智算中心投几十个亿,如果冷板出问题,整个集群的ROI都受影响。而且2025到2028年是智算中心建设高峰,如果现在不布局国产化,到时候再想补就来不及了。

记者:您觉得阻力在哪?

曲先生:散热的叙事不够“性感”吧。芯片可以讲国产替代、讲卡脖子,EDA可以讲软件自主,光刻机可以讲大国重器。液冷板……一块金属板子,里面刻了几条水路,怎么讲都觉得像后勤部门的事。

记者:但您觉得这其实是战略问题。

曲先生:对。散热不是后勤问题,是战略问题。你买再多H200,如果散热跟不上,就是一堆跑不满的芯片。跑不满的芯片,就是不完整的基础设施。

记者:黄仁勋说中国市场可能给英伟达带来500亿美元商机。您怎么看这个数字?

曲先生:(沉默了几秒)500亿美元是英伟达的收入。但我们要真正兑现这500亿美元芯片的价值,可能还要再花几十亿、上百亿建配套的散热系统。

如果这些散热系统还是依赖海外供应商,那我们算力自主可控的拼图,就始终缺了一块。

记者:最后一句留给您。您最想对行业说的话是什么?

曲先生:H200进来了,大家高兴是应该的。但高兴完了,别忘了修“路”——给芯片散热的路。修好了,芯片才能跑到终点。

【后记】

采访结束后,曲先生送我们到楼下。苏州的五月天已经开始闷热,他指了指园区里正在施工的一栋新楼:“那是我们的二期厂房,年底投产。到时候产能能翻三倍。”

【公司介绍】

叠序宇宙是技术创新驱动的工业级3D打印高科技公司,深耕航空航天、医疗健康、新能源汽车等高价值赛道。依托国际化团队在智控、AI视觉、具身智能 等领域的深厚积累,叠序宇宙实现复杂结构件的高效、绿色、低成本生产,推动增材制造从高端定制走向规模化量产。立足中国、布局全球,叠序宇宙致力于成为全球领先的工业级3D打印解决方案提供商,通过技术创新与生态协同,成为核心领域客户的首选合作伙伴,让复杂制造触手可及。


环球时讯 » 对话工业级3D打印叠序宇宙COO曲先生:英伟达H200叩门,散热的课谁来补

发表评论