訂閱
糾錯
加入自媒體

國產(chǎn)超節(jié)點擂臺賽,華為、阿里、曙光上演三強爭霸

2025-11-07 15:11
熱點微評
關注

2025年,國產(chǎn)超節(jié)點玩家開場即沸騰,華為、阿里、中科曙光等廠商拾階而上,儼然把中國智算集群玩出國際新高度。

近日,繼昇騰384、磐久AL128連續(xù)刷新行業(yè)紀錄,曙光最新操刀的全球首個單機柜級640卡超節(jié)點——scaleX640粉墨登場,一舉將算力集成度抬升至384超節(jié)點的20倍,順利接棒磐久AL128開啟守擂環(huán)節(jié)。

本文謹遵照發(fā)布時間排序及各家廠商披露信息,逐一對三大超節(jié)點產(chǎn)品展開盤點(由于產(chǎn)品迭進節(jié)奏差異,部分產(chǎn)品或已更新性能指標,以下盤點不分高下只論異同)。

華為昇騰384,垂直路線一枝獨秀

昇騰384超節(jié)點Atlas 900 A3 SuperPoD基于分布式多框集群設計與靈衢(LingQu)光互聯(lián)為架構核心,彼時堪稱業(yè)界最大規(guī)模高速總線互聯(lián)超節(jié)點,創(chuàng)新性集成384顆昇騰NPU和192顆鯤鵬CPU,成功打破AI算力互聯(lián)瓶頸,并同時滿足了AI計算和通用計算需求。

其優(yōu)勢在于“以網(wǎng)聯(lián)算”的技術路徑出神入化,基于高速互聯(lián)總線讓超節(jié)點像一臺計算機一樣工作,實現(xiàn)“一卡一專家”并行推理,追求極致的是互聯(lián)性能。不過在加速卡選擇上,384超節(jié)點僅支持昇騰910C加速卡,并完全圍繞CANN進行生態(tài)建設,適配范圍相對狹窄。

目前,384開始側重于“硬件聚焦,軟件開放”策略。硬件層面從昇騰NPU、鯤鵬CPU到靈衢總線,構建完整的國產(chǎn)技術體系。軟件層面,華為將核心的CANN計算架構、MindSpore深度學習框架等開放給社區(qū),以號召更好開發(fā)者補全生態(tài)短板。

阿里磐久AL128,軟硬協(xié)同全棧優(yōu)化專家

磐久AL128超節(jié)點在云棲大會上展示了其極致密度集成能力的突破。如傳統(tǒng)服務器機柜通常支持數(shù)十個AI計算芯片,而磐久128彼時刷新了單柜支持128個加速卡的紀錄,算力集成度可換算為384超節(jié)點的4倍。

高密度集成背后是散熱技術的突破。據(jù)悉,該產(chǎn)品采用單相浸沒式液冷技術,散熱效率比傳統(tǒng)風冷提升3倍,使數(shù)據(jù)中心PUE可低至 1.09,同時冷卻系統(tǒng)節(jié)能 30%,占地面積減少 50%。

這一技術解決了高密度計算帶來的熱量積聚問題,確保芯片在最佳溫度下持續(xù)高性能運行。

不過,最讓同行服氣的還是阿里的軟硬件協(xié)同優(yōu)化能力。磐久AL128超節(jié)點與阿里云自研的 HPN 8.0 高性能網(wǎng)絡、CPFS 并行文件存儲以及人工智能平臺 PAI 深度集成,形成了從底層硬件到上層應用的垂直優(yōu)化體系,通義千問模型基于此實現(xiàn)訓練端到端加速比3倍提升。

曙光scaleX640,開放式架構的巔峰之作

曙光scaleX640超節(jié)點幾乎代表了現(xiàn)階段計算集群規(guī)模極限。該產(chǎn)品作為世界首個單機柜級640卡超節(jié)點,是面向萬億參數(shù)大模型,基于AI計算開放架構設計的新一代大規(guī)模、高效率智算基礎設施,具有“超強性能、極致效率、全面開放、超高可靠”等領先特性。

scaleX640采用“一拖二”高密架構設計,構建大規(guī)模、高帶寬、低時延超節(jié)點通信域,雙機柜合體可組成1280卡計算單元,柜間通過高速網(wǎng)絡互連,液體冷凝換熱裝置CDM為千卡級計算單元提供高達1.72MW的超級散熱能力,PUE值低至1.04,算力密度最大增幅達20倍。

更關鍵之處在于,曙光采用了復雜度最高的全棧開放式架構集成路線,整合算、存、網(wǎng)、電、冷、管等諸多子系統(tǒng),并基于超高速正交架構、超高密度刀片、浸沒相變液冷、高壓直流供電等多技術融合創(chuàng)新設計,MOE大模型訓練效率與高通量推理吞吐性能大幅提升30-40%。

結語:

三大超節(jié)點產(chǎn)品除了在性能指標上實現(xiàn)代代更新意外,更值得關注的是其路線差異展現(xiàn)出的發(fā)展特征。

其中,以單一巨頭為主導的垂直一體路線,表現(xiàn)出開發(fā)周期短、協(xié)同難度低、前期起步快等優(yōu)勢,但在全棧資源整合量級上遜于開放式架構路線,存在一定的擴展性局限。

另外,以阿里、中科曙光為代表的技術路線,在底層硬件選擇上支持多種AI芯片,具有開放架構和兼容性設計,具有產(chǎn)業(yè)活性足、內生潛力強、算力能效高等優(yōu)勢特征,但在產(chǎn)業(yè)鏈協(xié)作難度上存在一定的生態(tài)壁壘,需要投入大量資源和精力統(tǒng)一技術接口和協(xié)同規(guī)范。

總體而言,垂直式路線側重于單槍匹馬打天下,產(chǎn)業(yè)鏈風險可控、鏈主收益較大,特別適用于行業(yè)發(fā)展前期培育細分領域龍頭;開放式路線強調上下游組團結成命運共同體,風險與收益共擔共負,鏈上參與者積極性更強,尤其有利于行業(yè)發(fā)展中后期構筑可持續(xù)發(fā)展底座。

       原文標題 : 國產(chǎn)超節(jié)點擂臺賽,華為、阿里、曙光上演三強爭霸

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號