訂閱
糾錯(cuò)
加入自媒體

國產(chǎn)GPU,要把算力搬到太空!

貝克街探案官

作者魯鎮(zhèn)西

搶回英偉達(dá)扔掉的500億美元,摩爾線程們還能做什么?

2025年11月,長達(dá)7年的“國產(chǎn)芯片替代”,終于迎來大眾肉眼可見的成果。

首先是黃仁勛宣布正式退出中國市場,高端芯片市場份額從95%降至0%‌,預(yù)計(jì)將失去500億美元營收,其次中國GPU企業(yè)摩爾線程,于11月24日摩爾線程(sh688795)正式申購,這意味著主要從事GPU及相關(guān)產(chǎn)品的研發(fā)、設(shè)計(jì)和銷售,號稱國內(nèi)唯一實(shí)現(xiàn)全功能GPU量產(chǎn)的企業(yè),初步獲得市場認(rèn)可。

圖源:摩爾線程官網(wǎng)

只是礙于科創(chuàng)板門檻兒,申購者需要開戶滿2年;申請日前20個(gè)交易日中,日均持倉不低于50萬元;風(fēng)險(xiǎn)承受能力等級需為C4(積極型)及以上,并簽署《科創(chuàng)板股票交易風(fēng)險(xiǎn)揭示書》。

按摩爾線程發(fā)行價(jià)114.28元每股計(jì)算,中一簽需要本金57140元,由于近期新股大鵬工業(yè)首日暴漲12倍,最高漲幅超1500%,市場對摩爾線程上市當(dāng)日的漲幅預(yù)期極高,紛紛預(yù)測中一簽?zāi)柧程最少盈利十萬元。

且不論這種預(yù)測是否準(zhǔn)確,從摩爾線程IPO進(jìn)程來看,公司從申請受理到過會(huì)僅用88天,刷新了科創(chuàng)板審核速度紀(jì)錄。實(shí)際上,二級市場反哺企業(yè)融資提速,恰好表明國產(chǎn)GPU研發(fā)加速落地。

01摩爾線程的硬實(shí)力

此次上市的摩爾線程,成立時(shí)間不過5年,自2020年設(shè)立至今,公司以自主研發(fā)的全功能GPU為核心,致力于為AI、數(shù)字孿生、科學(xué)計(jì)算等高性能計(jì)算領(lǐng)域提供計(jì)算加速平臺。

短短5年中,摩爾線程已成功推出四代GPU架構(gòu),并形成了覆蓋AI智算、高性能計(jì)算、圖形渲染、計(jì)算虛擬化、智能媒體和面向個(gè)人娛樂與生產(chǎn)力工具等應(yīng)用領(lǐng)域的多元計(jì)算加速產(chǎn)品矩陣,產(chǎn)品線涵蓋政務(wù)與企業(yè)級智能計(jì)算、數(shù)據(jù)中心及消費(fèi)級終端市場,能夠滿足政府、企業(yè)和個(gè)人消費(fèi)者等在不同市場中的差異化需求。

新一代架構(gòu)相關(guān)產(chǎn)品處于研發(fā)階段,同步推進(jìn)高性能GPU芯片和智算集群前沿技術(shù)預(yù)研,以自主創(chuàng)新為核心,持續(xù)推動(dòng)計(jì)算產(chǎn)業(yè)向通用化與智能化方向發(fā)展。

圖源:摩爾線程招股書

值得一提的是,退出中國高端GPU市場的英偉達(dá),賴以生存的就是“CUDA”,英偉達(dá)憑借CUDA構(gòu)建了極高的軟件生態(tài)壁壘。為沖破這個(gè)壁壘,摩爾線程自主研發(fā)MUSA架構(gòu)。

MUSA架構(gòu)是公司自主研發(fā)的融合GPU硬件和軟件的全功能GPU計(jì)算加速統(tǒng)一系統(tǒng)架構(gòu)。該架構(gòu)涵蓋統(tǒng)一的芯片架構(gòu)、指令集、編程模型、軟件運(yùn)行庫及驅(qū)動(dòng)程序框架等關(guān)鍵要素,旨在為各類并行計(jì)算場景提供高性能計(jì)算能力。

開發(fā)人員可借助C/C++、Triton等編程語言,在該架構(gòu)下編寫并行計(jì)算程序,且同一代碼能夠在公司不同GPU產(chǎn)品及系統(tǒng)上運(yùn)行,具有良好的靈活性與可擴(kuò)展性。

最重要的是,MUSA架構(gòu)具備與由英偉達(dá)主導(dǎo)的國際主流GPU生態(tài)的兼容性,使得開發(fā)者能夠以較低成本充分利用目前國際主流生態(tài)下的代碼資源;贛USA架構(gòu)開發(fā)的應(yīng)用程序不僅具有廣泛的可移植性,還能夠同時(shí)在云端及邊緣的眾多計(jì)算平臺上運(yùn)行,其應(yīng)用領(lǐng)域廣泛,涵蓋AI、圖形處理、科學(xué)計(jì)算等多個(gè)重要方向。

全功能GPU是指具備功能完備性與精度完整性的GPU。其中,功能完備性體現(xiàn)為在單一GPU芯片中集成了AI計(jì)算加速、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼等多種能力,滿足多樣化的計(jì)算需求;精度完整性體現(xiàn)為單一芯片支持FP64Vector、FP32Vector、TF32Tensor、FP16/BF16Tensor、FP8Tensor、INT8Tensor等不同計(jì)算精度,以滿足GPU加速不同場景的計(jì)算需求。

全功能GPU在工作效率、生態(tài)完整多樣性以及兼容性等方面更具有優(yōu)勢,能夠更好地適應(yīng)未來新興及前沿計(jì)算加速應(yīng)用場景的需求。

基于MUSA統(tǒng)一架構(gòu)技術(shù),摩爾線程在基礎(chǔ)軟件層面同時(shí)提供了AI計(jì)算、圖形渲染和科學(xué)計(jì)算所需的基礎(chǔ)軟件技術(shù)。

在AI計(jì)算領(lǐng)域,支持PyTorch、PaddlePaddle等國內(nèi)外主流AI應(yīng)用開發(fā)框架,以及Megatron、FlagScale等大模型分布式訓(xùn)練框架;在圖形渲染領(lǐng)域,支持DirectX、OpenGL、OpenGLES和Vulkan等主流圖形應(yīng)用開發(fā)技術(shù),為視頻游戲、數(shù)字孿生、虛擬現(xiàn)實(shí)、工業(yè)設(shè)計(jì)和地理信息系統(tǒng)等行業(yè)應(yīng)用提供堅(jiān)實(shí)基礎(chǔ);在科學(xué)計(jì)算領(lǐng)域,支持MUSA通用計(jì)算編程,可廣泛應(yīng)用于計(jì)算物理、信號處理、生物醫(yī)藥等科學(xué)計(jì)算領(lǐng)域。

在招股書中,摩爾線程特別強(qiáng)調(diào),MUSA架構(gòu)本身并不作為單獨(dú)產(chǎn)品對外銷售,而是作為公司全功能GPU產(chǎn)品的核心技術(shù)支撐。

02機(jī)會(huì)留給了有準(zhǔn)備的MUSA,國產(chǎn)算力迎來加速時(shí)刻

今天的MUSA架構(gòu),間接證明摩爾線程設(shè)立初期就錨定英偉達(dá)替代。

俗話說機(jī)會(huì)留給有準(zhǔn)備的人,如今的英偉達(dá),因?yàn)榉N種原因徹底退出中國高端GPU市場,而摩爾線程MUSA架構(gòu)恰好可以兼容英偉達(dá)CUDA架構(gòu),在英偉達(dá)高端GPU退出中國市場的今天,摩爾線程MUSA架構(gòu)似乎可以無縫銜接英偉達(dá)市場,國產(chǎn)算力行業(yè)有望借此實(shí)現(xiàn)加速落地。

基于MSUA架構(gòu),摩爾線程已經(jīng)推出四代GPU架構(gòu)芯片,分別為“蘇堤”“春曉”“曲院”“平湖”,第四代芯片“平湖”增加了FP8精度支持,大幅提升AI算力,公司基于該芯片支撐面向DeepSeek類前沿大模型預(yù)訓(xùn)練的萬卡集群智算中心解決方案。

基于MUSA架構(gòu),摩爾線程推出智能SoC芯片“長江”,這是集成了“全功能GPU+CPU+NPU+VPU”等異構(gòu)算力單元的片上系統(tǒng)芯片。

摩爾線程AI算力本是基于“長江”SoC打造的產(chǎn)品,結(jié)合AI大模型與傳統(tǒng)PC功能,為用戶提供智能化的計(jì)算終端。該產(chǎn)品在滿足傳統(tǒng)PC功能的基礎(chǔ)上,支持AI應(yīng)用的運(yùn)行與開發(fā),用戶可進(jìn)行AI學(xué)習(xí)和實(shí)踐操作。同時(shí),AI算力本支持端云聯(lián)動(dòng),用戶可通過云端進(jìn)行模型訓(xùn)練,將訓(xùn)練完成的模型下發(fā)至本地進(jìn)行推理,實(shí)現(xiàn)個(gè)性化算力定制,滿足快速、高效、隱私保護(hù)的推理需求。

除兼容英偉達(dá)CUDA架構(gòu)的摩爾線程MUSA架構(gòu)外,國產(chǎn)算力還有一個(gè)繞不開的玩家就是華為,2025年6月20日,華為在開發(fā)者大會(huì)發(fā)布CloudMatrix384AI超節(jié)點(diǎn),將384顆昇騰NPU和192鯤鵬CPU通過全新高速網(wǎng)絡(luò)MatrixLink對等互連形成了一個(gè)整體AI“服務(wù)器”。算力已從單臺的6.4pFLOPS提升至超節(jié)點(diǎn)300pFLOPS,算力提升50倍。單卡的推理吞吐量從每秒600tokens提升至每秒2300tokens,提升近4倍。

實(shí)際測試中在默認(rèn)配置下,總體預(yù)填吞吐量的測試CloudMatrix-Infer每個(gè)NPU每秒處理5655tokens。鑒于每個(gè)昇騰910CNPU的計(jì)算能力為1504TFLOPS(INT8),對應(yīng)的計(jì)算效率為3.76tokens/sperTFLOPS。這比SGLang在英偉達(dá)H100上的默認(rèn)配置(3.18tokens/sperTFLOPS)效率要高得多,盡管后者的原始吞吐量略高。

另一個(gè)老玩家龍芯中科也推出了新一代CPU及GPGPU,2025年龍芯產(chǎn)品發(fā)布會(huì)上,龍芯中科發(fā)布最新一代3C6000系列處理器。

龍芯3C6000系列處理器具備高性能,高可靠,高安全,高能效的特點(diǎn)。本次產(chǎn)品主要打造了5種服務(wù)器主板方案(3C6000/S單路、雙路;3C6000/D雙路;3C6000/Q雙路;3C6000/D四路)主要針對不同應(yīng)用群體,服務(wù)器性能全面對標(biāo)Intel第三代至強(qiáng)服務(wù)器系列,基本達(dá)到2023年市場主流產(chǎn)品水平,實(shí)測中64核心雙路和32核心四路產(chǎn)品整機(jī)性能比較Intel的8380有小幅優(yōu)勢。

在工控領(lǐng)域本次發(fā)布會(huì)發(fā)布了龍芯2K3000:采用8核SoC芯片,龍芯自主指令系統(tǒng)(龍架構(gòu)),基于自主研制的LA364E處理器核,SPECCPU2006Base單線程定/浮點(diǎn)峰值性能均超過10分/GHz,與龍芯3A5000處理器使用的LA464核性能相當(dāng);集成第二代自研GPGPU核心LG200,圖形性能成倍提升,支持通用計(jì)算和AI加速;集成豐富的I/O接口,可廣泛應(yīng)用于各種場景。

公司針對未來GPU芯片發(fā)展方向,發(fā)布首款GPU芯片9A1000:其定位是入門級的顯卡并且支持AI加速,AI算力預(yù)計(jì)在40TOPS,相較于公司上一代2K3000性能提升5倍以上,產(chǎn)品目前已經(jīng)在研發(fā)尾聲,即將進(jìn)入流片。下一代9A2000單精度浮點(diǎn)算力可達(dá)到5TFlops,INT8AI算力達(dá)到160TOPS,內(nèi)存帶寬256BG/s,并且支持雙片互聯(lián)拓展。

結(jié)語

在國產(chǎn)GPU市場,像摩爾線程、華為、龍芯中科這幾家公司只是冰山一角,海光信息、寒武紀(jì)、景嘉微、沐曦集成等多家公司均聚焦GPU產(chǎn)品,為國產(chǎn)算力替代提供無限可能。

2025年11月消息,北京擬在700-800公里晨昏軌道建設(shè)運(yùn)營超過千兆瓦(GW)功率的集中式大型數(shù)據(jù)中心系統(tǒng),以實(shí)現(xiàn)將大規(guī)模AI算力搬上太空。

根據(jù)“智繪星空勝算在天——太空數(shù)據(jù)中心建設(shè)工作推進(jìn)會(huì)”發(fā)布的規(guī)劃方案,數(shù)據(jù)中心系統(tǒng)由空間算力、中繼傳輸和地面管控分系統(tǒng)組成。數(shù)據(jù)中心建設(shè)分為三個(gè)階段,2025年至2027年,突破能源與散熱等關(guān)鍵技術(shù),迭代研制試驗(yàn)星,建設(shè)一期算力星座;2028年至2030年,突破在軌組裝建造等關(guān)鍵技術(shù),降低建設(shè)與運(yùn)營成本,建設(shè)二期算力星座;2031年至2035年,衛(wèi)星大規(guī)模批量生產(chǎn)并組網(wǎng)發(fā)射,在軌對接建成大規(guī)模太空數(shù)據(jù)中心。

在此之前,浙江之江實(shí)驗(yàn)室于2025年5月14日,發(fā)射12顆衛(wèi)星,搭載80億參數(shù)模型,實(shí)現(xiàn)整軌互聯(lián),計(jì)劃擴(kuò)展至千星規(guī)模,為全球首個(gè)太空計(jì)算星座。

通常,衛(wèi)星需先將數(shù)據(jù)傳回地面,再由地面數(shù)據(jù)處理中心對其進(jìn)行解析,這種“天感地算”的模式受限于地面站資源、帶寬等因素,僅有不到十分之一的有效衛(wèi)星數(shù)據(jù)能傳回地面,且存在數(shù)據(jù)時(shí)效差等問題,之江實(shí)驗(yàn)室構(gòu)建的“三體計(jì)算星座”恰好著力攻克該問題。

中國之所以可以大力發(fā)展太空算力,一個(gè)重要前提就是實(shí)現(xiàn)國產(chǎn)算力替代后,算力建設(shè)外溢,如果成功,這將是解決傳統(tǒng)數(shù)據(jù)中心“用電 / 冷卻 /土地 /碳排放 /擴(kuò)容難”等問題的一條全新路徑。尤其對AI、大模型訓(xùn)練/推理這類對算力密集、能耗大的任務(wù)——太空算力或?qū)⒊蔀?ldquo;綠色高密度計(jì)算平臺”。

長期來看,如果太空算力可以落地,未來“天基算力星座+地面云+太空云+混合部署”可能成為主流算力基礎(chǔ)設(shè)施格局。不僅僅是云+地面數(shù)據(jù)中心,而是云+地+空多維融合。

其次可以減少對地面能源/電力/土地/冷卻資源的依賴,使得AI/超級計(jì)算/大模型訓(xùn)練更綠色/更可持續(xù)。這對碳中和/節(jié)能/資源利用/可持續(xù)發(fā)展有重要意義。

第三可以推動(dòng)“太空+商業(yè)航天+AI+通信+新能源+基礎(chǔ)設(shè)施”跨界產(chǎn)業(yè)鏈大發(fā)展。既是科技,也是基礎(chǔ)設(shè)施、戰(zhàn)略資產(chǎn)。可能促進(jìn)新的產(chǎn)業(yè)形態(tài)、新商業(yè)模式與新服務(wù)類型誕生。

第四可以實(shí)現(xiàn)戰(zhàn)略自主、數(shù)據(jù)主權(quán)、安全角度的基礎(chǔ)設(shè)施重構(gòu)。太空中的算力與數(shù)據(jù)處理可能更受控,更利于“主權(quán)云/主權(quán)算力/國家安全+數(shù)據(jù)安全”——對于一些敏感場景(政府、國防、衛(wèi)星偵察、遙感監(jiān)控、重大科研等)尤為重要。

著重構(gòu)建太空算力,是中國在“算力基礎(chǔ)設(shè)施+國家戰(zhàn)略+商業(yè)航天”交匯處的一次重大布局。它的重要性不亞于幾十年前地面互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的建設(shè),而這一切的基礎(chǔ),是國內(nèi)GPU企業(yè)可以穩(wěn)定產(chǎn)出優(yōu)質(zhì)GPU產(chǎn)品。

摩爾線程等新玩家成功上市,有望借助資本的力量進(jìn)一步提升企業(yè)實(shí)力,后續(xù)還有沐曦股份(sh688802)等陸續(xù)登陸科創(chuàng)板,為國產(chǎn) GPU 行業(yè)帶來大量資金、媒體與人才回流、供應(yīng)鏈驗(yàn)證與政府支持信號;中長期則可能推動(dòng)產(chǎn)品化規(guī)模擴(kuò)張、生態(tài)建設(shè)與國產(chǎn)替代提速。

© THE END

素材皆來自官方公開資料

本文不構(gòu)成任何投資建議。

頭圖由百度AI生成

本文由貝克街探案官原創(chuàng),未經(jīng)許可,請勿轉(zhuǎn)載。

       原文標(biāo)題 : 國產(chǎn)GPU,要把算力搬到太空!

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號