訂閱
糾錯(cuò)
加入自媒體

5年狂賺5825倍!中國最像英偉達(dá)的公司終于上市了

今天,A股上演了一場真正的“印鈔狂歡”。

被大家念叨了很久的“國產(chǎn)GPU第一股”——摩爾線程,終于登陸科創(chuàng)板了。

你看這股價(jià),首日一度高開468.78%,開盤價(jià)每股650元,市值一度突破3000億元。

圖片

在這波狂歡里,創(chuàng)始人張建中贏麻了,僅直接持股市值就達(dá)287.56億。早期投資人也賺得盆滿缽滿。最早的投資人沛縣乾曜累計(jì)浮盈高達(dá)5825倍。

在2020年12月,和而泰投了摩爾線程3000萬,現(xiàn)在變成了26.68億,5年時(shí)間直接漲了近88倍。

資本為什么這么瘋狂?就沖著它腦門上那個(gè)全市場最性感的標(biāo)簽—— “中國版英偉達(dá)”。

這可不是瞎貼金。摩爾線程的班底那可是正兒八經(jīng)的“英偉達(dá)嫡系”,張建中更是長期擔(dān)任英偉達(dá)全球副總裁、中國區(qū)總經(jīng)理。

借助這個(gè)熱乎勁,今天我們就來盤一盤,這家被捧上神壇的公司,成色到底怎么樣?

/ 01 /

5年4代GPU,最新性能接近英偉達(dá)H20

顯卡這玩意兒,如果不談場景只談參數(shù),那就是在耍流氓。

咱們把話說明白點(diǎn)。

搞AI計(jì)算,核心指標(biāo)其實(shí)就看三個(gè):算力、顯存、帶寬。

顯存決定了你能處理的模型大小,算力代表著能同時(shí)處理多少數(shù)據(jù),帶寬則代表固定期限能傳輸多少數(shù)據(jù)。

如果顯存不夠,大模型直接跟你說拜拜,就像小顯卡跑3A大作直接爆顯存一樣,不講道理。

如果算力和帶寬不夠,那就是老牛拉破車,別人跑完了,你還在那loading。

好,鋪墊完了,咱們來看看摩爾線程。

自2020年成立以來,摩爾線程已推出“蘇堤”、“春曉”、“曲院”、“平湖”四代GPU架構(gòu),從第三代曲院開始重心轉(zhuǎn)向AI計(jì)算,最新一代“平湖”GPU于2024年發(fā)布,基于該GPU的S5000的最新產(chǎn)品。

看數(shù)據(jù),S5000在FP32精度下的算力是32 TFLOPS。同時(shí),平湖架構(gòu)GPU最大顯存容量推斷為80GB,推斷S5000顯存容量應(yīng)為80GB,帶寬未知。

這是什么概念?咱們拉出英偉達(dá)的GPU看看:A100的FP32算力是19.5,H20是44,H100是67。

單看FP32這一項(xiàng),S5000一拳打翻了A100,甚至快摸到了H20的尾巴。雖然離H100那種“怪物”還有差距,但看著是不是挺熱血沸騰?

且慢,先別急著開香檳。

上面的參數(shù)并不能代表S5000的實(shí)際AI算力水平,原因就出在這個(gè)“FP32”上。

AI計(jì)算中,需要用到不同精度的數(shù)據(jù),F(xiàn)P32是其中一種,此外還有FP64、FP16/BF16、FP8、FP4、INT8等多種常見數(shù)據(jù)類型。

字母后面的數(shù)字代表在存儲里占用的字節(jié),數(shù)字增大,數(shù)據(jù)精度評估。FP32能表示小數(shù)點(diǎn)后7位左右,F(xiàn)P16能達(dá)到小數(shù)點(diǎn)后3位左右,INT8能表示-128到127之間的整數(shù)。

相應(yīng)的,數(shù)據(jù)位數(shù)越大,占用內(nèi)存越大,計(jì)算速度也更慢。因此,不同AI任務(wù)需要找到最合適的數(shù)據(jù)類型,像醫(yī)學(xué)、軍事、科學(xué)等領(lǐng)域?qū)φ`差比較敏感的,就需要用到FP64數(shù)據(jù)。

現(xiàn)在的AI大模型,不是在那搞火箭軌道計(jì)算,所以不需要那么高的精度。

現(xiàn)在大家為了快,為了省內(nèi)存,都在搞混合精度。FP16、BF16,甚至FP8(8位浮點(diǎn))才是現(xiàn)在AI訓(xùn)練和推理的“主戰(zhàn)場”。

就像你切菜,不需要拿著做眼科手術(shù)的手術(shù)刀去切,拿著菜刀(FP8/FP16)反而砍得更快。

所以,S5000那個(gè)漂亮的FP32數(shù)據(jù),在AI領(lǐng)域里,參考價(jià)值得打個(gè)折。關(guān)鍵得看它在FP16或者FP8下的表現(xiàn)。

關(guān)于這點(diǎn),有媒體曾經(jīng)披露過,據(jù)參與S5000產(chǎn)品測試的人士透露,S5000是國內(nèi)真正對標(biāo)H100的產(chǎn)品,其FP8計(jì)算能力對DeepSeek-V3/R1這樣的MoE大模型訓(xùn)練“是個(gè)絕配”。

但由于相關(guān)信息較少,摩爾線程S5000的實(shí)際表現(xiàn)仍未可知。

再看看隔壁的友商們,那也是卷得飛起。

華為昇騰910C NPU目前公布的BF16/FP16總算力達(dá)752 TFLOPS,超過了英偉達(dá)H20和A100,但不到H100的一半,片上內(nèi)存(可簡單類比顯存)和帶寬與H100基本在同一水平。

寒武紀(jì)目前在售思元590芯片,F(xiàn)P16算力為256TFLOPS,接近A100水平。沐曦集成未公布數(shù)據(jù),僅表示曦云C500和C550兩款GPU在FP16/BF16指標(biāo)上,處于英偉達(dá)A100的算力區(qū)間。

不過,也有行業(yè)內(nèi)部人士稱,在實(shí)際訓(xùn)練推理環(huán)境中,摩爾線程等國產(chǎn)AI計(jì)算卡的紙面參數(shù)算力往往需要打個(gè)折扣。

必須承認(rèn),單看指標(biāo),摩爾線程離英偉達(dá)確實(shí)還有很長的路要跑。

但這不重要,重要的是它還在跑。在他們身上,我們把國產(chǎn)GPU死磕到底的那股勁兒。只要還在往前拱,這件事就有戲。給點(diǎn)耐心,挑戰(zhàn)者永遠(yuǎn)值得瑞思拜。

/ 02 /

一個(gè)S5000集群,貢獻(xiàn)一半以上營收

雖然大家都說摩爾線程是“國產(chǎn)英偉達(dá)”,但只要你翻開本本,就會發(fā)現(xiàn)兩者的賺錢方式其實(shí)大有區(qū)別。

比較典型的體現(xiàn)是,英偉達(dá)不直接銷售AI智算集群,而摩爾線程主要營收卻來自于集群產(chǎn)品。

今年上半年,摩爾線程共賣出了5個(gè)智算集群,其中4個(gè)集成512個(gè)S4000 GPU,另一個(gè)是集成2048個(gè)S5000 GPU的集群,這也是摩爾線程賣出的第一個(gè)S5000集群。資料顯示,僅這一個(gè)S5000集群,就為摩爾線程貢獻(xiàn)了3.97億元營收,占上半年總營收一半以上。

據(jù)招股資料顯示,這一個(gè)S5000集群的客戶為“重大科技創(chuàng)新平臺”,大概率是某個(gè)國家實(shí)驗(yàn)室。值得一提的是,目前國產(chǎn)AI計(jì)算卡企業(yè)中,華為是絕對龍頭,客戶較為廣泛。寒武紀(jì)主要客戶為字節(jié)跳動,據(jù)行業(yè)內(nèi)人士透露,沐曦集成則主要面向信創(chuàng)GPU市場。

而英偉達(dá)之所以不賣AI智算集群的原因,是因?yàn)檫@事的毛利率比賣芯片可差多了。

現(xiàn)在,英偉達(dá)賣 GPU 的毛利率高達(dá)70%,而賣AI集群的毛利率可就要低很多,因?yàn)锳I 智算集群的建設(shè)和維護(hù)也需要大把的錢。

雖然毛利率低,可對于尚處于追趕階段的摩爾線程也不算一個(gè)壞的選擇。

因?yàn)橄啾扔谫uGPU,賣集群更容易做大營收規(guī)模。集群本質(zhì)上就是把一堆GPU連接在一起,共同執(zhí)行AI任務(wù),賣一個(gè)集群就相當(dāng)于一次性賣出幾百上千甚至更多GPU。

更關(guān)鍵的是,賣集群這事也不是誰想干就能干的。

現(xiàn)階段AI模型越做越大,單卡或者多卡組合已經(jīng)滿足不了訓(xùn)練需求,同時(shí)消費(fèi)端推理需求暴增,AI大廠和云服務(wù)廠商只能建設(shè)更大的算力集群來滿足行業(yè)需求。

比如,馬斯克的xAI孟菲斯超級集群一期就集成了10萬張H100GPU,亞馬遜的Project Rainier更是集成了近50萬顆自研芯片。

AI計(jì)算是一場對速度的極致考驗(yàn),每塊GPU類似一段高速公路,這些高速路段并沒有相連,每行駛一段就得出高速然后重新上另一段高速。

于是,當(dāng)GPU越來越多,就帶了另一個(gè)問題:怎么把這些GPU更好地連接起來?

這就引出了建設(shè)AI算力集群一個(gè)關(guān)鍵技術(shù)——GPU互聯(lián)技術(shù)。

英偉達(dá)之所以這么牛,是因?yàn)樗茉缇烷_發(fā)出來NVLink技術(shù),相當(dāng)于把每段高速的連接路段也修成了高速,相鄰的幾張GPU兩兩互通,提升計(jì)算速度。目前應(yīng)用的NVLink5.0技術(shù)卡間互聯(lián)帶寬高達(dá)1.8TB/s,即將推出的6.0技術(shù)帶寬將升級至3.6TB/s。

在卡間互聯(lián)上,摩爾線程也推出了自研的MT-Link技術(shù),目前最新的MT-Link3.0互聯(lián)帶寬達(dá)1.3TB/s,介于NVLink4.0(帶寬900GB/s)和5.0之間。招股資料中,摩爾線程表示MT-Link3.0已經(jīng)達(dá)到行業(yè)領(lǐng)先水平。

不過,公司也說了,目前摩爾線程最新的平湖GPU架構(gòu)和S5000 GPU上,用的還是MT-Link2.0技術(shù),片間互聯(lián)帶寬為800GB/s。也就是說,新研發(fā)的3.0技術(shù)還沒應(yīng)用到產(chǎn)品上。

雖然摩爾線程在GPU互聯(lián)技術(shù)做得不錯(cuò),但其AI集群也面臨著另一個(gè)現(xiàn)實(shí)挑戰(zhàn),那就是規(guī)模。

一般來說,兩兩互聯(lián)的卡數(shù)量有著較難突破的物理極限。由于每家廠商采用的互聯(lián)結(jié)構(gòu)不同,這個(gè)極限并不相同,比如英偉達(dá)最新的Blackwell架構(gòu)支持72個(gè)GPU互聯(lián),谷歌TPU在卡間互聯(lián)上最多形成4X4X4(即64個(gè)TPU)的小立方體,這樣的互聯(lián)極限一般被稱為節(jié)點(diǎn)。

摩爾線程現(xiàn)有的KUAE2集群技術(shù),每個(gè)節(jié)點(diǎn)集成8顆模塊化GPU,節(jié)點(diǎn)之間采用的InfiniBand/RoCE的網(wǎng)絡(luò)方案進(jìn)行互聯(lián),這兩種都是行業(yè)主流網(wǎng)絡(luò)互聯(lián)方案。KUAE2集群最多可包含1280個(gè)節(jié)點(diǎn),最大可支持10240個(gè)GPU。

不過,摩爾線程賣出的最大集群僅包含2048張卡。據(jù)行業(yè)人士透露,在AI計(jì)算卡集群上,5000卡是一個(gè)關(guān)鍵瓶頸,因?yàn)榧阂?guī)模上去后,對電源、電力、散熱以及系統(tǒng)調(diào)控等諸多方面都是一個(gè)極大的考驗(yàn)。因此相比于動輒10萬卡、20萬卡互聯(lián)的英偉達(dá),摩爾線程的KUAE集群技術(shù)仍需要進(jìn)一步完善及迭代。

雖然技術(shù)上還在追趕,離萬卡集群也還有距離。但在國產(chǎn)替代的大潮下,能把千卡級別的集群賣出去,而且真金白銀地賺到錢,已經(jīng)是一件很了不起的事情了。

只要有人買單,這把火,就還能繼續(xù)燒下去。

/ 03 /

5年5825倍的造富神話

除了國產(chǎn)GPU追趕英偉達(dá)的故事,摩爾線程上市另一個(gè)話題便是,造富。

最直接的體現(xiàn)就是創(chuàng)始團(tuán)隊(duì)。公告顯示,發(fā)行后張建中直接持股9.4127%,按上市首日的價(jià)格,即使不算間接持股,張建中持股市值就高達(dá)287.56億元。

最早下場的機(jī)構(gòu)股東同樣賺得盆滿缽滿。

摩爾線程成立三個(gè)月,深圳明皓、沛縣乾曜就迅速入局。據(jù)摩爾線程公布的法律意見書,沛縣乾曜是以1元的價(jià)格入股,投前估值僅1000萬元,沛縣乾曜以190.4762萬元入股,拿到了13.4%股份。同期入股的深圳明皓以35.28元的價(jià)格入股,投了8000萬元,拿到了16%股份。

之后,沛縣乾曜以253.60元的價(jià)格轉(zhuǎn)讓了近20萬元的注冊資本,套現(xiàn)約5000萬元。此次發(fā)行后沛縣乾曜仍持有1699.87萬股,占總股本的3.6165%,開盤市值為110.48億元,以此計(jì)算沛縣乾曜累計(jì)浮盈超5825倍。

深圳明皓先后在2021年10月和今年初分別套現(xiàn)了2000萬元和1.57億元,發(fā)行后持有1992.27萬股,持股比例為4.2386%,開盤市值為129.49億元,累計(jì)浮盈達(dá)163倍。

在之后的天使輪中,摩爾線程引入了紅杉資本、聞名泉豐、和而泰、深圳一創(chuàng)、五源啟興五家機(jī)構(gòu)。資料顯示,此輪融資投后估值為16.46億元,和而泰投了3000萬元。此次發(fā)行后和而泰持股比例為0.8734%,以開盤價(jià)計(jì)算持股市值26.68億元,增值了近88倍。

紅杉資本曾多次追投,天使輪、Pre-A輪和B輪合計(jì)投入約2.12億元,發(fā)行后持股1915.44萬股,持股比例為4.0752%,持股市值124.50億元,增值了近58倍。

不過也有在IPO前提前離場的機(jī)構(gòu)。字節(jié)跳動旗下量子躍動在Pre-A輪向摩爾線程投了約5000萬元,今年初將其全部股份轉(zhuǎn)讓,獲利2.27億元,賺了3.54倍。

即便是在Pre-IPO輪新進(jìn)入的股東,也賺到了不錯(cuò)收益。摩爾線程Pre-IPO輪投后估值為298.45億元,開盤市值約3055億元,新股東浮盈9倍以上。

顯然,在國產(chǎn) GPU 飛速前進(jìn)的大背景里,這臺造富機(jī)器顯然還沒停下。下一段故事,大概才剛剛開始。

文/董武英

       原文標(biāo)題 : 5年狂賺5825倍!中國最像英偉達(dá)的公司終于上市了

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號