訂閱
糾錯
加入自媒體

中美大模型“登月路”:谷歌與月之暗面的這一年

圖片

文|魏琳華

編|王一粟

兩年前,面對OpenAI的突襲,節(jié)節(jié)敗退的谷歌內(nèi)部拉響了“紅色警報(bào)”。

為了應(yīng)對這場可能動搖到谷歌根本業(yè)務(wù)——搜索的危機(jī),谷歌作出了一個重大決定:2023年4月,谷歌將兩個頂尖實(shí)驗(yàn)室Google Brain和DeepMind的成員抽調(diào)出來,組建新團(tuán)隊(duì)Google DeepMind。

新誕生的超級團(tuán)隊(duì),將他們的賭注押在一個名為“Gemini”的項(xiàng)目上。

谷歌的命名有兩重意義,它的直譯為“雙子座”,象征著谷歌內(nèi)部兩大頂級技術(shù)力量的合體。而在航天史上,Gemini也有著極為重要的意義——它是NASA著名登月計(jì)劃之一“阿波羅計(jì)劃”的關(guān)鍵鋪墊。

“我立刻被這個名字吸引,因?yàn)橛?xùn)練大型語言模型的巨大努力與發(fā)射火箭的精神產(chǎn)生了某種深刻的共鳴。”談到命名由來,DeepMind副總裁、Gemini聯(lián)合技術(shù)負(fù)責(zé)人Oriol Vinyals說。

然而,現(xiàn)實(shí)的引力比火箭的推力更沉重。

Gemini計(jì)劃剛成形時(shí),是谷歌被質(zhì)疑最猛烈的日子。被對手OpenAI卡點(diǎn)發(fā)布新模型,屢屢被后者搶走風(fēng)頭、Gemini 1.0的演示視頻翻車、新模型性能優(yōu)勢不及對手。樁樁件件,讓谷歌難以擺脫外界質(zhì)疑的聲音。

但科技行業(yè)的魅力在于,只要真的向技術(shù)投入,就總會有翻身的那一天。

兩年后的今天,當(dāng)Gemini 3橫空出世,多項(xiàng)指標(biāo)超過GPT-5.1,谷歌終于揚(yáng)眉吐氣。

最近,谷歌被曝出正在探索一項(xiàng)名為“moonshot”的登月計(jì)劃,即在太空中建造人工智能數(shù)據(jù)中心,打造一系列配備谷歌人工智能芯片的太陽能衛(wèi)星,這也是該公司為追趕 OpenAI 和其他競爭對手而采取的最新舉措。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊也在采訪中表示,為登月計(jì)劃感到自豪。

圖片

AI 2.0時(shí)代的落地狂奔中,谷歌的故事是這一代AI公司的最佳縮影。不同于AI 1.0時(shí)代技術(shù)快速觸及天花板,導(dǎo)致后期的比拼淪為卷落地、卷資金的規(guī)模戰(zhàn);AI 2.0時(shí)代的公司們,至今面對的頭號任務(wù)依然是卷技術(shù)。

中美模型的競爭中,來自中國的月之暗面(Moonshot AI)很早也提出過自己的“登月計(jì)劃”,如同楊植麟對公司的命名期待,深耕技術(shù),注重“月球背面的探索”。

11月30日,美國NBC News報(bào)道,隨著中國開源生態(tài)的崛起,以Kimi K2 Thinking模型為代表的中國頂尖模型,性能接近美國最優(yōu)秀的水平。

圖片

這背后,是沉寂半年、卷土重來的月之暗面,也靠“登月計(jì)劃”打的一場翻身仗。

今年下半年,月之暗面先后拿出了兩個奠定地位的模型Kimi K2和Kimi K2 Thinking。前者作為非思考模型,在多個測試中拿到開源模型的SOTA;后者不僅能力大幅升級,還成為著名AI搜索Perplexity目前唯一接入的國產(chǎn)模型,同時(shí)被官宣的,正是剛剛屠榜的Gemini3 Pro。而上一個有此待遇的中國模型,是風(fēng)光無限的DeepSeekR1。

圖片

在2025年交匯的兩條“登月路線”,再度強(qiáng)調(diào)了技術(shù)紅利對一家公司的重要性。

沒有永久的王座,AI賽道頻繁上演“逆襲”

科技商業(yè)史的宏大敘事中,從來沒有永久的王座。

在“一天一變”的AI賽道,技術(shù)的迭代速度以周甚至以天為單位計(jì)算,“逆襲”和“被逆襲”的戲碼幾乎每天都在上演。

細(xì)數(shù)三年,我們經(jīng)歷了多個靠技術(shù)翻盤的時(shí)刻:OpenAI靠ChatGPT超越一眾科技大廠、月之暗面憑借長文本捧紅AI助手Kimi、再是Claude系列模型反殺OpenAI,靠編程一騎絕塵、DeepSeek出圈、以Kimi K2為代表的國產(chǎn)模型在海外走紅,最近的Gemini系列翻盤。

舊王推翻新王的故事,正在OpenAI和谷歌的身上輪回。

據(jù)外媒The Information報(bào)道,本周,OpenAI CEO Sam Altman拉響紅色警報(bào)。讓這家AI獨(dú)角獸警戒的對象,正是三年前對其同樣啟動紅色警報(bào)的谷歌。

對于谷歌來說,2023到2024年是其最脆弱的時(shí)期。發(fā)布會上的事實(shí)性錯誤曾讓市值一夜蒸發(fā)千億;Gemini早期的演示視頻被指責(zé)夸大宣傳;每一次試圖反擊,似乎都會被OpenAI更驚艷的產(chǎn)品搶走風(fēng)頭。

復(fù)盤兩年來的努力,Google CEOSundar Pichai一再強(qiáng)調(diào)全棧能力的重要性。

“在這個過程中,我們大幅加大了基礎(chǔ)設(shè)施投資——數(shù)據(jù)中心、TPU、GPU 等等。接下來,就是如何確保我們能把 Gemini 整合進(jìn)所有的產(chǎn)品里。”Pichai說,“你把框架拉遠(yuǎn)一點(diǎn)看,就會覺得極度振奮。因?yàn)楫?dāng)你采用全棧方法論時(shí),每一層的創(chuàng)新會沿著整條鏈路向上傳遞。”

谷歌正式吹響反擊的號角,始于2025年3月。

彼時(shí),OpenAI慣用一種套路針對谷歌,即卡中其新模型的發(fā)布時(shí)間,提前一天發(fā)布自家產(chǎn)品。而這一次,谷歌“以其人之道還治其人之身”,把Gemini 2.5 Pro的發(fā)布提前到OpenAI產(chǎn)品發(fā)布的前一天。Gemini 2.5 Pro也不負(fù)眾望,在多項(xiàng)指標(biāo)上超過O3-mini,站上了最強(qiáng)模型的競技場。

圖片

隨后,谷歌如同打開了軍火庫,陸續(xù)掏出了驚艷業(yè)界的原生多模態(tài)模型VEO 3、圖片編輯模型Nano Banana,一系列超越同期競品表現(xiàn)的產(chǎn)品接踵而至。

最終, Gemini 3 成為那個引爆 OpenAI 的關(guān)鍵產(chǎn)品。從測試結(jié)果來看,這個新模型實(shí)現(xiàn)了對 GPT-5.1 的全面超越,在數(shù)學(xué)競賽、推理、多模態(tài)等能力上超越了 Claude Sonnet 4.5 和 GPT-5.1 。

圖片

無獨(dú)有偶,這種劇情,也在月之暗面身上發(fā)生。

半年前,這家公司還處在輿論的風(fēng)暴眼中。盡管Kimi曾憑借長文本脫穎而出,但隨著DeepSeek橫空出世的推理模型R1靠技術(shù)破圈,一個問題降臨在所有AI創(chuàng)業(yè)公司身上——“為什么xx沒有成為DeepSeek?”

在此之后,月之暗面沉寂了半年時(shí)間。

看到DeepSeek后,月之暗面創(chuàng)始人楊植麟在內(nèi)部會議上給出了相當(dāng)激進(jìn)的決策:不再更新 K1系列模型,將公司核心資源押注算法和下一代模型K2的研發(fā)上。

對比谷歌,作為國內(nèi)AI創(chuàng)企,月之暗面的處境相當(dāng)嚴(yán)苛。沒有數(shù)十年的數(shù)據(jù)積累,也沒有可以和國內(nèi)外巨頭抗衡的資源,和海外AI創(chuàng)企動輒千億美元的估值相比,月之暗面目前估值還不到40億美元,這不僅是月之暗面一家的問題,更是國內(nèi)大模型創(chuàng)業(yè)公司的共同困境。

圖片

利用有限的資源,月之暗面在半年后,也打了一個翻身仗。

先是今年7月Kimi K2模型發(fā)布,它是當(dāng)時(shí)開源模型中少數(shù)能達(dá)到萬億參數(shù)的大模型,作為非思考模型,它在多項(xiàng)指標(biāo)上拿下開源模型梯隊(duì)的SOTA。

上個月,Kimi K2 Thinking模型正式上線時(shí),在HLE、推理、Agent等維度上超越閉源模型GPT-5和Claude Sonnet 4.5,重新回到全球開源模型的榜首。

圖片

“這是另一個DeepSeek時(shí)刻嗎?”Kimi K2 Thinking模型發(fā)布后,Hugging Face 聯(lián)合創(chuàng)始人Thomas Wolf在X上這樣評價(jià)。

模型背后,也看到月之暗面在基礎(chǔ)技術(shù)上的追求。

比如全球首次在萬億級別的模型預(yù)訓(xùn)練中采用二階優(yōu)化器 Muon,官方表示,Kimi K2提升了訓(xùn)練穩(wěn)定性和Token使用效率,在完成15.5T token平穩(wěn)訓(xùn)練的同時(shí),全程無Loss Spike(損失激增);推出下一代 Kimi Delta Attention 架構(gòu),通過混合線性注意力機(jī)制幫助提升模型的推理效果的同時(shí),還能降低幾倍的推理成本。

“你可能會認(rèn)為我們選擇Muon只是運(yùn)氣好,但是選擇的背后是,有幾十個優(yōu)化器和架構(gòu)沒有通過考驗(yàn)。”在月之暗面發(fā)起的AMA(Ask Me Everything)活動上,團(tuán)隊(duì)給出了這樣的回答。

谷歌和月之暗面,也只是AI進(jìn)化的縮影。如今,AI行業(yè)遠(yuǎn)遠(yuǎn)未到逆襲的終點(diǎn)。

“當(dāng)前環(huán)境是史上最激烈的競爭,唯一真正重要的是進(jìn)步速度。”DeepMind CEO Demis Hassabis說。

AI 2.0時(shí)代,技術(shù)紅利依然是關(guān)鍵

“逆襲”還是“被逆襲”,AI 2.0時(shí)代,大模型公司們的“長跑考試”還在繼續(xù),技術(shù)依然是引領(lǐng)企業(yè)的引擎。

這與上一輪AI浪潮有著本質(zhì)的區(qū)別;赝2016年,當(dāng)AlphaGo點(diǎn)燃AI 1.0時(shí)代時(shí),技術(shù)泛化問題難以解決的情況下,行業(yè)快速觸摸到了天花板。

計(jì)算機(jī)視覺(CV)來說,當(dāng)時(shí)業(yè)內(nèi)面對的問題更加棘手,比如性能非常依賴大規(guī)模標(biāo)注數(shù)據(jù)、技術(shù)泛化性差、實(shí)時(shí)處理的延遲問題等等。在技術(shù)瓶頸的情況下,拼資源、拼生態(tài)成了創(chuàng)業(yè)公司競爭的關(guān)鍵。

但AI 2.0時(shí)代完全不同。在生成式AI時(shí)代行業(yè)距離天花板尚且遙遠(yuǎn),整個領(lǐng)域還有大量未解的問題。

在大語言模型領(lǐng)域,Scaling Law(規(guī)模定律)的放緩問題沒有得到有效解決;再看多模態(tài)大模型,包括自回歸和離散兩條技術(shù)路線還在探索中,沒有確切的答案;視頻生成的時(shí)長、一致性、物理規(guī)律的學(xué)習(xí),還有提升空間;Agent的落地,更是卡在模型泛化能力的瓶頸上。

在這個階段,如果一家公司過早放棄作為基座的模型能力提升。“地基”不穩(wěn)的情況下,很容易被后起之秀彎道超車。

2025年,回歸技術(shù)更是成為AI行業(yè)的關(guān)鍵詞。

可以看到,無論是大廠還是小廠,都在招兵買馬,集中資源攻克模型SOTA。

不僅僅是谷歌和月之暗面,最近,國內(nèi)包括字節(jié)跳動、百度等大廠都在進(jìn)行組織架構(gòu)調(diào)整,核心邏輯是提升大模型研發(fā)的優(yōu)先級。

上月末,百度TPG組織架構(gòu)大調(diào)整,文心業(yè)務(wù)拆分為基礎(chǔ)模型和應(yīng)用模型部門,負(fù)責(zé)人直接向百度CEO李彥宏匯報(bào);今年4月,字節(jié)AI Lab整體并入Seed團(tuán)隊(duì),整合AI研發(fā)力量。

對技術(shù)的投入,永遠(yuǎn)是留在第一梯隊(duì)的關(guān)鍵砝碼。谷歌的路徑已經(jīng)給出了最好的示范。在Gemini 2.5 Pro的逆襲之后,同樣隸屬于Gemini家族的圖像編輯模型Nano Banana(Gemini 2.5 Flash)也快速走紅?梢哉f,沒有強(qiáng)大的、通用的Gemini基座在語言和視覺理解上的突破,谷歌難以在短時(shí)間內(nèi)拿出一個同樣具備競爭力的圖像模型。

當(dāng)基礎(chǔ)模型的研發(fā)取得突破,在這個基座上,公司們能夠靠“舉一反三”,在更多領(lǐng)域拿下優(yōu)勢。

此前,月之暗面團(tuán)隊(duì)在海外社交媒體上做AMA分享時(shí),雖然沒有具體預(yù)告K3模型的發(fā)布時(shí)間,但表示該模型有望用上他們研發(fā)的KDA(Kernel-Attention Dual Architecture)架構(gòu)。有接近月之暗面的人士對光錐智能表示,萬億參數(shù)可以為后續(xù)的推理模型打下扎實(shí)地基,K2的多模態(tài)已經(jīng)在路上。

無論規(guī)模、體量,包括模型的性能,兩家同樣有著登月追求的公司都存在客觀差距,如同中美競賽中那道逐漸縮小的鴻溝,東西方的技術(shù)和開閉源之爭正等待著下一個奇點(diǎn)的降臨。

       原文標(biāo)題 : 中美大模型“登月路”:谷歌與月之暗面的這一年

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號