訂閱
糾錯
加入自媒體

羅福莉首秀,雷軍的AI新戰(zhàn)事

圖片

文|魏琳華

編|王一粟

從年初曝出與雷軍接觸、離職,到上個月官宣加入小米,再到本月出席小米“人車家全生態(tài)大會”,被冠以“天才少女”名號的羅福莉,站在臺前拿出了新模型MiMo-V2-Flash。

剛剛在這個領(lǐng)域開始起跑的小米,交出了一份看起來不錯的成績單。

作為一個參數(shù)309B、激活參數(shù)15B的“大”模型(羅福莉本人也提到,這個尺寸小到不愿意稱之為大模型),在小米團(tuán)隊的構(gòu)想中,這個模型是為了給Agent當(dāng)基座來訓(xùn)練的。

為此,這個模型的優(yōu)化更加側(cè)重一些特定的方向,核心是高性價比、快速:

比如能夠達(dá)到每秒150 tokens的生成速度、極低的成本,在保持高性價比的同時,它還保證了模型的性能。

“它的代碼能力和 Agent 能力在世界級公開公正的評估榜單上,已經(jīng)進(jìn)入了全球開源模型 Top 1-2 的行列。”羅福莉說,“大部分評估基準(zhǔn)已經(jīng)超過或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相當(dāng),但它的參數(shù)是后者們的1/2-1/3。”

圖片

發(fā)布的小米模型,也面臨了兩極分化的口碑,有人盛贊模型代碼能力領(lǐng)先,有人則認(rèn)為這是一個“刷分”之作。

無論如何,小米需要AI。

選在12月18日的人車家全生態(tài)大會,更說明了AI之于小米的重要性。

放到智能終端,擺在小米眼前的兩個任務(wù)是:第一,做輕量化模型,靠端側(cè)部署,升級“超級小愛”和澎湃OS,把AI接入智能終端;第二,智駕方面,小米則更需要大模型做基座,靠模型給智駕能力提升空間。

做AI上,小米用行動表示,自己“動真格”了。

01 壓成本、提速,小米押注Agent

從一開始,小米做AI的目標(biāo),或許早在2023年雷軍的年度演講上就提到了——“輕量化+端側(cè)部署”。

羅福莉在演講中直言,當(dāng)下模型學(xué)習(xí)的方向與生物智能的進(jìn)化方向存在背離,單純的“大力出奇跡”已難以涌現(xiàn)更高階的智能。

當(dāng)Scaling Law能夠帶來的提升越來越少,小米選擇了一條更契合自身的路:做一個參數(shù)小、性能好且夠便宜的模型。

“Scaling的范式已經(jīng)逐步從預(yù)訓(xùn)練(Pre-train)轉(zhuǎn)向后訓(xùn)練(Post-train),”羅福莉解釋道,“我們?nèi)绾渭ぐl(fā)后訓(xùn)練的潛能?這就需要一個穩(wěn)定的范式,以便在強化學(xué)習(xí)(RL)上投入更多的算力。”

為此,作為一個給Agent打底的模型,MiMo-V2-Flash的優(yōu)化邏輯指向了三個關(guān)鍵問題:

高效溝通:強化代碼能力和工具調(diào)用,這是智能體交互的基礎(chǔ)。

加速帶寬:通過極高的推理效率,解決智能體之間信息傳遞的瓶頸。

發(fā)力后訓(xùn)練:通過穩(wěn)定范式,激發(fā)強化學(xué)習(xí)的潛能。

圖片

由此,小米做了個309B的大模型MiMo-V2-Flash,從指標(biāo)上來看,它最突出的地方在于代碼能力。

在官方給出的數(shù)據(jù)中,可以看到,在SWE-Bench Multilingual(軟件工程基準(zhǔn)測試中的多語言版本)中,該模型甚至超過了包括GPT-5在內(nèi)的一眾閉源大模型。

雖然在其他指標(biāo)上,該模型和DeepSeek V3.2、kimi k2 Thinging等開源模型還有些許差距,但作為一個尺寸較小的模型,表現(xiàn)已經(jīng)很亮眼。

更核心的其實是這個模型在推理速度和價格上的優(yōu)化:

用Claude Sonnet 4.5作為對比指標(biāo),小米新模型的推理價格僅為其2.5%,生成速度卻是其2倍。

MiMo-V2-Flash的API定價為,輸入0.7元/百萬tokens,輸出2.1元/百萬tokens。和國內(nèi)模型相比,這也是一個非常具備競爭力的價格。

圖片

為了優(yōu)化成本,提升推理速度,小米披露了其背后的技術(shù)架構(gòu)選擇——混合注意力機制。

從混合注意力機制上下手,月之暗面、MiniMax等獨角獸也曾在類似方向上探索。

小米的選擇是,采用了5:1的滑動窗口注意力(Sliding Window Attention, SWA)與全局注意力(Global Attention, GA)的混合結(jié)構(gòu)。

官方實驗表明,SWA在長文和推理能力上優(yōu)于主流的線性注意力機制,且固定大小的KV Cache極易適配現(xiàn)有的基礎(chǔ)設(shè)施(Infra)。

不過,對于小米來說,如果要達(dá)到在會上宣講的效果,把模型接入到車、手機等設(shè)備中,300B還是一個不小的規(guī)模,距離端側(cè)落地仍有距離。

最耐人尋味的,或許是羅福莉在演講時的結(jié)語:

“AI進(jìn)化的下一個起點,一定要有一個可以跟真實環(huán)境交互的物理模型,”羅福莉說道,“我們要打造的本質(zhì)上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。”

從今年小米的模型發(fā)布動態(tài)上,我們猜測,小米未來的優(yōu)化將被拆解為兩條線:一是死磕端側(cè),為智能終端加碼;二是攻克物理模型,補足在智駕方面的模型能力。

02 做端側(cè)、做智駕AI給小米全家桶打底

無論外界對參數(shù)和架構(gòu)的討論如何熱烈,對小米而言,AI的價值最終必須回歸到業(yè)務(wù)。

選在12月18日的人車家全生態(tài)大會發(fā)布模型,本身就說明了AI之于小米的戰(zhàn)略意義:

在智能終端側(cè),通過升級“超級小愛”和澎湃OS,讓它們從指令執(zhí)行者變?yōu)檎嬲闹;在智能駕駛側(cè),則急需大模型作為基座,拓展智駕的上限。

回顧2025年,小米在MiMo系列上的發(fā)力呈現(xiàn)出一種急行軍的態(tài)勢,不同于兩年前模型發(fā)布后的安靜,今年的小米高調(diào)了起來。

4月:開源MiMo-7B系列,覆蓋基礎(chǔ)、指令微調(diào)及強化學(xué)習(xí)版。

5月:發(fā)布MiMo-VL-7B,突破多模態(tài)視覺理解。

11月:推出MiMo-Embodied具身智能大模型,整合自動駕駛與機器人技術(shù)。

12月:MiMo-V2-Flash壓軸登場,主打極致效率與Agent能力。

這一連串動作的背后,是巨額的真金白銀。小米集團(tuán)總裁盧偉冰在財報電話會上明確表示,AI是核心研發(fā)方向。2025年,小米研發(fā)投入預(yù)計超過300億元,其中四分之一(約75億元)將直接砸向AI領(lǐng)域,并計劃在未來五年投入超過2000億元。

“在端側(cè),我們要追求輕量算力、低功耗和周期成本,這樣才能普及端側(cè)AI,”盧偉冰說道,“這一定是小米未來的大方向,也是小米的優(yōu)勢所在。”

組織層面的動作,同樣印證了小米的決心:從2024年開始,小米搭建了自己的AI Infra平臺,去年年底,界面新聞爆出,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。據(jù)悉,其團(tuán)隊在成立時已有6500張GPU資源。

為了支撐這一戰(zhàn)略,小米的人才拼圖也在2025年逐步完整。

除了負(fù)責(zé)基礎(chǔ)大模型的羅福莉,小米還挖來了陳龍服務(wù)于智駕團(tuán)隊。這種“雙核”配置在技術(shù)路線上已經(jīng)初見成效——陳龍團(tuán)隊提出并開源了全球首個打通自駕與具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。

圖片

這一模型試圖解決自動駕駛與機器人之間的知識遷移難題,意味著小米正在嘗試用一套通用的AI邏輯,去驅(qū)動其龐大的硬件生態(tài)——從手中的手機,到智能家居,再到智駕。

雷軍曾提到,小米的AI戰(zhàn)略是“輕量化+本地部署”?梢钥吹剑∶资且欢〞迷谌蜻B接超過10億臺設(shè)備的巨大存量優(yōu)勢,靠AI做業(yè)務(wù)。

對于小米來說,MiMo-V2-Flash的發(fā)布不僅僅是為了在排行榜上占據(jù)一席之地。它是小米試圖向資本市場和用戶講述的一個新故事:

一家硬件公司,正在通過掌握最高效的“大腦”(AI模型)和最廣泛的“身體”(人車家生態(tài)),試圖在智能時代完成一次徹底的進(jìn)化。

至于這個故事能否講通,不僅取決于模型做得好不好,更取決于這些技術(shù)能否真正跑通每一臺小米設(shè)備,轉(zhuǎn)化為用戶感知得到的體驗。

       原文標(biāo)題 : 羅福莉首秀,雷軍的AI新戰(zhàn)事

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號