訂閱
糾錯
加入自媒體

AI眼鏡與AI手機,巨頭的軟硬雙打!

【AI時代,不做硬件的公司可能正在失去下一輪的控制權(quán)!

作者:高恒 出品:高見觀潮 全文約3500字,閱讀時間大約5分鐘

別再盯著大模型參數(shù)誰更大了,真正的競賽剛剛開始。

一個月內(nèi),阿里一口氣發(fā)了6款AI眼鏡,今天字節(jié)直接把豆包塞進手機系統(tǒng),還備貨了50萬臺新機樣品。這不是玩票,這是硬剛?cè)肟凇?/p>

模型再強,用戶感知不強就白搭。當所有人都開始喊Agent、講“意圖直達”,你會發(fā)現(xiàn)——AI真正要爭的,不是“誰回答得更聰明”,而是“誰更像你的操作系統(tǒng)”。

一個是跳出手機的眼鏡,一個是重寫手機的助手,本質(zhì)上都是在爭“下一代人機交互”的船票。這背后,不只是交互方式的變化,更是平臺控制權(quán)的遷移。

云上斗完了,現(xiàn)在,是時候在設備上分勝負了。

一、大模型見頂之后,入口決定勝負

在AI浪潮的上半場,大模型是絕對主角。誰擁有更大的參數(shù)、更廣的訓練數(shù)據(jù)、更快的推理速度,誰就能在行業(yè)博弈中搶占制高點。但到了2024年下半年,這場模型競賽開始顯露疲態(tài)。

不僅OpenAI、Anthropic等頭部玩家紛紛推遲下一代模型發(fā)布周期,國內(nèi)頭部大模型的能力差距也在快速收斂?淇恕⒍拱、文心一言、通義千問在理解能力上的拉鋸戰(zhàn),開始讓用戶感知變得模糊。技術(shù)天花板尚未抵達,用戶熱情卻已滯漲。模型本身,已難再成為決定性變量。

于是焦點轉(zhuǎn)移了——從模型本身的“強”,轉(zhuǎn)向模型如何“用起來”,轉(zhuǎn)向人。

但人并不直接使用模型,而是通過終端使用服務。這意味著,誰能掌控更貼近用戶的觸點,誰就擁有將模型能力轉(zhuǎn)化為服務價值的主導權(quán)。放在AI語境下,這些觸點正是AI手機、AI眼鏡這類嵌入式硬件。

阿里智能終端產(chǎn)品負責人晉顯公開直接點出其中邏輯:“所有大模型訓練的數(shù)據(jù)都要依賴于端發(fā)生的業(yè)務數(shù)據(jù)去訓練,很多模型都是被手機、平板、電腦這些使用場景采集了數(shù)據(jù),去服務于這些場景”。也就是說,端側(cè)不僅是模型的分發(fā)終端,更是它的“反饋閉環(huán)”。每一次用戶調(diào)用、每一個交互路徑、每一條操作記錄,都是對模型能力的反向加持。

知名科技產(chǎn)業(yè)時評人彭德宇對我們表示:更進一步,當AI進入“Agent階段”,這一趨勢更加顯著。傳統(tǒng)的“你問我答”Chatbot邏輯已經(jīng)不夠,新的用戶期待是“說一句話,它幫我把事做了”,這意味著AI不僅要理解語言,還要介入實際的任務鏈執(zhí)行。

以新發(fā)布德豆包手機助手為例,用戶說“幫我在美團給上周的訂單寫個好評”,它要能跨越多個App、識別頁面元素、模擬點擊路徑,完成一個完整的任務鏈。沒有足夠深的操作系統(tǒng)權(quán)限,沒有多模態(tài)大模型的屏幕理解能力,這幾乎無法實現(xiàn)。

而這樣的能力,恰恰需要端側(cè)作為落地場景。

端側(cè)的價值不僅在于“交互效率”,更在于“生態(tài)主導權(quán)”。對大廠而言,用戶用的是誰的設備、在哪個系統(tǒng)上執(zhí)行任務、誰擁有權(quán)限調(diào)用入口,決定了未來平臺格局的基本盤。

OpenAI今年五月以近65億美元收購由蘋果前首席設計官艾維創(chuàng)立的硬件公司IO,被認為是All in Agent硬件的戰(zhàn)略信號;谷歌Gemini團隊與三星合作推進端側(cè)部署;國內(nèi)的小米、理想、阿里、字節(jié)也都通過不同方式介入終端形態(tài)改造。

這不是“造硬件”本身的熱情,而是“不能失去入口”的焦慮。

如果說GPT把人拉進了AI時代的門檻,那么從2025年開始,AI真正走入用戶生活的那扇門,可能不在云上,而在你眼前那副眼鏡、或你手上那臺手機里。

二、兩種路徑,一個目標:爭奪下一代入口

雖然都在AI硬件賽道出手,阿里和字節(jié)的路線卻幾乎南轅北轍。

阿里選擇從頭開始造一個新物種——AI眼鏡。11月27日發(fā)布的6款夸克AI眼鏡,在我看來幾乎都是“功能優(yōu)先”的工程機風格,不講究時尚,不妥協(xié)形態(tài),直接奔著實用性而去。它的使命并不是打動普通消費者,而是跑通“感知式人機交互”這套邏輯。

阿里眼中的AI眼鏡,是下一代“個人移動入口”。它不是手機的配件,而是對手機場景的逐步替代者。阿里智能終端業(yè)務負責人宋剛在發(fā)布會上明確表示:“它是未來最有機會挑戰(zhàn)手機的設備!边@不是營銷話術(shù),而是一次徹底的交互重估。

在手機時代,用戶要通過“下載App—打開—搜索—操作”完成任務。而AI眼鏡希望用戶只需要一句話,“幫我拍照上傳微博”,AI就能調(diào)用攝像頭、識別場景、發(fā)布內(nèi)容。底層邏輯已不再是App,而是Agent:一個能理解意圖并主動執(zhí)行的交互中樞。

這背后是阿里云端模型與終端協(xié)同的典型思路。大模型未來要迭代,必須靠端側(cè)采集的業(yè)務數(shù)據(jù)“喂養(yǎng)”;只有做自己的硬件,才有足夠權(quán)限打通數(shù)據(jù)采集、系統(tǒng)調(diào)用和用戶交互的全流程。

相比之下,字節(jié)選擇了幾乎完全相反的路徑:它不造手機,但卻要“重做手機系統(tǒng)”。

12月1日發(fā)布的豆包與中興合作的工程樣機nubia M153手機并不算新硬件,其核心賣點是“豆包手機助手”——一個內(nèi)嵌操作系統(tǒng)、具備完整任務鏈執(zhí)行能力的AI Agent。它能理解屏幕界面、模擬點擊、跨App跳轉(zhuǎn),實現(xiàn)“意圖直達服務”。

不同于傳統(tǒng)語音助手的淺層指令執(zhí)行,豆包助手深入到操作系統(tǒng)底層,通過多模態(tài)大模型理解圖形界面,實現(xiàn)“虛擬屏幕內(nèi)完成復雜任務”的能力。比如“下個月去巴黎,幫我把收藏的餐廳標在地圖上”,豆包能拆解出6步操作,包括社交媒體提取、高德地圖標記、攜程訂票、備忘錄整理等,像人一樣執(zhí)行。

這其實是在“重構(gòu)手機操作系統(tǒng)的主控邏輯”,讓AI成為系統(tǒng)的“第一入口”,而不是App里的一個功能。

字節(jié)選了更靈活的策略:和手機廠商合作,用軟件能力深嵌設備生態(tài)。據(jù)極客公園援引前中興產(chǎn)品經(jīng)理消息,nubia M153的首銷備貨量高達50萬臺,對一個AI助手的系統(tǒng)級預裝項目來說,這已經(jīng)是一個很激進的數(shù)字。

這不是字節(jié)第一次布局硬件。早在2018年,它就收購錘子團隊切入手機生態(tài);2021年并購PICO進軍VR;2024年初收購Oladance切入AI耳機……如今,這些硬件資源已全部整合進“字節(jié)Ocean部門”,由36氪創(chuàng)始人劉成城負責,對上Flow負責人朱駿。從組織上看,這已是字節(jié)少有的戰(zhàn)略級部門配置。

阿里是在造一個新的入口設備,字節(jié)則是在改造現(xiàn)有入口系統(tǒng);前者是用“設備+場景”顛覆App邏輯,后者是用“系統(tǒng)+模型”改寫交互協(xié)議。但目標是一致的——誰能在終端掌握主動權(quán),誰就可能在AI平臺時代擁有下一個生態(tài)級入口。

無論路徑如何不同,這一次兩家互聯(lián)網(wǎng)巨頭都給出了同一個答案:AI時代的主場,正在向設備端遷移。

三、泡沫還是起點?AI硬件的現(xiàn)實與不確定性

AI硬件聽起來像是下一個“風口”,但現(xiàn)實的落地比預期要更復雜得多。

先看豆包AI手機。雖然首銷備貨量達50萬臺,在中興這一體量的廠商體系里已是重量級投入,但距離主流旗艦機動輒200萬~300萬臺的出貨量仍有明顯差距。更何況,它的售價高達3499元,本質(zhì)上面向的并不是大眾市場,而是開發(fā)者和極客用戶。這款產(chǎn)品更像是一種“技術(shù)驗證型入口”:用來測試AI助手的落地體驗,打磨系統(tǒng)調(diào)用邏輯,積累系統(tǒng)權(quán)限合作的模板,而不是一款真正意義上的消費電子產(chǎn)品。

但哪怕只是“預覽版”,豆包助手所暴露的技術(shù)不確定性也并不輕。無論是“任務鏈執(zhí)行”是否穩(wěn)定、“屏幕識別”是否準確,還是在多App之間執(zhí)行任務時的異常處理、誤觸判斷、安全容錯,系統(tǒng)層級的AI控制本質(zhì)上是對操作系統(tǒng)架構(gòu)的一次重構(gòu)。而任何一個Bug,都可能造成用戶體驗的災難。

官方文檔也明確提示,當前“操作手機”功能尚處在技術(shù)預覽階段,離大規(guī)模穩(wěn)定落地仍有距離。這種在“幻想”和“現(xiàn)實”之間拉扯的狀態(tài),也反映出AI Agent在現(xiàn)階段仍處于打磨期。

阿里的AI眼鏡同樣如此。雖然一次性推出6款產(chǎn)品展現(xiàn)了極高的戰(zhàn)略押注意圖,但目前這類設備在國內(nèi)幾乎沒有明確的市場基礎。從產(chǎn)品形態(tài)來看,夸克AI眼鏡走的是“感知驅(qū)動 + Agent操控”的極簡路線,追求的是“開機即用、對話即交互”,這在邏輯上具備顛覆手機的潛力,但技術(shù)條件尚不成熟。

尤其是當前AI眼鏡在傳感器、續(xù)航、算力集成方面仍面臨顯著瓶頸。真正做到“識別環(huán)境 + 意圖理解 + 動作執(zhí)行”,至少需要設備具備穩(wěn)定的多模態(tài)推理能力和完整的場景建模能力。這在2025年仍是一個高門檻命題。

更現(xiàn)實的問題是,用戶是否真的準備好將“交互權(quán)”交給AI?

豆包助手已經(jīng)具備在后臺“自動操作”的能力,可以繞過用戶主動點擊,實現(xiàn)任務鏈閉環(huán)。但這也引發(fā)了另一個問題:數(shù)據(jù)權(quán)限、個人隱私、支付安全該如何保障?在官方演示中,盡管支付環(huán)節(jié)仍保留人工確認機制,但AI Agent繞開App、直接模擬交互操作的能力,仍然存在被濫用的風險。尤其是在安全邊界尚未建立、系統(tǒng)權(quán)限標準不統(tǒng)一的階段,這類“能力超綱”的AI產(chǎn)品可能會成為監(jiān)管灰區(qū)。

盡管如此,這一波AI硬件熱并不等于泡沫。

恰恰相反,它是大模型平臺進化的必然階段。當Chatbot不再新鮮、App用戶增速放緩、模型能力難以被感知,只有通過重構(gòu)交互形態(tài),AI才能重新塑造自己的“用戶價值感知界面”。

硬件,不是終點,而是一次“打通入口-調(diào)用系統(tǒng)-采集數(shù)據(jù)-反饋模型”的平臺級重構(gòu)。

眼下,谷歌的AI眼鏡項目已進入POC階段;小米、理想分別在AI眼鏡和車載AI助手上頻頻試水;OpenAI收購IO打造Agent硬件設備;字節(jié)通過豆包助手測試全鏈路系統(tǒng)整合;阿里則押注眼鏡形態(tài)挑戰(zhàn)手機主導權(quán)——全球范圍內(nèi),科技公司正圍繞“平臺級AI入口”展開新一輪布局。

這不只是一場硬件更新戰(zhàn),而是一個新平臺周期的啟動信號。

文字丨高見觀潮原創(chuàng)內(nèi)容,轉(zhuǎn)載請聯(lián)系授權(quán)

       原文標題 : AI眼鏡與AI手機,巨頭的軟硬雙打

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號