訂閱
糾錯(cuò)
加入自媒體

機(jī)器人們,進(jìn)“大學(xué)”求“深造”

2025-12-01 15:39
商隱社
關(guān)注

盡管機(jī)器人技術(shù)發(fā)展多年,但距離真正意義上的“智能”仍有明顯差距。泛化能力弱、應(yīng)用場(chǎng)景受限、商業(yè)化進(jìn)程緩慢等問題,始終制約著整個(gè)行業(yè)的突破。即便在最新一代機(jī)器人身上,“摔跤”“反應(yīng)遲緩”“判斷失誤”等基礎(chǔ)性挑戰(zhàn)依然常見。

深入分析發(fā)現(xiàn),機(jī)器人的發(fā)展瓶頸已從硬件轉(zhuǎn)向軟件,最大的挑戰(zhàn)仍然在于 AI 模型的突破。如果將機(jī)器人比作人類,硬件相當(dāng)于發(fā)育完全的四肢,而 AI 才是真正的“大腦”,數(shù)據(jù)則是學(xué)習(xí)資料,騰訊云存儲(chǔ)所構(gòu)建的 Data Platform 數(shù)據(jù)平臺(tái),則相當(dāng)于支撐其全面成長(zhǎng)的“大學(xué)教育體系”。

帕西尼感知科技,作為國(guó)內(nèi)領(lǐng)先的高精度觸覺感知與具身智能核心技術(shù)企業(yè),其 CTO 張恒第在日前的采訪中指出:收集包含視覺、關(guān)節(jié)角度、動(dòng)作軌跡、語音,以及極為稀缺的觸覺模態(tài)在內(nèi)的人類與物理世界交互的全模態(tài)數(shù)據(jù),是一個(gè)非常龐大且復(fù)雜的工程,多方對(duì)比后,帕西尼把自己所收集的這些訓(xùn)練機(jī)器人所必需的全模態(tài)數(shù)據(jù),送進(jìn)“騰訊云大學(xué)”。

文 |  涵元編輯 |  浩然

本文為商隱社原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系后臺(tái)

機(jī)器人為何看著“笨”?

在今年4月的機(jī)器人馬拉松大賽上,一臺(tái)人形機(jī)器人緩慢前進(jìn),后面跟著幾十位工程師,他們忙著調(diào)算法、換電池、抗干擾。即便如此,大多數(shù)機(jī)器人還是頻繁摔跤,窘態(tài)百出。

這一現(xiàn)象背后,是早在20世紀(jì)80年代就由漢斯·莫拉維克等人提出的“莫拉維克悖論”:對(duì)人類而言困難的任務(wù)(如復(fù)雜運(yùn)算),對(duì)機(jī)器反而容易;而人類輕松完成的動(dòng)作(如感知與運(yùn)動(dòng)),對(duì)機(jī)器卻異常艱難。

原因在于,前者對(duì)于機(jī)器來說,是做減法。大語言模型(LLM)等技術(shù)將人類上百萬年積累的知識(shí)壓縮到機(jī)器里,當(dāng)你與 AI 聊天時(shí),相當(dāng)于你在與人類文明史對(duì)話。當(dāng)你與AI比賽時(shí),相當(dāng)于你與更高維度的智力對(duì)抗。

而后者對(duì)于機(jī)器人來說,是做加法。以“拿杯子”這樣的簡(jiǎn)單指令舉例,機(jī)器人操作起來,要經(jīng)歷6個(gè)步驟、13個(gè)技術(shù)領(lǐng)域。

機(jī)器人對(duì)“拿杯子”動(dòng)作的拆分

帕西尼 CTO 張恒第指出,人類執(zhí)行的每一個(gè)動(dòng)作,均涵蓋觸覺、視覺、關(guān)節(jié)角度、動(dòng)作軌跡、語音等多維度信息。人類本可輕松完成的任務(wù),對(duì)機(jī)器人來說卻極為復(fù)雜。

張恒第進(jìn)一步強(qiáng)調(diào):“機(jī)器人與物理世界的每一次交互都產(chǎn)生海量數(shù)據(jù)。以攤煎餅為例,單日數(shù)據(jù)量可達(dá)150TB,年數(shù)據(jù)規(guī)模達(dá) PB 級(jí)別,傳統(tǒng)本地存儲(chǔ)完全無法承載!彬v訊云存儲(chǔ) Data Platform 所支撐的采集數(shù)據(jù)上傳、存儲(chǔ)、訓(xùn)練環(huán)節(jié),便成為海量全模態(tài)具身數(shù)據(jù)高效推進(jìn)產(chǎn)業(yè)躍遷的關(guān)鍵。

機(jī)器人也需要“上大學(xué)”

為解決機(jī)器人學(xué)習(xí)難題,行業(yè)領(lǐng)先企業(yè)開始將機(jī)器人送入“大學(xué)”進(jìn)行系統(tǒng)訓(xùn)練。與人類不同,機(jī)器人的學(xué)習(xí)通過“訓(xùn)練數(shù)據(jù)-植入數(shù)據(jù)”模式完成,騰訊云存儲(chǔ) Data Platform 數(shù)據(jù)平臺(tái)正是這所“大學(xué)”的核心基礎(chǔ)設(shè)施。

我們先來看一下為何過去機(jī)器人學(xué)習(xí)不好:

● 一場(chǎng)數(shù)據(jù)饑荒。加州大學(xué)伯克利分校的機(jī)器人專家肯·戈德伯(Ken Goldberg)曾指出,人形機(jī)器人在技能獲取上,與 AI 聊天機(jī)器人存在著天壤之別。其核心癥結(jié)在于一場(chǎng)嚴(yán)重的“數(shù)據(jù)饑荒”,二者的差距為十萬年。

● 泛化能力不足。機(jī)器人基于大量數(shù)據(jù)驅(qū)動(dòng)的模式匹配,而非基于物理規(guī)律的理解和預(yù)測(cè)。這導(dǎo)致它們無法處理未知場(chǎng)景,無法進(jìn)行常識(shí)推理,更無法在失敗后進(jìn)行基于理解的反思與調(diào)整。

● 一個(gè)模型學(xué)習(xí)了與任務(wù)無關(guān)的特征(如視角、背景)跟動(dòng)作之間的虛假相關(guān)性,而非理解語言指令與目標(biāo)之間的真正關(guān)系。

比如,你向小孩介紹一只貓,下次遇到其他品種的貓,他也會(huì)反應(yīng)出來這是“貓”。但如果你喂養(yǎng)一個(gè)機(jī)器人,前期需要向他輸入大量貓的照片、類型、特征,訓(xùn)練成百上千次后,機(jī)器人才會(huì)明白,什么樣的物種,可以稱為貓。

這期間,如果有一只貓長(zhǎng)了斑點(diǎn),機(jī)器人就有可能將“斑點(diǎn)”與“貓”聯(lián)系起來,遇到帶斑點(diǎn)的衣服時(shí),機(jī)器人也可能認(rèn)為這是一只貓。

在這個(gè)過程中,數(shù)據(jù)量級(jí)、質(zhì)量、處理方式,都會(huì)對(duì)機(jī)器人的反應(yīng)造成重要影響。

基于全球頂級(jí)的觸覺感知技術(shù),帕西尼自研“人因”具身智能數(shù)據(jù)采集體系,采用“多維觸覺數(shù)據(jù)采集手套 PMEC ”+“空間視覺矩陣”的方式,高效、高質(zhì)地采集機(jī)器人所需的與物理世界交互的全維度數(shù)據(jù),用以幫助整個(gè)行業(yè)加速實(shí)現(xiàn)智能泛化進(jìn)程。帕西尼選擇了騰訊云存儲(chǔ) Data Platform 數(shù)據(jù)平臺(tái),張恒第介紹,他們看重騰訊云的點(diǎn)為:

一是海量彈性存儲(chǔ)。騰訊云存儲(chǔ)提供了海量、安全穩(wěn)定、低成本的存儲(chǔ)支持,滿足具身智能行業(yè)對(duì)海量統(tǒng)一存儲(chǔ)的要求。自動(dòng)冷熱數(shù)據(jù)分層,熱數(shù)據(jù)極速響應(yīng),冷數(shù)據(jù)沉降至低成本 COS 對(duì)象存儲(chǔ)。

二是模型訓(xùn)練加速。TB/s 級(jí)吞吐與亞毫秒級(jí)訪問延遲的數(shù)據(jù)處理流水線,消除 GPU 等計(jì)算資源的數(shù)據(jù)供給瓶頸,確保算力資源高飽和運(yùn)轉(zhuǎn),提升大規(guī)模模型訓(xùn)練與推理效率。

三是智能化數(shù)據(jù)治理。提供全局元數(shù)據(jù)索引與語義檢索能力,實(shí)現(xiàn)語音、視覺、傳感流等異構(gòu)數(shù)據(jù)的自動(dòng)關(guān)聯(lián)分析與血緣追溯,提升文件檢索效率,為仿真決策提供高一致性訓(xùn)練樣本,激活多模態(tài)數(shù)據(jù)協(xié)同價(jià)值。

“騰訊云的優(yōu)勢(shì)在于:可以將數(shù)據(jù)快速加載到分發(fā)系統(tǒng)里并調(diào)取數(shù)據(jù)。工具鏈完整,調(diào)取模型不必借助其他工具。即時(shí)反饋,看到模型需要修改處,幫助我們快速迭代。提供良好仿真環(huán)境,讓我們?cè)诓渴鹎熬湍茉谠粕线M(jìn)行大量仿真驗(yàn)證。安全能力高,有效防止外部攻擊。Data Platform 算力調(diào)度能力強(qiáng),可以投放大量仿真任務(wù)。我們可以只用幾行簡(jiǎn)單的命令,就能便捷地使用各種服務(wù),非常方便!睆埡愕谡f。

在騰訊云“大學(xué)”,數(shù)據(jù)被加工提練為可用“教材”,最后統(tǒng)一輸出給機(jī)器人,讓機(jī)器人突破本體限制,實(shí)現(xiàn)云上進(jìn)化,正如人突破了肉身限制,實(shí)現(xiàn)認(rèn)知升級(jí)。

從“硬件驅(qū)動(dòng)”到“智能驅(qū)動(dòng)”:機(jī)器人步入“智斗”時(shí)代

在機(jī)器人進(jìn)化史上,“硬件先行”曾是行業(yè)共識(shí),但如今形勢(shì)已變。培養(yǎng)具備認(rèn)知與決策能力的“機(jī)器人大腦”,不再只是技術(shù)趨勢(shì),更是產(chǎn)業(yè)發(fā)展的必然選擇。

從歷史維度看,缺乏軟件支撐的機(jī)器人注定被淘汰。以日本本田公司開發(fā)的阿西莫(ASIMO)為例,這款曾集奔跑、踢球、倒咖啡等技能于一身的機(jī)器人,在誕生22年后黯然退場(chǎng)。其根本原因在于,阿西莫每個(gè)動(dòng)作依賴三萬行控制代碼手動(dòng)編寫,無法適應(yīng)AI驅(qū)動(dòng)的新時(shí)代。相比之下,現(xiàn)代機(jī)器人通過 AI 訓(xùn)練,僅用幾小時(shí)就能掌握后空翻、打太極等高難度動(dòng)作,效率與靈活性形成鮮明對(duì)比。

帕西尼 CEO 許晉誠(chéng)指出,中國(guó)在機(jī)器人硬件制造上已位居全球第一梯隊(duì),但“成年人的身體不能配小孩的腦子”。僅靠硬件性能的堆砌,無法滿足現(xiàn)代產(chǎn)業(yè)對(duì)柔性生產(chǎn)、個(gè)性化服務(wù)和快速適應(yīng)的需求。

在這一背景下,“智斗”能力成為機(jī)器人的核心競(jìng)爭(zhēng)力。

帕西尼 CTO 張恒第強(qiáng)調(diào):“短期目標(biāo)是持續(xù)迭代帕西尼包括傳感器、靈巧手、人形機(jī)器人、數(shù)據(jù)采集系統(tǒng)等觸覺產(chǎn)品矩陣的能力;長(zhǎng)期目標(biāo)是通過帶有重要觸覺模態(tài)的全鏈條具身智能核心技術(shù),推動(dòng) AI 與物理世界的深度融合,加速具身智能在物理世界中的認(rèn)知與操作能力進(jìn)化!痹谶@一進(jìn)程中,騰訊云提供的存儲(chǔ)與算力支持成為關(guān)鍵基礎(chǔ)設(shè)施。通過其高可用、高并發(fā)的數(shù)據(jù)處理能力,有望降低具身智能研發(fā)的門檻,加速“智能涌現(xiàn)”時(shí)刻的到來。

當(dāng)前,機(jī)器人廠商正積極構(gòu)建“數(shù)據(jù)飛輪”閉環(huán)——通過實(shí)際場(chǎng)景中的數(shù)據(jù)反饋持續(xù)優(yōu)化模型,進(jìn)而提升機(jī)器人的智能水平。帕西尼的 TORA-ONE 機(jī)器人已應(yīng)用于醫(yī)療、物流、工業(yè)制造乃至地鐵安檢等多元場(chǎng)景,不同領(lǐng)域的數(shù)據(jù)特性與任務(wù)需求,進(jìn)一步凸顯了云端訓(xùn)練與迭代的重要性。

如今,在騰訊云存儲(chǔ)構(gòu)建的“大學(xué)”環(huán)境中,機(jī)器人正實(shí)現(xiàn)從單體智能到群體智能的跨越。當(dāng)機(jī)器人從這所“大學(xué)”畢業(yè)之時(shí),就是其真正融入人類生活、開啟智能新紀(jì)元的開端。

       原文標(biāo)題 : 機(jī)器人們,進(jìn)“大學(xué)”,求“深造”

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)