訂閱
糾錯(cuò)
加入自媒體

具身智能一定要像人嗎?

每當(dāng)提到具身智能,第一反應(yīng)可能就是一個(gè)人型機(jī)器人,擁有和人類一樣的外貌,可以行走、奔跑,甚至可以承擔(dān)人類的一些簡單的重復(fù)工作,那具身智能就一定要像人嗎?

什么是具身智能?

具身智能強(qiáng)調(diào)的不僅是大模型思考的能力,還包括用身體去感知、去試錯(cuò)、去碰環(huán)境的過程。舉個(gè)簡單的例子,你擰瓶蓋、用筷子夾菜、在擁擠的人群里穿行,這些動(dòng)作背后不僅有腦子在算,手指的形狀、皮膚的觸覺、關(guān)節(jié)的可動(dòng)范圍這些“身體屬性”也在幫忙,具身智能要實(shí)現(xiàn)的,也是這些能力。這種把身體和認(rèn)知綁在一起的想法叫做“具身認(rèn)知”,在機(jī)器人領(lǐng)域便被稱作“具身智能”。

圖片源自:網(wǎng)絡(luò)

具身智能的關(guān)注點(diǎn)比傳統(tǒng)的“把大腦搬上機(jī)器”更高些。傳統(tǒng)機(jī)械的功能實(shí)現(xiàn)是將傳感器數(shù)據(jù)傳給中央算法,再輸出動(dòng)作;而具身智能強(qiáng)調(diào)的是感知和動(dòng)作是一個(gè)聯(lián)動(dòng)的閉環(huán)。比如機(jī)器人下樓梯的一個(gè)動(dòng)作,它的相機(jī)、腳感傳感器、控制器和腿的機(jī)械結(jié)構(gòu)將共同決定它能不能安全下臺(tái)階。腿的長度、彈性、腳底形狀這些“物理細(xì)節(jié)”會(huì)顯著影響控制策略和學(xué)習(xí)效率。把這些因素當(dāng)作整體來考慮,能省掉很多計(jì)算量,讓系統(tǒng)更穩(wěn)健、更高效。

身體為什么會(huì)影響智能?

了解了具身智能是個(gè)啥,相信一定會(huì)有人覺得奇怪,既然身體只是執(zhí)行工具,又怎么會(huì)影響智能呢?其實(shí)對(duì)于具身智能來說,身體本身就能做一部分“計(jì)算”,這也是具身智能領(lǐng)域常說的“形態(tài)學(xué)計(jì)算”。比方說帶彈簧的腿在跑步時(shí)會(huì)把能量部分存起來再釋放,減少控制器需要實(shí)時(shí)調(diào)節(jié)的幅度;軟體機(jī)器人可用被動(dòng)變形來適應(yīng)復(fù)雜地形,靠材料的特性來完成一部分感知和調(diào)節(jié)工作。這些都是身體用物理法則在替模型“算”事情,從而讓高層控制和學(xué)習(xí)的負(fù)擔(dān)減輕。

人類和動(dòng)物的行為邏輯并不是先把世界看清楚再?zèng)Q定做什么,而是在不斷試探中感知世界。一個(gè)抓取動(dòng)作會(huì)在觸覺到來的一瞬間修正手指的位置和力度。機(jī)器人如果能把感知和動(dòng)作緊密耦合,就能用更少的感知數(shù)據(jù)、用更簡單的模型完成復(fù)雜任務(wù)。具身智能的設(shè)計(jì)中一定要把傳感器布局、機(jī)械結(jié)構(gòu)和控制算法一起設(shè)計(jì),而不是先決定“大腦”再把身體套進(jìn)去,這就是所謂的身體與控制協(xié)同設(shè)計(jì)。

圖片源自:網(wǎng)絡(luò)

由于不同的任務(wù)和環(huán)境天然適合不同的身體形態(tài)。在平整地面上做巡檢,輪式平臺(tái)既省能又可靠;在復(fù)雜的野外環(huán)境里,四足或多足機(jī)器人因?yàn)橥饶軌蚩缭秸系K而更合適;在狹窄復(fù)雜的管道內(nèi)部,軟體蛇形機(jī)器人更容易通過,這都會(huì)決定具身智能的外貌。而在廚房、辦公室等場景的很多工具和家具都是為人設(shè)計(jì)的,這時(shí)候如果機(jī)器有類似人的手部和活動(dòng)范圍,就能更方便地使用現(xiàn)成工具。

具身智能一定要像人嗎?

其實(shí)說到這里,對(duì)于具身智能是否要像人這個(gè)問題的答案就已經(jīng)很明確了,那便是“不一定”。具身智能是否要做成人形,取決于任務(wù)、環(huán)境、交互對(duì)象和成本效益等因素。在很多實(shí)際應(yīng)用里,非人形的設(shè)計(jì)會(huì)更簡單、更可靠、更經(jīng)濟(jì),也更能滿足需求。掃地機(jī)器人只要能在地上移動(dòng)、避障、吸塵就行,完全不需要兩條腿或者一張臉。倉庫里搬箱子的機(jī)械臂、港口的自動(dòng)化堆高機(jī)、農(nóng)業(yè)里的植保無人機(jī),這些都是具身智能的應(yīng)用場景,但它們的形態(tài)各異,且都不需要模仿人的外貌。

既如此,相信又會(huì)有很多小伙伴會(huì)問,為什么現(xiàn)在很多發(fā)布會(huì)一直偏好做“像人”的機(jī)器人?其實(shí)這有幾方面原因。社會(huì)交互的便利性。當(dāng)機(jī)器人要承擔(dān)陪伴、接待或醫(yī)療輔助手段時(shí),人類習(xí)慣用人的交流方式理解和評(píng)價(jià)對(duì)方。面部表情、語言、手勢這些社交信號(hào)如果被機(jī)器人部分復(fù)現(xiàn),會(huì)讓非專業(yè)用戶更容易接受和信任。

圖片源自:網(wǎng)絡(luò)

現(xiàn)有的人類環(huán)境本身也對(duì)“人形”有天然偏好,門把手、臺(tái)階、座椅這些東西是以人的身體尺度和操作習(xí)慣設(shè)計(jì)的。如果希望機(jī)器人直接在現(xiàn)有環(huán)境里工作,模仿人的手和臂會(huì)更具適應(yīng)性。此外,這也有一定的文化和審美驅(qū)動(dòng),研究團(tuán)隊(duì)或公司可能以“機(jī)器人像人”為產(chǎn)品賣點(diǎn),從而吸引更多人的討論。

雖然很多企業(yè)都崇尚仿人的具身智能,但這樣的設(shè)計(jì)會(huì)帶來很多問題。仿人設(shè)計(jì)在力學(xué)控制、穩(wěn)定性、能耗和可靠性上都有更高要求。雙足行走的平衡控制本身就很難,制造出一個(gè)既靈活又耐用的仿人關(guān)節(jié)需要復(fù)雜的傳感器和高性能執(zhí)行器,整體成本很高,這也是為何在小鵬的“IRON”人形機(jī)器人在發(fā)布會(huì)上走了一圈后,被大家廣泛討論的原因。

再者,仿人外形如果行為不夠協(xié)調(diào),就容易觸發(fā)“恐怖谷”效應(yīng),反而讓人感到不舒服。而且仿人設(shè)計(jì)需要非常復(fù)雜的機(jī)構(gòu)設(shè)計(jì),越復(fù)雜的機(jī)構(gòu)、越多的自由度,意味著越多的潛在故障點(diǎn),這會(huì)讓維護(hù)成本大幅上升。

反觀人類的設(shè)計(jì),很多產(chǎn)品外觀都是由大自然的動(dòng)物提供的靈感,自然界中的動(dòng)物外形是各異的。章魚的柔軟身體解決了復(fù)雜環(huán)境下的抓握問題,鳥類的空中機(jī)動(dòng)性給飛行提供了不同的方案,魚類的流線形適合水下推進(jìn)。這也說明模仿某種生物的特性可以帶來優(yōu)勢,但不必非得模仿人類。具身智能的外觀設(shè)計(jì)也應(yīng)如此,要從功能出發(fā),而不是僅以“像人”這一審美目標(biāo)去設(shè)計(jì)。

最后的話

回到一開始的問題,具身智能一定要像人嗎?可以肯定地回答:不一定。具身智能的形態(tài)應(yīng)由任務(wù)和使用場景決定,而不是由對(duì)“像人”的偏好主導(dǎo)。很多情況下,非人形的設(shè)計(jì)會(huì)更節(jié)能、更可靠、更易落地。當(dāng)然,當(dāng)交互和社會(huì)接受度成為關(guān)鍵因素時(shí),有選擇地做一些擬人化的特征(比如更容易理解的面部顯示或語音交互)是有價(jià)值的,但那不等于要做一個(gè)全功能的擬人機(jī)體。

-- END --

       原文標(biāo)題 : 具身智能一定要像人嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)