2024年注定是個(gè)不平凡的一年。全球科技界、學(xué)術(shù)界與主要經(jīng)濟(jì)體的目光,都聚焦在了具身智能上。
全球科技巨頭紛紛布局:Figure的Figure 01與02、特斯拉的擎天柱Optimus、1X的NEO和EVE、優(yōu)必選的Walker S等人形機(jī)器人相繼問世,掀開了未來世界的一角。
全球高校與科研機(jī)構(gòu)成果頻出:斯坦福大學(xué)的具身智能系統(tǒng)VoxPoser、卡內(nèi)基梅隆大學(xué)的全身遙控系統(tǒng)OmniH2O、北京大學(xué)的具身導(dǎo)航系統(tǒng)DiscussNav等接連發(fā)布,走在了基礎(chǔ)研究前沿。
主要經(jīng)濟(jì)體紛紛出臺(tái)發(fā)展戰(zhàn)略:中、美、日、韓等均積極推動(dòng)具身智能產(chǎn)業(yè)發(fā)展,以應(yīng)對(duì)老齡化、部分行業(yè)人力資源短缺等社會(huì)問題。
正因如此,2024年被譽(yù)為具身智能發(fā)展元年,AI新紀(jì)元已經(jīng)開啟。
到底什么是具身智能?
1950年,圖靈在其經(jīng)典論文中提出人工智能的終極形態(tài)是像人一樣能與環(huán)境交互感知,自主規(guī)劃、決策、行動(dòng)和執(zhí)行的機(jī)器人或仿真人(在虛擬環(huán)境中),并提出了判斷人工智能的“圖靈測(cè)試”,后世發(fā)展出來離身智能(無物理實(shí)體)、具身智能(有物理實(shí)體)兩大演進(jìn)路徑。
大語言模型(LLM)就是離身智能,隨著技術(shù)的不斷成熟,一些大語言模型已經(jīng)在“圖靈測(cè)試”中表現(xiàn)出驚人的人類特征,這標(biāo)志著離身智能已經(jīng)躍升至新的高度,但其沒有物理實(shí)體、無法與物理世界進(jìn)行感知交互的天然短板也成了最大桎梏。
在此背景下,以“環(huán)境交互+物理實(shí)體+AI”為典型特征的具身智能進(jìn)入發(fā)展新紀(jì)元。
具身智能(Embodied AI)是指通過機(jī)器人等物理實(shí)體與環(huán)境交互,能進(jìn)行環(huán)境感知、信息認(rèn)知、自主決策和采取行動(dòng),并能夠從經(jīng)驗(yàn)反饋中實(shí)現(xiàn)智能增長(zhǎng)和行動(dòng)自適應(yīng)的智能系統(tǒng)。
人形機(jī)器人或是具身智能終極形態(tài)
具身智能的物理實(shí)體有很多,可以是車間里的機(jī)械手,也可以是無人車、無人機(jī)、機(jī)器狗,還可以是上身是人形、下身是輪子的特殊形態(tài),但最受關(guān)注的還是人形。
人類世界的所有場(chǎng)景和工具都是以人為中心設(shè)計(jì)的,如果把機(jī)器人設(shè)計(jì)成“人形”,將天生適合人類的生產(chǎn)、生活場(chǎng)景。
因此,人形機(jī)器人也被認(rèn)為是具身智能的終極形態(tài),也是科技巨頭和高校們最為青睞的探索方向。
傳感器是實(shí)現(xiàn)感知交互的關(guān)鍵
具身智能雖然不是人類,但它可以像人類一樣感知、理解、決策,可以像人一樣絲滑地完成各種動(dòng)作,并在運(yùn)動(dòng)中時(shí)刻保持平衡,而不是一個(gè)趔趄就“翻車”,其關(guān)鍵就在于各類傳感器。
如果把AI大語言模型比作具身智能的“大腦”,那么傳感器就是具身智能的“四肢五感”。沒有傳感器,具身智能就成了只能思考不能動(dòng)彈的植物人。
據(jù)了解,國內(nèi)知名的傳感器企業(yè)漢威科技集團(tuán)擁有豐富的柔性觸覺傳感器、六維力傳感器、慣性傳感器等產(chǎn)品,可廣泛應(yīng)用于具身智能領(lǐng)域的諸多應(yīng)用場(chǎng)景。
柔性觸覺傳感器就像是人類的皮膚,可以感知外界的壓力大小、溫度高低。
六維力傳感器就像是人的觸覺和神經(jīng)系統(tǒng),可以精確測(cè)量物體在三個(gè)方向上的力和力矩,感受到物體的重量、壓力和摩擦力,進(jìn)而實(shí)現(xiàn)精細(xì)、復(fù)雜動(dòng)作。
慣性傳感器就像是人的內(nèi)耳,可以感知空間方位和運(yùn)動(dòng)姿態(tài),保持身體平衡。
據(jù)悉,目前漢威科技集團(tuán)已經(jīng)與部分具身智能相關(guān)企業(yè)進(jìn)行研發(fā)合作,共同助力具身智能時(shí)代的到來。
“硅基生命”為千行百業(yè)打開想象空間
具身智能可謂是“硅基生命”,可以替代人類從事許多工作,為千行百業(yè)打開了無盡的想象空間。
在工業(yè)制造領(lǐng)域,智能工業(yè)機(jī)器人可以替代人類從事加工、焊接、組裝、質(zhì)檢、搬運(yùn)等多種工作,真正實(shí)現(xiàn)智能化柔性制造、高度智慧化的“黑燈工廠”,顯著降低人為干預(yù)因素的影響,大大提升制造精度與生產(chǎn)效率。
在物流運(yùn)輸領(lǐng)域,智能物流機(jī)器人將具備更強(qiáng)的推理決策、環(huán)境感知、路線規(guī)劃、運(yùn)動(dòng)導(dǎo)航、多任務(wù)并行處理、連續(xù)作業(yè)等能力,代替人類從事分揀、搬運(yùn)、打包、裝卸、配送以及管理貨架等工作,提升倉儲(chǔ)物流行業(yè)的安全與效率。
在自動(dòng)駕駛領(lǐng)域,汽車、無人機(jī)、低空飛行器等各種原本需要人駕駛、操控的機(jī)器將真正實(shí)現(xiàn)自動(dòng)駕駛,百度旗下的蘿卜快跑自動(dòng)駕駛出行服務(wù)平臺(tái)、馬斯克的無人駕駛出租車Cybercab和無人駕駛廂式貨車Robovan概念車,已經(jīng)開啟新賽道。
在家庭服務(wù)領(lǐng)域,家庭服務(wù)機(jī)器人可以幫助人類打掃衛(wèi)生、炒菜做飯、洗衣、澆花、逗寵物,家庭陪伴機(jī)器人可以根據(jù)人的行為習(xí)慣和所處狀態(tài)匹配合適的聊天模式,提供情感陪伴和情緒價(jià)值。
在醫(yī)療康養(yǎng)領(lǐng)域,智能醫(yī)療機(jī)器人將允許外科醫(yī)生借助高精度機(jī)械臂進(jìn)行遠(yuǎn)程手術(shù),智能康養(yǎng)機(jī)器人可以為老人、兒童、殘障人士提供擬人化交互服務(wù)和護(hù)理服務(wù),減輕醫(yī)護(hù)人員負(fù)擔(dān),提升被護(hù)理者的生活質(zhì)量和幸福感。
具身智能還可以在極端環(huán)境、危險(xiǎn)環(huán)境中代替人類從事科學(xué)探索、危險(xiǎn)排查等工作,如外太空、深海、沙漠、冰川、山地等極端自然環(huán)境,以及核泄漏、?;穲?chǎng)所、有限空間、爆炸物等危險(xiǎn)環(huán)境。
未來,具身智能的用途將更加廣泛,關(guān)鍵前提在于AI大語言模型與傳感器要協(xié)同發(fā)展,兩條腿走路。唯有如此,才能真正做到“具身+智能”,為人類社會(huì)提供更多智慧化、超體驗(yàn)服務(wù)。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。