2024年7月4日,上海,觀眾在2024世界人工智能大會(huì)上參觀特斯拉推出的第二代擎天柱(Optimus)人形機(jī)器人。視覺中國(guó) 圖
7月5日,在2024世界人工智能大會(huì)的“人形機(jī)器人前沿論壇”上,來自世界各地的多位機(jī)器人研究者和產(chǎn)業(yè)專家分享了對(duì)于機(jī)器人技術(shù)發(fā)展的全景分析與展望。與會(huì)者普遍認(rèn)為,AI(人工智能)的出現(xiàn)為機(jī)器人帶來了前所未有的發(fā)展機(jī)會(huì),人形機(jī)器人技術(shù)有望在未來有更大的突破。
對(duì)于機(jī)器人的定義和定位,以色列智能機(jī)器人中心主席Yosi Lahad表示,智能機(jī)器人處于機(jī)器人學(xué)、數(shù)據(jù)、認(rèn)知能力學(xué)、傳播學(xué)等多重領(lǐng)域的融合地帶,能夠?qū)崿F(xiàn)自主操作、感知環(huán)境、互動(dòng)、推理、自我學(xué)習(xí)、適應(yīng)行動(dòng)等多重功能。
必一運(yùn)動(dòng)
根據(jù)Macquarie Research在2023年發(fā)布的報(bào)告,人形機(jī)器人的硬件總成本目前約為5萬美元。其中,端到端AI軟件大腦、傳感器及芯片、伺服電機(jī)及電機(jī)驅(qū)動(dòng)器都各需要1萬美元,慣性測(cè)量單元和扭矩傳感器需要5000美元,精密減速器需要8000美元,電池和電池控制系統(tǒng)需要2000美元,其他部件(包括機(jī)身材料)約5000美元。
對(duì)此,Lahad認(rèn)為,為了讓人形機(jī)器人能夠得到大規(guī)模采用,其成本需要降到兩萬美元以下,是現(xiàn)在成本的一半以下。為實(shí)現(xiàn)這一目標(biāo),或許需要對(duì)機(jī)器人的外型進(jìn)行一些改變,例如重新考慮模仿人類腿部的底座設(shè)計(jì)。
而日本大阪大學(xué)智能機(jī)器人實(shí)驗(yàn)室主任石黑浩堅(jiān)定地認(rèn)為,我們不僅需要智能機(jī)器人,還需要人形機(jī)器人:人類大腦在構(gòu)造上最擅長(zhǎng)識(shí)別人類,所以對(duì)人類來說,最理想的互動(dòng)接口理應(yīng)是人形的;另外,能夠通過研究人形機(jī)器人來研究人類自己的認(rèn)知能力,從而對(duì)人類自身進(jìn)行理解和定義。
被稱為“納米機(jī)器人之父”的日本科學(xué)家、中科院外籍院士福田敏男也談到,機(jī)器人和人類能夠通過“信息交流”和“物理交流”這兩種互動(dòng)方式相互作用,帶來全新的刺激并激發(fā)靈感。
AI對(duì)于機(jī)器人技術(shù)發(fā)展的推動(dòng)作用已經(jīng)成為業(yè)界的共識(shí)。IEEE產(chǎn)業(yè)標(biāo)準(zhǔn)和技術(shù)組織MASA(元宇宙加速與可持續(xù)發(fā)展聯(lián)合會(huì))主席袁昱表示,AI正在改變機(jī)器人開發(fā)的范式,“從符號(hào)主義到連接主義、從規(guī)則到參數(shù)、從編碼到學(xué)習(xí)”,讓機(jī)器人變得更聰明,也開拓了更廣泛的應(yīng)用場(chǎng)景。
石黑浩解釋了機(jī)器人技術(shù)和人類科學(xué)是如何被大語言模型結(jié)合到一起:前者是機(jī)器人的基礎(chǔ)功能,包括語音識(shí)別、圖像理解、傳感器和控制器等;后者屬于元認(rèn)知(meta-level cognitive)功能,包括社會(huì)關(guān)系、意識(shí)、智能和具身化等。例如,一個(gè)裝有先進(jìn)大語言模型的機(jī)器人將能夠與人類進(jìn)行自然對(duì)話,識(shí)別并理解人類的情緒,從而提供更具個(gè)性化的互動(dòng)。
從產(chǎn)業(yè)觀察和投資角度,盛景嘉成基金管理合伙人王湘云指出,人形機(jī)器人是機(jī)器人向通用智能發(fā)展的重要路徑,是具身智能的重要載體:“人形機(jī)器人不是具身智能的唯一形態(tài),但確實(shí)是有最多人類真實(shí)訓(xùn)練數(shù)據(jù)的形態(tài)。”
從這個(gè)角度來看,人形機(jī)器人產(chǎn)業(yè)也可以對(duì)標(biāo)自動(dòng)駕駛產(chǎn)業(yè),本質(zhì)上都屬于具身智能,“自動(dòng)駕駛向端到端模式進(jìn)化對(duì)人形機(jī)器人有重要的借鑒意義”。例如,特斯拉FSD V12使用了端到端模型,從上一代的30萬行代碼降到2000行代碼,在海量數(shù)據(jù)的支持下實(shí)現(xiàn)了更好的效果。
Lahad指出,雖然GPT等AI在處理事實(shí)性或描述性任務(wù)時(shí)表現(xiàn)得很好,但在分析性任務(wù)上表現(xiàn)不一致或缺乏智能,而機(jī)器人需要處理非常復(fù)雜的現(xiàn)實(shí)環(huán)境,在該問題上業(yè)界依然爭(zhēng)論不休。
王湘云談到,在現(xiàn)有大模型的技術(shù)路線下,訓(xùn)練數(shù)據(jù)是不可回避的核心要素,是機(jī)器人和大模型“具備工程可行性和經(jīng)濟(jì)性的重要前提”。目前看來,人形機(jī)器人產(chǎn)業(yè)化面臨的三大核心技術(shù)挑戰(zhàn)在于算法、硬件和數(shù)據(jù)。其中,算法中的操作能力、硬件的成本問題和數(shù)據(jù)的收集效率都是很大的挑戰(zhàn)。
盡管存在諸多挑戰(zhàn),但人形機(jī)器人的前景無疑巨大。Lahad引用了高盛今年最新的預(yù)測(cè),即人形機(jī)器人到2035年將呈爆發(fā)式增長(zhǎng),出貨量將達(dá)到140萬臺(tái),全球市場(chǎng)總規(guī)模(TAM)達(dá)380億美元。全球從事物流和制造業(yè)的人形機(jī)器人將在2030年左右達(dá)到100萬臺(tái),人形機(jī)器人有望在十年內(nèi)走入服務(wù)、家庭護(hù)理、健康和教育產(chǎn)業(yè)。
王湘云也指出,工業(yè)和商業(yè)服務(wù)(如物流、零售)場(chǎng)景是人形機(jī)器人獲得驗(yàn)證的關(guān)鍵路徑,家庭機(jī)器人優(yōu)先級(jí)靠后,因?yàn)榍皟烧咭呀?jīng)具備了一定的商業(yè)化機(jī)會(huì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
“女姚明”橫空出世!17歲裸高2米24,穿鞋身高228,曾單場(chǎng)轟68分
CCTV5直播西班牙vs德國(guó):最好兩隊(duì)對(duì)決 兩翼PK兩億 斗牛士要?jiǎng)俪?
英國(guó)又要換首相了?新首相或是他:草根出身的律師,希望“周五不加班”的顧家男人
今日!CCTV5直播歐洲杯,5+轉(zhuǎn)美洲杯+F1,CCTV16轉(zhuǎn)中超申花PK泰山
與中堅(jiān)力量共成長(zhǎng),2024建信信托藝術(shù)大獎(jiǎng)評(píng)委會(huì)特別獎(jiǎng)獲獎(jiǎng)藝術(shù)家凌海鵬