GAITC智能傳媒專題|任福繼:自然人、機器人、數(shù)字人三者將協(xié)同共生
重點實驗室、新浪新聞承辦的主題為“變量激蕩 增量涌現(xiàn)”2024全球人工智能技術(shù)大會 智能傳媒專題活動在杭州拉開帷幕。CAAI名譽副理事長、日本工程院院士、歐盟科學(xué)院院士、工程院外籍院士、電子科技大學(xué)講席教授、 CAAI Fellow任福繼分享了題為《具身智能大腦構(gòu)建與具有靈氣的數(shù)字人》的演講。
女士們、先生們,大家好!我今天演講的題目是《具身智能大腦構(gòu)建與具有靈氣的數(shù)字人》。今天主要講以下幾點:
我們認為,未來的社會是自然人、機器人、數(shù)字人三人有機共舞的時代。什么是自然人?就是我們在現(xiàn)實空間當(dāng)中存在的人類,也就是我們自己,具有生物意義上的人;機器人主要是指仿人機器人,它愛模仿真人制造,從仿真程度來看,不僅是外觀上仿真,而且在計算機技術(shù)賦能下,具有感知、決策、執(zhí)行等基本人類行為特征;數(shù)字人是指元宇宙的“原住民”,指通過計算機圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等技術(shù),打造的具有數(shù)字化外形、存在于非物理世界中的虛擬人物,在一定程度上能夠復(fù)制我們?nèi)祟惖闹R、情感、記憶、思維。
既然是三人共舞,交互類型就有六種,特別是有數(shù)字化身,就能同時實現(xiàn)在一個時間點、多個視線、多個場景都可以同步發(fā)生,也就是說你有你的數(shù)字化身。在這種情況下,我們?nèi)说纳a(chǎn)效能、感知能力、執(zhí)行能力,都將會大幅提升。所以未來自然人、機器人、數(shù)字人這三者將實現(xiàn)互融共享、協(xié)同共生、智能大腦共享、操作平臺共享、知識體系共享、虛擬自然交互、虛實融合共生,這是我們對未來社會的描述。
特別是近兩年來,我們談了很多大模型,我們一直強調(diào)大模型在理論上確實沒有多少創(chuàng)新,但是由于它的涌現(xiàn),所以這兩年大模型翻江倒海。大模型可能能夠推動人工智能至少25年30年的火熱,不會遇到嚴(yán)寒的冬天。這就是大模型和情感交互,就會加速自然人、機器人、數(shù)字人三人共舞時代的到來。
三人共舞需要兼具智商和情商的共享心腦,基于大模型的世界知識以及基于先進智能的情感交互,我們認為情感交互是共享心腦的必備要素。
說幾個關(guān)鍵詞,包括講事實、傳知識、辨真?zhèn)?要做交互、識情感、深推理;深情感、展個性、表情感;自學(xué)習(xí)、共進化、促共存,三人有機共舞。
第二點,三人共舞時代未來社會生產(chǎn)模式是什么樣子?我們認為,未來的生產(chǎn)模式是自然人、機器人、數(shù)字人這三類平行員工一起分工協(xié)作。進一步研究分析認為,以后自然人勞動力只占5%10%,機器人要占15%20%,剩下的70%80%的工作由數(shù)字人完成。所以這也是各個國家許多省市政府都在布局數(shù)字經(jīng)濟、元宇宙、先進的人工智能等等。
我們提出來,基于先進智能理論構(gòu)建三人共享大腦。包括自然人,我們對自然人現(xiàn)在要研究哪些方面呢?我們都知道,現(xiàn)在計算機技術(shù)也好,人工智能也好,主要在視覺上面取得了很大的突破,包括AR、VR、MR等等,我們要對自然人研究除了視覺以外的聽覺、嗅覺、味覺、靈覺以及觸覺等等,包括身體行動,也就是具身智能。我們對數(shù)字人怎么進行?數(shù)字人要研究的主要特點,一個是數(shù)字人大腦,這個數(shù)字人大腦不僅僅是給數(shù)字人用的,要給機器人用,同時還要給自然人用,這就很有意思了,叫做共享大腦,我們原來以為開發(fā)一個大腦就是給機器用的,AI用的,不是,包括我們自然人,反過來我們來應(yīng)用。包括數(shù)字人驅(qū)動以及數(shù)字人外形,我們知道,當(dāng)前數(shù)字人研究關(guān)鍵在于多元感知的人機交互,包括信息獲取、推理分析、實時互動等,是人性化、智能化方面。我們團隊聚焦數(shù)字人大腦、數(shù)字人驅(qū)動和數(shù)字人外形,我們希望和產(chǎn)業(yè)界聯(lián)系在一起。
為什么談先進智能?什么是先進智能?我們提出的先進智能,主要是將人工智能與自然智能結(jié)合起來,將傳統(tǒng)的人工智能、計算智能和行為智能研究結(jié)合起來,再加上情感計算。我們都知道,自然智能,也就是生物智能有上億年的進化史,人工智能1956年誕生以來不到70多年,情感計算還不到30年。所以在這樣一個過程當(dāng)中,我們怎么樣把三者有機結(jié)合起來?我們就提出來先進智能,以情感交互加速自然人、機器人、數(shù)字人融合共舞時代。
具身智能不是一個新的概念,早在人工智能概念誕生之前,圖靈早就提出過具身智能。具身智能是指一種智能機器,它能夠通過感知、決策和交互與環(huán)境進行實時的互動。即機器人在真實環(huán)境下執(zhí)行各種任務(wù)當(dāng)中,通過與環(huán)境的直接交互學(xué)習(xí),來提高機器的理解和適應(yīng)能力,也就是我們通常所說的進化。智能機器擁有了分析決策和運動控制腦部,我們叫做大腦。現(xiàn)在在腦部軟件方面,有大腦和小腦,大腦包括智商,但小腦不僅僅是情商,特別是在運動控制方面。同時,人工智能擁有了感知環(huán)境與執(zhí)行交互的身體,我們現(xiàn)在會強調(diào),人形機器人走出去,只有這樣它才能夠交互起來,達到和我們?nèi)艘粯拥倪M化。
顛覆性的工作,如果實現(xiàn)情感交互,就可以跨越機械式人機交互的鴻溝。自然交互就是情感交互。我們現(xiàn)在的工作是要搭建情感服務(wù)機器人系統(tǒng)平臺,我們要構(gòu)建一個智能人機情感交互的系統(tǒng),要確立個性化人機情感會話系統(tǒng)體系,可以工程實現(xiàn)智能機器人的多模態(tài)情感識別、生成與表達、決策與行動。這是我們在具身智能方面做的工作。
具身智能共享大腦,要把大腦不僅僅用于數(shù)字人、機器人,還要用于我們自然人,以后不僅僅是指導(dǎo)機器人的行動動作,不僅僅是推進數(shù)字人友好地交互,還反過來要提高我們自然人類的能力,包括IQ和EQ。因為我們都說,我們總在擔(dān)心AI超過我們?nèi)祟?實際上我們原來就講過,AI有三個方面:一是計算智能,二是感知智能,三是認知智能。我們在計算智能和感知智能上面早就被AI超過了,所以要用它的大腦來輔助我們?nèi)祟?我們自己計算不那么快,要用AI大腦幫助我們提高計算能力,這樣才能達到三人同步。同樣,我們在感知智能方面,現(xiàn)在感知智能和AI不相上下,如果人工智能再進步的話,我們?nèi)祟愒诟兄悄芊矫嬉惨浜笥贏I。我們現(xiàn)在唯一是在認知智能上面,還遙遙領(lǐng)先于AI,也就是機器。我們有了這個共享大腦之后,我們將人類的認知智能,通過三人共享的大腦反過來推動數(shù)字人、機器人不斷進化。
第五點,靈氣數(shù)字人與大文旅,這是我們?nèi)ツ觊_始就提倡的,現(xiàn)在的數(shù)字人還沒有靈氣。
什么叫做靈氣?我們先來字解“靈氣”。“靈”是指人的精神狀態(tài),包括聰明、機敏,這是網(wǎng)絡(luò)上面查出來的。也就是指人的身體動作敏捷、靈活等等。“氣”是指人類精神狀態(tài)、作風(fēng)、風(fēng)度、力量等。所以這樣泛泛來看,靈氣是指人對外物感受和理解的能力。《管子內(nèi)業(yè)》:“靈氣在心,一來一逝,其細無內(nèi),其大無外。”就是我們對外物感受和理解要有靈氣。同時還有聰慧或者秀麗的氣質(zhì),作為數(shù)字人的化身不能太丑陋了,會沒有好感。晉付玄《鴻雁生塞北行》:“靈氣一何優(yōu)美,萬里馳芬芳。”這也是講靈氣。
靈氣機器人,它有什么意義呢?什么叫有靈氣的數(shù)字人?有靈氣的數(shù)字人就是自然智能、人工智能以及情感的智能協(xié)調(diào)統(tǒng)一。我剛才說了,自然智能、人工智能加上情感正好是我們的先進智能,所以只有有了先進智能后,我們的這種數(shù)字人出來才具有靈氣。也就是說,它不僅要形似,而且要具備強大的感知力,它還要神似,神似就是具有推理和思考的能力,同時更要情同,擁有共情和情感化的智慧能力,這就對于數(shù)字人要求很高了。反過來,靈氣以后要對應(yīng)我們的機器人,也要讓我們自然人類更具有靈氣。
具體而言,靈氣數(shù)字人,包括靈氣機器人怎么樣進行研究?有哪些挑戰(zhàn)?根據(jù)我們的研究分析,我們團隊總結(jié)出來幾個:一是驅(qū)動力,在情感驅(qū)動方面,核心挑戰(zhàn)是可接受性。關(guān)鍵性能包括情感化、類人化、家庭化、社會化。技術(shù)驅(qū)動上是可應(yīng)用性,我們的理論也好,算法也好,一旦沒有具體應(yīng)用是沒有價值的,特別是工科。可應(yīng)用性包括融合感知、類腦認知、協(xié)同推理、自然交互。這就是技術(shù)驅(qū)動。自然驅(qū)動,就是可進化性,我們?nèi)祟惤?jīng)過漫長的進化過程,達到了現(xiàn)在我們之所以是人。我們怎么樣數(shù)字人、機器人有自然的驅(qū)動?包括知識進化、社交進化、功能進化、倫理進化。功能進化、倫理進化,我們都知道,世界上人工智能不僅僅是一個科學(xué)技術(shù)的問題,還有非科學(xué)技術(shù)的方面,科學(xué)技術(shù)不言而喻,我們大家都很清楚它的內(nèi)涵甚至它的外延,那么非科學(xué)技術(shù)驅(qū)動是什么意思呢?比如我們現(xiàn)在談人工智能、談機器人,它的一些倫理道德,它和人類的反應(yīng)、交互性以及社會的傳播等等,這就是非科學(xué)技術(shù)方面的范疇。所以人工智能是兩個范疇,和其他自然科學(xué)不太一樣。
突破的方向,在情感驅(qū)動上,要進行情感計算;在人工智能上,我們要進行技術(shù)驅(qū)動;在自然驅(qū)動上是自然智能,這三點就是先進智能。所以要研究靈氣數(shù)字人,要讓外貌形象要更加逼真,要讓身體動作更加自然,多模態(tài)感知和自然交互能力更加突出,情感和思維更趨于自然人。為什么說趨于自然人,而不是趨于數(shù)字人或機器人呢?所有的技術(shù),我們認為目標(biāo)都是為人類服務(wù),所以雖然它是平行的,但它主要還是為自然人。所以有靈氣的數(shù)字人,就有對外物感受和理解的能力,具有聰慧或者秀美的氣質(zhì),與自然人就可以進行有機協(xié)調(diào)、共融。
我們團隊在數(shù)字人、機器人、自然人進化平臺上做了一些工作,主要是構(gòu)建機器人、數(shù)字人學(xué)習(xí)進化的平臺,來實現(xiàn)智能感知、蓄時交融與情感交互能力的“三人”情感交互系統(tǒng),實現(xiàn)機器人、數(shù)字人自我進化。同時,和自然人有機共舞。這樣就會有很多載體,包括我們開發(fā)機器人,陪伴機器人、健康機器人、教育機器人,包括數(shù)字主播以及數(shù)字助理、數(shù)字教師等等一系列的產(chǎn)品。
既然靈氣數(shù)字人這么重要,我們怎樣來構(gòu)建靈氣數(shù)字人?第一,我們要基于大模型,包括在語言方面、表情方面,我們主要看在表情方面AIGC,原來數(shù)字人既費時間,又費精力。但是現(xiàn)在不一樣了,現(xiàn)在通過AIGC在表情上面,特別是在數(shù)字人制作技術(shù)方面,就可以打造真實感的數(shù)字人,可以在各種各樣的表情上,盡量和自然人比較逼真。
AIGC,包括動作的生成,比如進行失重動作生成,在零重力環(huán)境下的動作數(shù)據(jù),主流的動作捕捉數(shù)據(jù)庫基本上都是空白的,怎么辦呢?只有極少數(shù)的數(shù)據(jù),我們用人工智能的方式來做,這是什么概念呢?比如我們以后的深空、深海,不可能到那個環(huán)境下取很多數(shù)據(jù)來,AI就可以發(fā)揮作用。包括動作,現(xiàn)在動作生成的主流方法有基于物理仿真的,基于規(guī)則的,包括深度學(xué)習(xí)模型、強化學(xué)習(xí)、生成學(xué)習(xí)這一系列動作的生成。包括智能骨骼姿態(tài)驅(qū)動技術(shù),就可以以人的真實表演,現(xiàn)在我們主要是提高它的效率和真實度。
總之,數(shù)字人的動態(tài)生成挑戰(zhàn):一是情感的準(zhǔn)確性,需要確保生成的表情、動作能夠準(zhǔn)確地傳達出所需的情感狀態(tài)。二是表情和動作的連貫性,生成的表情、動作在過渡和持續(xù)性方面需要保持連貫性,避免不自然和突兀。為什么?我們?nèi)祟愑行r候說情緒突然變化,但還是有一個過程,否則不自然;三是實時性;四是個性化和多樣性,個性化是什么意思?我們?nèi)祟愂乔Р钊f別、千奇百怪的,不同的人可能不同的面部運動模式,包括他的微表情、姿態(tài)。因此,我們需要能夠適應(yīng)個體的生成模型,以及自學(xué)習(xí)和自進化。
這樣一來,我們認為三人共舞就具有廣泛的應(yīng)用場景,包括教育培訓(xùn)、飲食消費、設(shè)計制造、藝術(shù)展覽、文化旅游、休閑娛樂等等。我們今天主要看大文旅,大文旅主要是要深度挖掘文化資源的精神內(nèi)涵和時代價值,融合元宇宙技術(shù),建設(shè)與現(xiàn)實平行的虛擬空間,提供文旅元宇宙升級綜合解決方案,打造文旅的新業(yè)態(tài)、新模式、新體驗、新場景。所以今天的題目主要是在文旅,當(dāng)然我們有“四大”,即大健康、大教育、大安全、大文旅。
我們主要提出的一個觀點,我們認為未來社會是自然人、機器人、數(shù)字人三人有機共舞的時代,而且在這三人有機共舞時代的社會生產(chǎn)模式就是這三種平行員工。所以以后在我們的工作環(huán)境里面有機器人、數(shù)字人,和我們同時是平行的,所謂平行員工就是在勞動上面是平等的,當(dāng)然有一個主體,始終是后兩位員工,也就是機器人、數(shù)字人是為前面的員工(自然人)服務(wù)的,這是一個主從關(guān)系,但是在分工上面是沒有差別的。
同時我們認為,未來自然人占的比例很少,所以我們說我們現(xiàn)在的工作強度太大,以后我們自然人不應(yīng)該有這么大的工作強度,15%20%是機器人給我們做了,剩下的70%80%都是數(shù)字人、數(shù)字化身。
同時,如何才能實現(xiàn)三人有機共舞?就要構(gòu)建機器人、數(shù)字人、自然人的共享大腦,建設(shè)共享大腦如何進行?今天主要講了以先進智能驅(qū)動,就是要有人工智能、自然智能和情感計算融合在一起的新的研究范式去開發(fā)三人共享大腦。
同時,我們也談到了具身智能與共享大腦的進化,為什么談具身智能?就是我們未來的機器人還是要讓它走入自然環(huán)境里面,像我們?nèi)艘粯?去感知環(huán)境,自動學(xué)習(xí),包括我們的大模型,大模型以后必須要進化,不能只靠靜態(tài)的知識、靜態(tài)的信息,還要像自然人一樣,隨時有新的概念、新的數(shù)據(jù)、新的知識涌入進來,這就是我們強調(diào)未來具身智能非常重要的一個方向。
靈氣數(shù)字人,我們認為未來要進行三人共舞的發(fā)展方向,就是要讓機器人、數(shù)字人更加具有靈氣,這一切都期待著先進智能。
6月23日,由中國人工智能學(xué)會主辦,CAAI 智能傳媒專業(yè)委員會、中國傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院、媒體...
【6月23日,杭州】6月22日-6月23日,2024全球人工智能技術(shù)大會(GAITC)在杭州盛大舉行。智平方科技(深圳)科...
博眾投資AI技術(shù)創(chuàng)新又傳喜訊!2024年4月12日,廣東博眾智能科技投資有限公司(以下簡稱:博眾投資)數(shù)字人算...
隨著氣象預(yù)報、生物科學(xué)、大氣海洋、化學(xué)與分子學(xué)等尖端領(lǐng)域?qū)Ω咝阅苡嬎愕男枨蠹ぴ觯懔萍紕?chuàng)新的...
一加手機正式宣布,性能猛獸一加 Ace 3 Pro 徹底征服三大地獄級難度超級重載場景,帶來行業(yè)最強性能體...
【6月21日-23日,華為開發(fā)者大會(HDC 2024)在東莞舉辦,深圳市造物數(shù)字工業(yè)科技有限公司(簡稱造物數(shù)...
夏日熱浪來襲,為了讓消費者在炎炎夏日中享受到更好的手機使用體驗,知名二手3C數(shù)碼產(chǎn)品交易平臺愛回收攜...
隨著嬰幼兒輔食市場的不斷發(fā)展,家長們對于輔食喂養(yǎng)的科學(xué)性和精細化要求也越來越高。作為輔食行業(yè)的領(lǐng)軍...
在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)字人才已成為各行各業(yè)爭奪的焦點。然而,人才供需失衡、招聘效率低下等問...
過去,大多數(shù)品牌瓷磚的交付只是產(chǎn)品交付,鮮少涉足成品交付。其主要原因可以總結(jié)為兩點,一是成品交付...
6月23日,由中國人工智能學(xué)會主辦,CAAI 智能傳媒專業(yè)委員會、中國傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院、媒體...
【6月23日,杭州】6月22日-6月23日,2024全球人工智能技術(shù)大會(GAITC)在杭州盛大舉行。智平方科技(深圳)科...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
國內(nèi)經(jīng)濟的持續(xù)發(fā)展,激發(fā)了個體經(jīng)營者的創(chuàng)業(yè)熱情,數(shù)據(jù)顯示,截至2023年底,全國登記在冊個體工商戶1 ...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
國家衛(wèi)生健康委日前發(fā)布的《近視防治指南(2024年版)》指出,近視已成為影響我國國民尤其是兒童青少年...
隨著科技的飛速發(fā)展,金融行業(yè)正迎來一場前所未有的變革。作為一家以科技創(chuàng)新為驅(qū)動的現(xiàn)代化銀行,寧波...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
2024年6月,知遇知寓商業(yè)運營管理有限公司成功簽約國際滑雪冠軍賈麗亞為品牌代言人,攜手知遇知遇品牌為...
博眾投資AI技術(shù)創(chuàng)新又傳喜訊!2024年4月12日,廣東博眾智能科技投資有限公司(以下簡稱:博眾投資)數(shù)字人算...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
在數(shù)字化浪潮的推動下,企業(yè)正面臨前所未有的挑戰(zhàn)與機遇。數(shù)字化轉(zhuǎn)型不僅涉及技術(shù)層面的革新,更觸及業(yè)...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
西安石油大油氣科技有限公司成立于1994年9月8日,是西安石油大學(xué)的重要教學(xué)、科研和生產(chǎn)基地。公司主要...
5月24日,向前第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開,來自集...
6月19 日,2024年(第21屆)世界品牌大會暨2024年《中國500最具價值品牌》發(fā)布會圓滿收官。穗寶品牌以302...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
隨著盛夏酷暑的到來,日漸升高的氣溫已成為令人頭疼的一種煎熬。不僅如此,高溫所帶來的環(huán)境干濕度失調(diào)...
隨著氣象預(yù)報、生物科學(xué)、大氣海洋、化學(xué)與分子學(xué)等尖端領(lǐng)域?qū)Ω咝阅苡嬎愕男枨蠹ぴ觯懔萍紕?chuàng)新的...
一加手機正式宣布,性能猛獸一加 Ace 3 Pro 徹底征服三大地獄級難度超級重載場景,帶來行業(yè)最強性能體...
昆山紫荊醫(yī)院,以男性生殖問題,男性泌尿疾病研究 與治療的醫(yī)院,一直秉承以患者為中心的理念,打造以...
【6月21日-23日,華為開發(fā)者大會(HDC 2024)在東莞舉辦,深圳市造物數(shù)字工業(yè)科技有限公司(簡稱造物數(shù)...
夏日熱浪來襲,為了讓消費者在炎炎夏日中享受到更好的手機使用體驗,知名二手3C數(shù)碼產(chǎn)品交易平臺愛回收攜...
綿陽高水醫(yī)院,是一家醫(yī)保定點單位,地址位于綿陽市涪城區(qū)長虹大道北段113號看疾病,要選擇正規(guī)專業(yè)的醫(yī)...
5月24日,主題為向前的第五屆集成家居高質(zhì)量創(chuàng)新大會暨金瑞獎2024年度品牌盛典在嘉興富悅大酒店隆重召開...
趁著智能新能源發(fā)展熱潮,阿維塔品牌再度發(fā)力,推出了旗下第三款車型阿維塔07。這款中型SUV不僅秉承了...