21世紀經濟報道記者 鄭植文 上海報道
千呼萬喚始出來。經過近一年的(de)等待,北(bei)美(mei)時間9月30日,在特斯拉2022 AI Day上,馬(ma)斯克終于揭(jie)下Tesla Bot的(de)真實(shi)面紗。
在(zai)演(yan)示(shi)視頻中,這(zhe)款(kuan)被(bei)命名為(wei)Optimus(下稱(cheng)“擎(qing)天(tian)柱”)的人(ren)形機(ji)器(qi)人(ren)可以直立行走、給植物澆水(shui)、移動金屬(shu)棒。據馬斯(si)克透露“擎(qing)天(tian)柱”已經(jing)在(zai)特斯(si)拉工廠中進行內部測試,人(ren)們有望在(zai)3-5年買到(dao)“擎(qing)天(tian)柱”,而其(qi)售價預(yu)計(ji)不(bu)到(dao)2萬(wan)美(mei)元,“可能(neng)比(bi)汽車還便(bian)宜”。
這場 AI Day活動圍繞(rao)人形機(ji)器人、FSD技術和Dojo超算(suan)系統(tong)三個關鍵詞展開,馬斯(si)(si)(si)克表(biao)示,“從本質(zhi)上來(lai)說,特(te)(te)斯(si)(si)(si)拉(la)是(shi)一(yi)家硬核科技公司,我們在努力做很多科學(xue)和工程相(xiang)關的工作。希望大家對特(te)(te)斯(si)(si)(si)拉(la)的認識(shi),能夠超過電動汽車本身(shen)”。
“擎天柱”面世

特斯拉人形機器人對比圖
去年AI Day上(shang),特(te)斯拉Tesla Bot人(ren)形機器(qi)人(ren)概(gai)念視頻與圖片首次(ci)亮(liang)相。盡管此(ci)次(ci)面世的(de)(de)(de)“擎(qing)天柱”在(zai)觀感上(shang)與概(gai)念圖還有一(yi)定(ding)的(de)(de)(de)差距,但特(te)斯拉團隊(dui)表示“擎(qing)天柱”在(zai)運(yun)動(dong)中有著非常好的(de)(de)(de)功能(neng),十分(fen)敏(min)捷(jie),甚至可以跳舞。這(zhe)也是因為“擎(qing)天柱”擁有好幾個自由度(du),可以提供(gong)更高的(de)(de)(de)使(shi)用靈活性,比如擁有手指(zhi)運(yun)動(dong)的(de)(de)(de)能(neng)力,目(mu)前在(zai)手指(zhi)上(shang)可以實現兩個自由度(du),因此(ci)這(zhe)款即(ji)將投(tou)入生產使(shi)用的(de)(de)(de)機器(qi)人(ren)已經在(zai)特(te)斯拉工廠(chang)投(tou)入測試,從事一(yi)些重復性的(de)(de)(de)工作。
據介紹(shao),特斯拉的(de)(de)FSD技術(“Full Self Driving”,即完全自動駕駛(shi))直接被(bei)應用在“擎天柱(zhu)”身(shen)上(shang)作為其(qi)大腦,簡單來(lai)(lai)說(shuo)它采用了與汽車一樣的(de)(de)視覺感知,“它可(ke)以非(fei)常(chang)清晰地識別周(zhou)圍(wei)的(de)(de)物體。我們收集(ji)了非(fei)常(chang)多(duo)的(de)(de)數據,通過數據來(lai)(lai)訓練機(ji)器(qi)人(ren)(ren),我們對(dui)于汽車的(de)(de)訓練是(shi)類(lei)似的(de)(de)。”但機(ji)器(qi)人(ren)(ren)的(de)(de)需(xu)求和(he)形(xing)式也有(you)別于汽車,比(bi)如需(xu)要支持通信(xin),所以“擎天柱(zhu)”有(you)很多(duo)無(wu)線連接和(he)音(yin)頻支持,同時(shi)它的(de)(de)硬件也一定要非(fei)常(chang)安全能夠保護機(ji)器(qi)人(ren)(ren)本(ben)身(shen)和(he)周(zhou)圍(wei)的(de)(de)人(ren)(ren),所以需(xu)要考慮四肢方面(mian)的(de)(de)內容。
“汽(qi)車是有(you)(you)輪子的(de)(de)(de)機器(qi)人,而機器(qi)人是裝上(shang)腳的(de)(de)(de)汽(qi)車”,因為組件的(de)(de)(de)相似性,機器(qi)人和(he)汽(qi)車在設計上(shang)也具有(you)(you)相似性,可(ke)以(yi)進(jin)行技(ji)術(shu)的(de)(de)(de)遷(qian)移。而在馬(ma)斯克看來,和(he)設計汽(qi)車的(de)(de)(de)原則類(lei)似,以(yi)非常(chang)(chang)高的(de)(de)(de)可(ke)靠性和(he)非常(chang)(chang)低的(de)(de)(de)成本來大批量生(sheng)產機器(qi)人也非常(chang)(chang)重要。他對此表示信心十(shi)足,“我(wo)(wo)們(men)覺(jue)得產量應該(gai)可(ke)以(yi)達到(dao)數百萬臺(tai),并且它的(de)(de)(de)價格比(bi)汽(qi)車便宜得多,按照(zhao)我(wo)(wo)的(de)(de)(de)猜測,一(yi)臺(tai)機器(qi)人的(de)(de)(de)最終價格不到(dao)2萬美元(yuan)。”
對此,有專家在媒體采訪時表(biao)示,國內有企業研發(fa)的(de)雙足行(xing)走人形機(ji)器人成(cheng)本(ben)價約在50萬元,這(zhe)一(yi)價格(ge)(ge)屬(shu)于手工組裝的(de)價格(ge)(ge),未(wei)來如(ru)果大(da)規模生產,價格(ge)(ge)降(jiang)至(zhi)30萬元左右是有可(ke)能的(de),但要達到(dao)15萬元,成(cheng)本(ben)壓力還(huan)是很大(da)。
但背靠著(zhu)特斯(si)(si)拉(la)工(gong)廠的(de)(de)(de)規模化生產和同根同源的(de)(de)(de)核(he)心技術,馬(ma)斯(si)(si)克對于特斯(si)(si)拉(la)人(ren)形(xing)機(ji)器(qi)人(ren)的(de)(de)(de)預估售價或許是有底(di)氣的(de)(de)(de)。“擎天柱(zhu)”頭(tou)部配備與特斯(si)(si)拉(la)汽車相同的(de)(de)(de)攝像(xiang)頭(tou)等(deng)傳感(gan)器(qi)陣列,算力支持(chi)由FSD芯片提供,同時(shi)與汽車共用AI系統(tong),利用Dojo超級計算機(ji)的(de)(de)(de)訓練機(ji)制(zhi)去提升機(ji)器(qi)人(ren)的(de)(de)(de)功(gong)能。馬(ma)斯(si)(si)克及其團隊(dui)多次表示(shi),特斯(si)(si)拉(la)的(de)(de)(de)技術進步不僅可以使用到汽車上,也(ye)可以使用到“擎天柱(zhu)”上。
馬斯克認為,盡管自動(dong)駕駛汽車為世界帶(dai)來非常深(shen)刻的(de)(de)變化,在交通行業可(ke)謂是(shi)革命性的(de)(de),運輸(shu)生產效率(lv)至少可(ke)以(yi)(yi)提高一個數量級甚至更(geng)多,但機器人(ren)(ren)對于社(she)會來說意義更(geng)大。“使用機器人(ren)(ren)可(ke)以(yi)(yi)實現更(geng)低的(de)(de)勞(lao)動(dong)力(li)成本,讓(rang)經濟得(de)以(yi)(yi)更(geng)好地發(fa)展。未來機器人(ren)(ren)可(ke)以(yi)(yi)無處不在,人(ren)(ren)們可(ke)以(yi)(yi)選擇體(ti)力(li)活,但這是(shi)一種選擇而不是(shi)必須做的(de)(de),大家都可(ke)以(yi)(yi)去做腦力(li)工(gong)作。”
但馬斯克也坦言,目前的(de)(de)機(ji)(ji)器人(ren)(ren)還(huan)不是非常完善(shan),當前推出(chu)的(de)(de)是“擎天柱”第(di)一個版(ban)本,接下來還(huan)要(yao)解決很多技術問題(ti)并(bing)不斷進行迭代,要(yao)讓機(ji)(ji)器人(ren)(ren)非常靈活、高(gao)效且安全。“但現在我們(men)必須要(yao)先做(zuo)一些(xie)技術選擇(ze),以(yi)便盡快量產出(chu)有(you)用的(de)(de)機(ji)(ji)器人(ren)(ren)。”
同根同源的FSD技術和Dojo超算系統
特斯拉的(de)機器人和汽車(che)都離不開(kai)FSD技(ji)術(shu),據特斯拉官方數據顯示,目前(qian)Tesla FSD Beta擁有16萬名用(yong)戶,而(er)在2021年(nian)只有2000名。“我(wo)們(men)持續一(yi)年(nian)訓練(lian)了(le)75000個(ge)神經網絡模型,基本上(shang)是(shi)每8分鐘就(jiu)訓練(lian)了(le)一(yi)個(ge)模型,我(wo)們(men)發布了(le)其中(zhong)281個(ge)模型,它們(men)也的(de)確(que)提(ti)升了(le)汽車(che)的(de)性能(neng)(neng)。此外(wai)這(zhe)些(xie)性能(neng)(neng)上(shang)的(de)創(chuang)新是(shi)全棧式的(de),所以(yi)目前(qian) FSD Beta測試版可(ke)以(yi)實現(xian)一(yi)定程度上(shang)的(de)自動駕駛,比如可(ke)以(yi)從一(yi)個(ge)停(ting)車(che)場導航到另(ling)一(yi)個(ge)停(ting)車(che)場,可(ke)以(yi)停(ting)下來(lai)等紅綠燈(deng),還可(ke)以(yi)在十字路(lu)口和其他目標進行一(yi)些(xie)協(xie)調,這(zhe)些(xie)都得益于神經網絡上(shang)的(de)進步(bu),才能(neng)(neng)實現(xian)FSD測試用(yong)戶數量的(de)大幅增長。”
馬斯克表示,從技術角度來說,當(dang)前FSD Beta可以適應(ying)不(bu)同(tong)的(de)路況,不(bu)管是(shi)在哪一國家或地區,“不(bu)過(guo)我(wo)們希望在不(bu)同(tong)的(de)天氣條件下來進一步去驗(yan)證,比如大(da)雨和(he)大(da)雪天氣,同(tong)時我(wo)們也在考(kao)慮更多的(de)場景,并對相關指標進行優化,確保汽車能夠(gou)完全(quan)自動(dong)駕駛。”
他稱,FSD Beta今年(nian)年(nian)底有(you)望在(zai)(zai)全球推出,但(dan)面臨(lin)不同國(guo)家(jia)(jia)的監管(guan)(guan)審批也具有(you)非常大(da)的挑戰。“在(zai)(zai)美國(guo)和(he)(he)加(jia)拿大(da)以外的國(guo)家(jia)(jia)和(he)(he)地區,我們(men)需要(yao)和(he)(he)監管(guan)(guan)方(fang)(fang)保(bao)持更為密切的溝通(tong),以獲得(de)這方(fang)(fang)面的批準。但(dan)有(you)些國(guo)家(jia)(jia)和(he)(he)地區在(zai)(zai)此方(fang)(fang)面的監管(guan)(guan)其實(shi)是非常滯后(hou)的。”
據悉,此(ci)前(qian)特斯(si)拉(la)的自(zi)動(dong)駕駛(shi)團(tuan)隊依(yi)靠人工數據注釋來識別和描述特斯(si)拉(la)汽車上的攝像(xiang)頭和傳感(gan)器所拍攝的短視頻片段中的物體。這些(xie)標(biao)記的片段用于訓練(lian)特斯(si)拉(la)的神經網絡,并改進駕駛(shi)輔(fu)助系統,使特斯(si)拉(la)汽車能夠在駕駛(shi)者的監督下繞行,自(zi)動(dong)避(bi)開障(zhang)礙。
而在本屆 AI Day活(huo)動上,特斯拉(la)方面(mian)稱目前已經形成了非常復雜的自動標注(zhu)系統,通過人機合(he)作的方式,大(da)量的數據輸入汽(qi)車進行(xing)分析后形成訓練數據,提(ti)供(gong)正確(que)標注(zhu)之后再(zai)讓模(mo)型進行(xing)訓練,而在過去一年的時(shi)間里,訓練基礎設施也擴(kuo)展(zhan)了40%-50%,才(cai)能對大(da)規模(mo)的神經網絡進行(xing)訓練。
此(ci)(ci)外,面(mian)對復(fu)雜(za)的(de)(de)路況,人類可以順(shun)勢做(zuo)出(chu)關聯(lian)判斷,但是(shi)對于(yu)汽車(che)和機(ji)器人來(lai)說這樣的(de)(de)判斷較(jiao)有難度。汽車(che)面(mian)對多(duo)智能體應該(gai)如何規劃(hua)(hua)協(xie)調,也需要(yao)持(chi)續優(you)化,特(te)斯(si)拉團隊稱,在(zai)此(ci)(ci)情(qing)(qing)況下的(de)(de)計(ji)算(suan)量十分龐大(da),隨著(zhu)情(qing)(qing)況愈加(jia)(jia)復(fu)雜(za),計(ji)算(suan)量更是(shi)指數級的(de)(de)增加(jia)(jia),而對于(yu)汽車(che)的(de)(de)規劃(hua)(hua)器來(lai)說,需要(yao)非常快(kuai)做(zuo)出(chu)決(jue)定。
“隨著互動關系(xi)的(de)增加,計算量(liang)就會越來越大。所以(yi)我(wo)們要(yao)考慮的(de)不僅(jin)僅(jin)是尺度問(wen)題,我(wo)們最終(zhong)要(yao)建立(li)的(de)是一個輕(qing)量(liang)級(ji)的(de)可變網絡,可以(yi)進(jin)行(xing)循環(huan)地(di)運行(xing),這個過(guo)程中我(wo)們還需要(yao)再進(jin)行(xing)訓練,現在我(wo)們每個操作的(de)運行(xing)時(shi)間已經縮(suo)短到了100微秒(miao),這是一個莫大的(de)進(jin)步。”
為保證人工智能(neng)訓(xun)練效率,同時(shi)擴展帶寬、減少(shao)延遲(chi)、節(jie)省成本,特斯拉發展自研了Dojo超(chao)級計算機(ji)系統,特斯拉方面稱,特斯拉的車(che)隊(dui)在日常行(xing)駛中積累了很多視頻(pin)片段(duan),每個(ge)視頻(pin)有多幀圖像,需要(yao)14億幀才能(neng)訓(xun)練一個(ge)神經(jing)網絡,需要(yao)使用10萬(wan)個(ge)GPU工時(shi)。而Dojo超(chao)算,能(neng)夠提升(sheng)30%的網絡訓(xun)練速度。
據介紹,只用(yong)4個Dojo機柜(ju)就能(neng)取代由4000個GPU組成的(de)(de)72個GPU機架。Dojo能(neng)將(jiang)通常需要幾個月的(de)(de)工作減(jian)少(shao)到(dao)了(le)1周。“我們(men)計劃(hua)在2023年第一季(ji)度(du)推出Dojo機柜(ju),我想Dojo的(de)(de)算力是非常高的(de)(de)”,馬斯克表示。
而在這(zhe)場十分(fen)硬核的(de)(de)(de)(de)AI Day活(huo)動中,特斯(si)拉方(fang)面頻(pin)頻(pin)發(fa)出(chu)招募人才的(de)(de)(de)(de)信號(hao),馬(ma)(ma)斯(si)克也直言不諱,“舉辦這(zhe)樣的(de)(de)(de)(de)活(huo)動的(de)(de)(de)(de)目的(de)(de)(de)(de)就是為了(le)展示特斯(si)拉的(de)(de)(de)(de)技術(shu)以此吸引全球人才的(de)(de)(de)(de)加入。”而對于產品實際落地與上市,這(zhe)一次馬(ma)(ma)斯(si)克的(de)(de)(de)(de)承(cheng)諾能如期完成嗎?

