“萬(wàn)物皆可大模型”成為今年各個(gè)產(chǎn)業(yè)都逃不開(kāi)的話題。
年初以來(lái),能夠代寫(xiě)論文、寫(xiě)報(bào)告甚至寫(xiě)新聞的ChatGPT,徹底引爆了社會(huì)各方對(duì)大模型的關(guān)注。在大眾紛紛擔(dān)心自己是否會(huì)被AI所取代時(shí),自動(dòng)駕駛產(chǎn)業(yè)已經(jīng)瞄準(zhǔn)大模型的商業(yè)價(jià)值,紛紛推出大模型。近日,理想汽車(chē)在理想家庭科技日發(fā)布會(huì)上宣布,理想采用大模型算法,自研MindGPT。多方吹捧的大模型,能否為自動(dòng)駕駛產(chǎn)業(yè)帶來(lái)“第二春”?
01大模型成新寵
“自動(dòng)駕駛技術(shù)正進(jìn)入以數(shù)據(jù)和知識(shí)雙驅(qū)動(dòng)的多模態(tài)感知和認(rèn)知理解為代表的新階段。”中科院雄安創(chuàng)新研究院認(rèn)知智能實(shí)驗(yàn)室副主任黃武陵在接受《中國(guó)汽車(chē)報(bào)》記者采訪時(shí)表示,大語(yǔ)言模型(LLM)、跨模態(tài)大模型的出現(xiàn),為自動(dòng)駕駛產(chǎn)業(yè)的發(fā)展帶來(lái)突破口。目前,行業(yè)對(duì)大模型的定義是只有在參數(shù)達(dá)到千億以上才能夠被稱(chēng)為大模型。當(dāng)AI模型足夠大,經(jīng)過(guò)不斷地訓(xùn)練與學(xué)習(xí),就有可能實(shí)現(xiàn)智能化。因此,被看作能夠改變世界的大模型,成為自動(dòng)駕駛的新希望。
在數(shù)據(jù)閉環(huán)和仿真環(huán)節(jié),大模型將賦能自動(dòng)駕駛。商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,在人工智能1.0時(shí)代,大量的人工標(biāo)注導(dǎo)致數(shù)據(jù)標(biāo)注時(shí)間長(zhǎng)、成本高、挖掘難度大。但在人工智能2.0時(shí)代,基于大模型可以實(shí)現(xiàn)自動(dòng)標(biāo)注,大大降低成本,可快速進(jìn)行優(yōu)化和迭代。另外,還可通過(guò)AIGC利用人工智能做內(nèi)容生成,模擬生成高度真實(shí)的場(chǎng)景,助力自動(dòng)駕駛技術(shù)更好地進(jìn)行測(cè)試和優(yōu)化。“在大模型的輔助下,研發(fā)人員可以更多集中在關(guān)鍵算法及其提升體驗(yàn)上,集中打磨出更多滿(mǎn)足用戶(hù)體驗(yàn)、效果良好的產(chǎn)品。”黃武陵說(shuō)道。
在王曉剛看來(lái),多模態(tài)大模型的應(yīng)用還可實(shí)現(xiàn)從感知到?jīng)Q策、規(guī)劃、控制,端到端一體化的優(yōu)化。“當(dāng)前大多是感知輸出一個(gè)結(jié)果,基于規(guī)則做一些判斷,做出決策,然后再基于手動(dòng)規(guī)則,實(shí)現(xiàn)規(guī)劃控制。”他認(rèn)為,未來(lái)大模型通過(guò)人工智能,可以實(shí)現(xiàn)端到端自動(dòng)駕駛,提供更加可靠、像人開(kāi)車(chē)一樣的體驗(yàn)。
目前行業(yè)普遍認(rèn)為,在技術(shù)方面,自動(dòng)駕駛的底層架構(gòu)和大部分技術(shù)問(wèn)題已得到解決,但由于現(xiàn)實(shí)道路場(chǎng)景復(fù)雜,即便現(xiàn)有技術(shù)已實(shí)現(xiàn)90%以上場(chǎng)景的自動(dòng)駕駛,剩下10%的長(zhǎng)尾場(chǎng)景始終無(wú)法覆蓋。黃武陵表示,隨著大模型在垂直領(lǐng)域的應(yīng)用逐漸成熟,成本可控且性能效率良好的前提下,大模型有望在環(huán)境認(rèn)知理解、智能決策等算法功能上得到應(yīng)用,將交通指示和駕駛經(jīng)驗(yàn)得以沉淀和應(yīng)用,緩解自動(dòng)駕駛的“長(zhǎng)尾問(wèn)題”。
此外,大模型還能為自動(dòng)駕駛“拋棄”高精地圖提供助力。要想實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛,高精度地圖不可或缺,但實(shí)時(shí)更新難度大、法規(guī)風(fēng)險(xiǎn)高、成本極高三座“大山”始終難以跨越。擺脫高精地圖,成為不少企業(yè)的選擇。隨著大模型漸受關(guān)注,安信證券研報(bào)指出,AI大模型將助力企業(yè)實(shí)現(xiàn)“脫高精度地圖”。BEV感知算法通過(guò)將不同視角的攝像頭采集到的圖片統(tǒng)一轉(zhuǎn)換,相當(dāng)于車(chē)輛實(shí)時(shí)生成地圖,補(bǔ)足自動(dòng)駕駛后續(xù)決策所需的道路拓?fù)湫畔ⅲ瑢?shí)現(xiàn)“脫圖”。
02產(chǎn)品接連發(fā)布
受到各界追捧的Chat-GPT,全稱(chēng)為“Generative Pretrained Transformer”,其采用了谷歌在2017年提出的Transformer架構(gòu)。對(duì)于自動(dòng)駕駛領(lǐng)域而言,Transformer架構(gòu)則并不陌生。早在2021年,特斯拉便將Transformer架構(gòu)引入自動(dòng)駕駛領(lǐng)域,推出基于Transformer的BEV感知方案。這是大模型技術(shù)在自動(dòng)駕駛行業(yè)的首次亮相,也成為特斯拉實(shí)現(xiàn)純視覺(jué)自動(dòng)駕駛方案的關(guān)鍵所在。隨后,華為、商湯科技、百度Apollo等企業(yè)相繼在“BEV+Transformer”上展開(kāi)布局。中信證券研報(bào)指出,隨著小鵬城市NGP、華為城區(qū)NCA功能、毫末智行城市NOH等城市領(lǐng)航功能的相繼落地,“BEV+Transformer”將引領(lǐng)自動(dòng)駕駛感知范式。
如今,大模型絕不僅限于自動(dòng)駕駛感知領(lǐng)域。今年4月,毫末智行正式發(fā)布自動(dòng)駕駛生成式大模型DriveGPT“雪湖·海若”。據(jù)毫末智行首席執(zhí)行官顧維灝介紹,毫末DriveGPT通過(guò)引入駕駛數(shù)據(jù)建立RLHF(人類(lèi)反饋強(qiáng)化學(xué)習(xí))技術(shù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問(wèn)題,終極目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛。顧維灝表示,毫末DriveGPT將率先探索智能駕駛、駕駛場(chǎng)景識(shí)別、駕駛行為驗(yàn)證、困難場(chǎng)景脫困四大應(yīng)用場(chǎng)景,首先將開(kāi)放智能駕駛、駕駛場(chǎng)景識(shí)別兩大應(yīng)用場(chǎng)景。
在自動(dòng)駕駛領(lǐng)域,商湯科技開(kāi)發(fā)了業(yè)界首個(gè)感知決策一體化的端到端自動(dòng)駕駛解決方案——UniAD,在多目標(biāo)跟蹤準(zhǔn)確率、車(chē)道線預(yù)測(cè)準(zhǔn)確率等多項(xiàng)關(guān)鍵技術(shù)指標(biāo)上超越SOTA方法,整體系統(tǒng)和性能得到大幅提升。“未來(lái),我們將利用多模態(tài)大模型,進(jìn)一步推動(dòng)自動(dòng)駕駛技術(shù)發(fā)展,如通過(guò)AIGC產(chǎn)生大量困難樣本,用環(huán)視感知的數(shù)據(jù),和多模態(tài)數(shù)據(jù)作為多模態(tài)大模型的輸入,實(shí)現(xiàn)感知和決策一體化的集成。”王曉剛表示。
于不久前正式亮相的Mind GPT,則是屬于理想汽車(chē)自研的認(rèn)知大模型。理想現(xiàn)已用1.3萬(wàn)億個(gè)token為其進(jìn)行基座模型訓(xùn)練,讓其對(duì)話生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理等多項(xiàng)能力更安全、更準(zhǔn)確、更有邏輯。在Mind GPT的賦能下,理想汽車(chē)所搭載的智能語(yǔ)音助手——理想同學(xué),將像人一樣主動(dòng)感知環(huán)境和他人、學(xué)習(xí)和思考、表達(dá)和互動(dòng)。此外,在智能駕駛方面,理想AD Max 3.0可通過(guò)大模型AI算法,擺脫對(duì)高精地圖的依賴(lài),實(shí)時(shí)感知、決策、規(guī)劃,識(shí)別準(zhǔn)確度相當(dāng)高。理想汽車(chē)智能駕駛副總裁郎咸朋表示:“在先進(jìn)的技術(shù)架構(gòu)和高效的訓(xùn)練平臺(tái)共同推動(dòng)下,智能駕駛將會(huì)很快在家庭出行中實(shí)現(xiàn)大規(guī)模普及,AI駕駛員替代人類(lèi)駕駛員的時(shí)代也不再遙遠(yuǎn)。”
此外,百度此前也表示,要將文心一言大模型應(yīng)用在自動(dòng)駕駛上,以加深A(yù)pollo自動(dòng)駕駛車(chē)輛對(duì)復(fù)雜城市路況的理解,進(jìn)一步提升其自動(dòng)駕駛安全性和可靠性。斑馬智行則基于阿里巴巴通義千問(wèn)大模型,打造了第三代汽車(chē)AI能力體系Banma Co-Pilot,構(gòu)建云端一體的全棧AI能力。日前,特斯拉首席執(zhí)行官馬斯克也表示,特斯拉會(huì)迎來(lái)自己的“ChatGPT時(shí)刻”,如果不是今年,肯定也不會(huì)遲于明年。一系列大模型產(chǎn)品的相繼發(fā)布,可見(jiàn)大模型在自動(dòng)駕駛領(lǐng)域的“受寵”程度。
03商業(yè)化為時(shí)過(guò)早
“目前大模型究竟能給行業(yè)帶來(lái)什么影響尚不明晰,一些有能力、有資金的企業(yè)只是處于率先探索階段,商業(yè)化還為時(shí)過(guò)早。”全聯(lián)車(chē)商投資管理(北京)有限公司總裁曹鶴表示。
聚焦自動(dòng)駕駛大模型,就此前發(fā)布的幾款大模型產(chǎn)品究竟含金量幾何,自動(dòng)駕駛行業(yè)從業(yè)者呂兆波并沒(méi)有太大信心。他直言:“DriveGPT很不現(xiàn)實(shí),就算大企業(yè)投資研發(fā),沒(méi)有5~10年很難見(jiàn)到成果。這個(gè)大模型的概念很大,他們可能就是做一個(gè)簡(jiǎn)單的數(shù)據(jù)融合。”
在呂兆波看來(lái),大模型的優(yōu)點(diǎn)就是能夠?qū)⒏鹘M數(shù)據(jù)融合在一起,對(duì)外界環(huán)境的感知更為準(zhǔn)確。但是,要想使用大模型,首先就面臨部署問(wèn)題。“如果大模型部署在云端,延遲問(wèn)題很難解決;而如果部署在車(chē)端,如此龐大的數(shù)據(jù)量,延遲問(wèn)題同樣不容小覷。”他說(shuō)道。上不上車(chē),成為困擾自動(dòng)駕駛大模型商業(yè)化的首要問(wèn)題。
對(duì)此,地平線創(chuàng)始人兼首席執(zhí)行官余凱在參加2023中國(guó)電動(dòng)汽車(chē)百人會(huì)論壇時(shí)提出,車(chē)端的能量供給與散熱等現(xiàn)實(shí)困難,使得自動(dòng)駕駛無(wú)法采用類(lèi)似ChatGPT云端計(jì)算中那樣龐大的模型與計(jì)算量。顧維灝在接受媒體采訪時(shí)則表示,云端模型與車(chē)端模型的大小并不是完全等同的關(guān)系,目前DriveGPT參數(shù)規(guī)模已達(dá)1200億,但并不意味著把這1200億的參數(shù)大模型都上到車(chē)端,關(guān)鍵是留住核心能力。
此外,成本問(wèn)題也是困擾之一。有業(yè)內(nèi)人士指出,自動(dòng)駕駛系統(tǒng)如果要上大模型,至少要增加5萬(wàn)美元成本,隨著大模型進(jìn)一步變大,成本或許會(huì)進(jìn)一步增加。對(duì)此,呂兆波稱(chēng),成本問(wèn)題可通過(guò)云端部署解決,但前提是解決云端的延遲問(wèn)題。即便是大模型自身,也認(rèn)為成本問(wèn)題是一大重要考慮因素。在回答“如果將ChatGPT應(yīng)用到自動(dòng)駕駛中,是否會(huì)成本過(guò)高?”這一問(wèn)題時(shí),Chat-GPT給出的回復(fù)表示,將ChatGPT應(yīng)用于自動(dòng)駕駛系統(tǒng)會(huì)涉及一定的成本,主要涉及計(jì)算資源、數(shù)據(jù)收集和訓(xùn)練、模型開(kāi)發(fā)和集成等幾方面。
04輿論火熱 資本冷靜
前有創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開(kāi)復(fù)宣布籌辦全球化公司Project AI 2.0,后有搜狗創(chuàng)始人王小川投資5000萬(wàn)美元成立百川智能。此前,紅杉中國(guó)種子基金也表示正在密切關(guān)注并開(kāi)始布局AIGC領(lǐng)域的早期企業(yè)。一方是資本盛宴,另一方則略顯冷清。2022年以來(lái),裁員、倒閉、關(guān)停的消息充斥自動(dòng)駕駛產(chǎn)業(yè),不少人感嘆自動(dòng)駕駛進(jìn)入“寒冬期”。雖說(shuō)大模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用還為時(shí)過(guò)早,但不可否認(rèn),大模型的出現(xiàn)給正處于寒冬的自動(dòng)駕駛產(chǎn)業(yè)重新燃起一把火。這波與大模型的聯(lián)動(dòng),能讓漸失熱度的自動(dòng)駕駛重獲資本寵愛(ài)嗎?
中國(guó)生產(chǎn)力促進(jìn)中心協(xié)會(huì)常務(wù)副理事長(zhǎng)兼秘書(shū)長(zhǎng)、研究員王羽認(rèn)為,大模型的出現(xiàn)提供了一個(gè)群體性的突破機(jī)會(huì),能夠提振行業(yè)信心,重塑單車(chē)智能技術(shù)路線。不過(guò),在汽車(chē)行業(yè)分析師邵元駿看來(lái),盡管資本對(duì)于大模型熱情高漲,但經(jīng)過(guò)多年發(fā)展,資本已經(jīng)認(rèn)清自動(dòng)駕駛產(chǎn)業(yè)的發(fā)展現(xiàn)狀,不會(huì)在大模型萌芽期貿(mào)然進(jìn)行大手筆投資。
據(jù)王曉剛介紹,ChatGPT這樣的大模型僅訓(xùn)練一次便需要上千萬(wàn)美元的成本投入,商湯科技近幾年在AI研發(fā)中已累計(jì)投入上百億元,僅臨港AIDC基礎(chǔ)設(shè)施投入便超50億元。動(dòng)輒成百上千億元的投入,在自動(dòng)駕駛領(lǐng)域卻很難短時(shí)間實(shí)現(xiàn)盈利。
“現(xiàn)在受經(jīng)濟(jì)形勢(shì)影響,整個(gè)資本行業(yè)本身就面臨寒冬,錢(qián)不多,出手就會(huì)更加謹(jǐn)慎。”邵元駿說(shuō)。如此看來(lái),炙手可熱的大模型似乎也難解當(dāng)前自動(dòng)駕駛產(chǎn)業(yè)之寒。
原標(biāo)題:賦能自動(dòng)駕駛,大模型是真旺還是虛火?