-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 營銷推廣 > 專題列表 > 正文
- 向外突圍,毫末開啟商業(yè)化新故事
- DriveGPT雪湖·海若誕生,將重塑汽車智能化技術(shù)路線
- 毫末發(fā)布自動(dòng)駕駛生成式大模型DriveGPT 中文名"雪湖·海若"
- HAOMO發(fā)布自動(dòng)駕駛生成式大模型DriveGPT
GPT大模型將發(fā)布(gpt 模型)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于GPT大模型將發(fā)布的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器
官網(wǎng):https://ai.de1919.com。
本文目錄:
向外突圍,毫末開啟商業(yè)化新故事
終于拿到長(zhǎng)城體系外訂單
“我們還在等他們(毫末)的車交付之后,才能做技術(shù)上的對(duì)標(biāo)?!?同為量產(chǎn)高階智駕方案的某車企工程師這樣評(píng)價(jià)毫末。
這一對(duì)標(biāo)將在今年初見分銷。
4月11日,在第八屆AI DAY上,毫末發(fā)布了一個(gè)堪比BEV的新技術(shù):自動(dòng)駕駛生成式大模型DriveGPT——雪湖·海若。
2021年特斯拉用一個(gè)BEV架構(gòu)模型搞定了自動(dòng)駕駛的感知,而雪湖·海若Transformer則有望用一個(gè)模型解決自動(dòng)駕駛的認(rèn)知問題。
雪湖·海若將依次搭載在魏牌摩卡DHT-PHEV和藍(lán)山上,首批落地在北京、保定、上海等城市,并于2024年開拓100個(gè)城市。
此外,毫末宣布與三家主機(jī)廠簽訂了定點(diǎn)合作協(xié)議,其中包括長(zhǎng)城體系外的品牌。
新技術(shù)范式、百城大戰(zhàn),毫末的“野心”要如何實(shí)現(xiàn)?
01
一次解決所有問題
“(雪湖·海若)使我們?cè)谝粋€(gè)統(tǒng)一的生成式框架下,將規(guī)劃、決策和推理等多個(gè)任務(wù)全部完成。”毫末智行CEO顧維灝在采訪中表示:“(雪湖·海若)在更大數(shù)據(jù)的支持下,還是會(huì)讓(自動(dòng)駕駛系統(tǒng)的決策能力)有一個(gè)質(zhì)的提升。這一新技術(shù)范式即使放眼全球也是非常獨(dú)特和創(chuàng)新的。”
認(rèn)知架構(gòu)雪湖·海若和感知架構(gòu)BEV一樣,旨在通過一個(gè)大模型一次性解決問題。
在BEV之前,自動(dòng)駕駛系統(tǒng)的感知是在各傳感器端先進(jìn)行感知,之后由多個(gè)小模型算法進(jìn)行置信判斷和融合之后,輸出最終的感知結(jié)果。BEV則是一次性“吸收”所有傳感器的原始數(shù)據(jù),之后直接輸出車輛周圍360°的完整空間感知結(jié)果。
決策方面,目前業(yè)內(nèi)主要包括預(yù)測(cè)、規(guī)劃、控制幾個(gè)環(huán)節(jié):
基于感知結(jié)果,通過搜索等方法劃定出可行使空間,再在其中根據(jù)自車和其它交通參與者可能的行動(dòng)軌跡進(jìn)行路線規(guī)劃,最終決定出一條行駛路線,并將行駛路線分解為車輛動(dòng)作命令傳給執(zhí)行器。
雪湖·海若則是基于感知結(jié)果,直接給出規(guī)劃控制結(jié)果和理由:
一次性生成多個(gè)未來可能發(fā)生的全局場(chǎng)景,并且按照可能發(fā)生的概率排序;生成自車未來的軌跡信息;直接給出決策邏輯鏈。
例如在一個(gè)包含對(duì)向來車、左側(cè)電動(dòng)車、右側(cè)過路行人的無保護(hù)左轉(zhuǎn)的場(chǎng)景中:
傳統(tǒng)方法是先對(duì)與自車最有可能交互的對(duì)向來車進(jìn)行軌跡預(yù)測(cè),基于預(yù)測(cè)結(jié)果判斷自車應(yīng)該的行駛軌跡。此軌跡如果涉及到電動(dòng)車/行人等其它的交通參與者,則加入考慮后預(yù)測(cè),再判斷軌跡,如此往復(fù)。
但雪湖·海若是一次性看到路面的全局情況,基于預(yù)訓(xùn)練積累的“經(jīng)驗(yàn)”,直接得出:對(duì)向來車已出線剎車概率低、電動(dòng)車雖然未出線但慣于搶行、行人在路口通常謹(jǐn)慎行動(dòng)變。如以安全為先,應(yīng)當(dāng)緩慢起步,讓行電動(dòng)車后,快速通過路口。
之所以出現(xiàn)這樣不同的“思考”方式,在于傳統(tǒng)方法和雪湖·海若在短期數(shù)據(jù)和長(zhǎng)期知識(shí)上存在不同。
短期數(shù)據(jù)即當(dāng)時(shí)當(dāng)刻的路面情況。
由于目前決策大都使用參數(shù)有限的小模型,因此一次性能考慮的對(duì)象便相對(duì)有限。
雪湖·海若作為大模型,在云端參數(shù)高達(dá)1200億個(gè),由此在學(xué)習(xí)時(shí)能夠做到全局思考。目前毫末未透露部署到車端時(shí)的參數(shù)規(guī)模。
長(zhǎng)期知識(shí)則是交通規(guī)則和常識(shí)性的潛規(guī)則。
目前主流決策層算法仍以邏輯判斷為主,對(duì)于“誰會(huì)如何”更多還是出自工程師經(jīng)驗(yàn)。
雪湖·海若則是先在4000萬量產(chǎn)車駕駛數(shù)據(jù)中進(jìn)行學(xué)習(xí),又用5萬個(gè)經(jīng)過篩選的人類接管數(shù)據(jù)做反饋訓(xùn)練,最終習(xí)得開車的知識(shí)和常識(shí),能夠更加類人的,根據(jù)當(dāng)前交通情況推理出未來各類交通場(chǎng)景以及出現(xiàn)的概率。
對(duì)于神經(jīng)網(wǎng)絡(luò)作為黑盒,思考過程的不可解釋化,毫末技術(shù)負(fù)責(zé)人艾銳向《賽博汽車》表示,通過添加限定規(guī)則,可以一定程度上解決這一問題。
在決策層引入GPT模型只是開始,未來毫末計(jì)劃將雪湖·海若擴(kuò)大為端到端的自動(dòng)駕駛系統(tǒng)模型,即用一個(gè)大模型解決感知、認(rèn)知的所有問題。
中國自動(dòng)駕駛邏輯芯片企業(yè)地平線也持類似的觀點(diǎn)。前不久,地平線作為第一作者發(fā)布了基于Transformer的自動(dòng)駕駛端到端算法框架論文,首次將檢測(cè)、跟蹤、預(yù)測(cè)、箭頭軌跡預(yù)測(cè)等多個(gè)模塊用一個(gè)完整神經(jīng)網(wǎng)絡(luò)架構(gòu)完整解決。
“讓我們有可能像ChatGPT那樣,用端到端的大規(guī)模的數(shù)據(jù)去訓(xùn)練整個(gè)的自動(dòng)駕駛系統(tǒng)。”地平線創(chuàng)始人&CEO余凱在演講中表示。
02
萬事俱備,只待上車
一次解決所有問題,當(dāng)然很棒,但卻鮮少有玩家實(shí)踐該技術(shù)。
在2022年的AI DAY和今年的投資者日上,特斯拉展示的預(yù)測(cè)算法仍是以蒙特卡洛樹搜索為主。
小鵬汽車自動(dòng)駕駛副總裁吳新宙則在4月明確表示,未來小鵬將在預(yù)測(cè)層面引入神經(jīng)網(wǎng)絡(luò),但在規(guī)控層面,仍將以邏輯算法為主?!拔覍?duì)團(tuán)隊(duì)有一個(gè)明確的線,能用數(shù)學(xué)方法解決的問題,都先用數(shù)學(xué)的方法。”
事實(shí)上,即使想要應(yīng)用,GPT也不是普通玩家玩得起的。
華為云人工智能領(lǐng)域首席科學(xué)家田奇在近日的演講中表示,大模型開發(fā)和訓(xùn)練一次需要1200萬美元。而且并不只是“錢”的事。
首先,雪湖·海若作為GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,需要有大規(guī)模語料庫來進(jìn)行訓(xùn)練。
顧維灝在演講中表示,雪湖·海若的一個(gè)關(guān)鍵設(shè)計(jì)是將場(chǎng)景Token(令牌,代表執(zhí)行某些操作的權(quán)利對(duì)象)化表達(dá):將駕駛空間進(jìn)行離散化處理,每一個(gè)Token都表征場(chǎng)景的一小部分。如果輸入一連串過去已經(jīng)發(fā)生的場(chǎng)景Token序列,模型可生成未來所有可能的場(chǎng)景。目前毫末Token的詞表空間是50萬個(gè)左右。
大模型還需要超算中心來訓(xùn)練。
1月,毫末發(fā)布了670PFLOPS算力的超算中心——雪湖·綠洲。若按照一塊19.5TFLOPS算力的英偉達(dá)A100計(jì)算,則綠洲或用了34.3萬塊英偉達(dá)A100。
綠洲還針對(duì)海若進(jìn)行了針對(duì)性的升級(jí)改造。
一是建立全套訓(xùn)練保障框架,避免因個(gè)別服務(wù)器異常可能導(dǎo)致的訓(xùn)練中端;二是升級(jí)彈性調(diào)度資源的能力,使訓(xùn)練平臺(tái)能夠自適應(yīng)每天回傳數(shù)據(jù)不同的大小規(guī)模;三是吞吐效率的升級(jí),通過算子融合端到端吞吐提升84%。
但就像ChatGPT和GPT4仍依賴于對(duì)話者不斷調(diào)整問題問法,擴(kuò)大數(shù)據(jù)庫調(diào)用權(quán)限,才能表現(xiàn)得更加真實(shí)類人一樣。
雪湖·海若要做到真正高速類人,在并行效率、算力需求、功耗等方面超過搜索等傳統(tǒng)方法,甚至超過人類表現(xiàn)的前提,是源源不斷的真實(shí)道路場(chǎng)景和人類反饋。
03
毫末的身份突圍
2022年底,小鵬、華為、毫末三家搶跑城市領(lǐng)航功能落地。
從結(jié)果來看,小鵬、華為都已有了搭載城市領(lǐng)航功能的車隊(duì)上路,毫末HPilot 3.0所搭載的新摩卡DHT-PHEV預(yù)計(jì)將于本月推出,而魏牌藍(lán)山要到三季度才會(huì)推出激光雷達(dá)版。
與此同時(shí),后來者也正逐步逼近,蔚來、理想等車企,和輕舟智航等智能駕駛供應(yīng)商都已宣布了2024年落地高速、城市領(lǐng)航功能的計(jì)劃。
之所以形成這樣的局面,與毫末的身份不無關(guān)系。
毫末雖然出身長(zhǎng)城,卻無法像蔚小理的智駕團(tuán)隊(duì)一樣,擁有自上而下的話語權(quán),更多還是相對(duì)獨(dú)立的供應(yīng)商身份。
但背靠長(zhǎng)城又使毫末的供應(yīng)商身份不那么純粹。對(duì)于出自ICT行業(yè)的華為,車企都尚且顧忌靈魂。出自同行的毫末作為供應(yīng)商,自然也少不了被挑剔。
如何實(shí)現(xiàn)身份突圍?
今年年初,毫末推出了包括全棧解決方案、云端服務(wù)、硬件、軟件、模塊、原型代碼六個(gè)層面的6P開放合作模式。合作伙伴不僅可以獲取毫末的功能產(chǎn)品,甚至可以獲得原型代碼這樣的底層技術(shù)能力。
“您的靈魂您保留,我的靈魂您帶走?!?毫末智行COO侯軍表示:“(智能/自動(dòng)駕駛)全棧自研是高成本、長(zhǎng)周期的事情。毫末的6P開放模式幫助主機(jī)廠在不具備技術(shù)和時(shí)間的情況下參與競(jìng)爭(zhēng)。
如果之后毫末的綜合性價(jià)比能力趕不上合作伙伴進(jìn)步的靈魂,我們被淘汰也是正常的。如果能趕上,我們?cè)敢馀c合作伙伴長(zhǎng)期攜手同行。”
這樣“白盒”開放的態(tài)度已經(jīng)起到了效果,毫末已與三家主機(jī)廠簽署定點(diǎn)合同,其中包括長(zhǎng)城體系外的品牌。
在毫末的生態(tài)伙伴當(dāng)中,除了高通這樣的老朋友外,還多了英偉達(dá)、華為、地平線這樣新朋友,未來合作方向值得玩味。
此外,毫末在2024年的百城計(jì)劃也絕非說說而已。
目前,華為、小鵬的城市領(lǐng)航功能在核心區(qū)域仍需依靠高精地圖。而毫末的方案則完全不采用高精地圖,只用類似導(dǎo)航地圖的標(biāo)清地圖,以感知信息的置信權(quán)重遠(yuǎn)高于地圖信息,即所謂重感知輕地圖方案。
要完全依靠感知信息做判斷使毫末目前的城市領(lǐng)航功能更顯保守,安全性要求遠(yuǎn)高于舒適和通行效率。
但由于完全不依賴高精地圖,所以毫末HPilot 3.0的開城將不受地圖資源限制,隨著其感知能力打磨得愈發(fā)完善,開城速度也將愈發(fā)加速。
顧維灝在演講中表示,毫末的視覺自監(jiān)督大模型感知性能已提升20%。例如魚眼攝像頭在15米范圍內(nèi)的測(cè)量精度已達(dá)到30厘米,2米內(nèi)精度可以高于10厘米。因此毫末正考慮取消超聲波雷達(dá),直接使用魚眼鏡頭做泊車功能。
技術(shù)進(jìn)步也正成為毫末作為供應(yīng)商,持續(xù)降本的底氣所在。毫末智行張凱表示:“未來(降本同效的策略)對(duì)我們和行業(yè)發(fā)展,都會(huì)有很好的推動(dòng)作用?!?/strong>
【本文來自易車號(hào)作者賽博汽車,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請(qǐng)聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
DriveGPT雪湖·海若誕生,將重塑汽車智能化技術(shù)路線
和 ChatGPT 在 AIGC(AI- Generated Content,人工智能生成內(nèi)容)領(lǐng)域一樣具備顛覆性的事情正在發(fā)生。
4 月 11 日,自動(dòng)駕駛技術(shù)公司毫末智行在其第八屆 HAOMO AI DAY 上,重磅發(fā)布行業(yè)首個(gè)自動(dòng)駕駛生成式大模型 DriveGPT,中文名「雪湖·海若」,該模型參數(shù)規(guī)模達(dá)到 1200 億,可用于解決自動(dòng)駕駛研發(fā)過程中困擾已久的認(rèn)知決策問題,并通過能力迭代,最終實(shí)現(xiàn)端到端自動(dòng)駕駛。
此前,受制于傳統(tǒng)模型「數(shù)據(jù)量小、基于規(guī)則」等局限性,智能駕駛技術(shù)進(jìn)展一度較為緩慢,甚至不少從業(yè)者都對(duì)未來產(chǎn)生了自我懷疑,在這樣的背景下,兩年前,毫末率先投入到大模型技術(shù)的研發(fā)之中,旨在尋找新的突破。
經(jīng)歷了先行探索和反復(fù)驗(yàn)證,毫末成功找到了突破口——生成式大模型,通過在行業(yè)首個(gè)將 GPT 落地到自動(dòng)駕駛領(lǐng)域,大大加速了更高階智能駕駛的落地應(yīng)用。
「生成式大模型將成為自動(dòng)駕駛系統(tǒng)進(jìn)化的關(guān)鍵,基于 Transformer 大模型訓(xùn)練的感知、認(rèn)知算法會(huì)逐步在車端進(jìn)行落地部署?!购聊┒麻L(zhǎng)張凱在 HAOMO AI DAY 上對(duì)行業(yè)未來發(fā)展趨勢(shì)作出論斷。
毫末 CEO 顧維灝也表示:「DriveGPT 雪湖·海若將會(huì)重塑汽車智能化技術(shù)路線,讓輔助駕駛進(jìn)化更快,讓自動(dòng)駕駛更早到來?!?span style="display:none">3uS創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司
顧維灝在自動(dòng)駕駛技術(shù)領(lǐng)域的眼光獨(dú)到,布局非常領(lǐng)先。
事實(shí)上,毫末在 2021 年就已經(jīng)開始了 Transformer 大模型技術(shù)的探索,并快速落地應(yīng)用到 BEV 視覺感知算法當(dāng)中,然后又以五大模型的方式來實(shí)現(xiàn)自動(dòng)駕駛感知、認(rèn)知算法的快速升級(jí),現(xiàn)在這些大模型將統(tǒng)一到 DriveGPT 生成式大模型當(dāng)中,目標(biāo)將實(shí)現(xiàn)端到端自動(dòng)駕駛。
毫末的探索始終走在行業(yè)技術(shù)探索的前列。
據(jù)了解,新摩卡 DHT-PHEV 即將首發(fā)搭載 DriveGPT 雪湖·海若量產(chǎn)上市,屆時(shí),用戶市場(chǎng)還將迎來一輪新的震撼。
「毫末真正重塑了行業(yè)信心,」一位業(yè)內(nèi)人士略微激動(dòng)地說道,「這將是一場(chǎng)革命?!?span style="display:none">3uS創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司
01、DriveGPT 雪湖·海若,如何顛覆智能駕駛
在介紹 DriveGPT 雪湖·海若之前,先回顧一下 ChatGPT 的概念,其全稱是 Chat Generative Pre-trained Transformer,字面意思是用于聊天的生成式預(yù)訓(xùn)練 Transformer 大模型。
其中 Transformer 是 ChatGPT 的重點(diǎn),最早由谷歌在 2017 年提出,該模型基于注意力機(jī)制的設(shè)計(jì),可以實(shí)現(xiàn)出色的算法并行性,因而迅速在自然語言處理(NLP) 領(lǐng)域流行起來,ChatGPT 就是其最新成果。
Transformer 大模型對(duì)于智能駕駛來說也不陌生,在 NLP 中奠定了核心地位之后,被逐漸被引入計(jì)算機(jī)視覺(CV)領(lǐng)域,后又被特斯拉、毫末智行等行業(yè)龍頭先行引入自動(dòng)駕駛系統(tǒng)中,用于提升感知端的模型效果。
如今,毫末在 Transformer 大模型的應(yīng)用上更進(jìn)一步,將其率先拓展到智能駕駛系統(tǒng)認(rèn)知端,DriveGPT 雪湖·海若由此誕生。
從同樣使用 Transformer 大模型的角度來說,ChatGPT 和 DriveGPT 雪湖·海若屬于同宗同源。
其中,ChatGPT 是對(duì)話式的生成式自然語言模型,輸入是自然語言的文本串,輸出是自然語言的文本,可以完成通用的下游語言生成任務(wù),比如多輪對(duì)話、代碼生成、翻譯、數(shù)學(xué) 運(yùn)算等能力。
而毫末 DriveGPT 雪湖·海若是用于自動(dòng)駕駛場(chǎng)景的生成式大模型,輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場(chǎng)景文本序列,即將自動(dòng)駕駛場(chǎng)景 Token 化,形成「Drive Language」,最終完成自車的決策規(guī)控、障礙物預(yù)測(cè)以及決策邏輯鏈的輸出等任務(wù)。
DriveGPT 雪湖·海若首先在預(yù)訓(xùn)練階段通過引入量產(chǎn)駕駛數(shù)據(jù),訓(xùn)練初始模型,再通過引入駕駛接管 Clips 數(shù)據(jù)完成反饋模型 (Reward Model) 的訓(xùn)練,然后再通過強(qiáng)化學(xué)習(xí)的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對(duì)自動(dòng)駕駛認(rèn)知決策模型的持續(xù)優(yōu)化。
具體來說,DriveGPT 雪湖·海若會(huì)通過人類反饋強(qiáng)化學(xué)習(xí)的方式進(jìn)行迭代,用 DriveGPT 雪湖·海若最新模型 (Active Model) 對(duì)真實(shí)場(chǎng)景 Case 做生成,產(chǎn)出多種場(chǎng)景序列結(jié)果,再用反饋模型給這些結(jié)果進(jìn)行打分排序,目標(biāo)是把好的結(jié)果排上來,差的結(jié)果排下去,然后與初始模型 (Pretrain-Model) 的生成概率做比較,放大比分。最后通過強(qiáng)化學(xué)習(xí)的方式將參數(shù)再次更新到最新模型 (Active Model) 中,一直反復(fù)這個(gè)迭代過程。
其中,Reward Model(反饋模型) 的訓(xùn)練過程是獨(dú)立的,使用帶有偏序關(guān)系的 Pair 樣本對(duì)來訓(xùn)練,這些樣本對(duì)來自于接管 Case,毫末將與人類駕駛結(jié)果相似的模型結(jié)果作為正樣本,與被接管軌跡相似的作為負(fù)樣本,這樣來構(gòu)建偏序?qū)?,再利?LTR(Learning To Rank) 的思路去訓(xùn)練 Reward Model,進(jìn)而得到一個(gè)打分模型。
此外,DriveGPT 雪湖·海若還可以輸出決策邏輯鏈:即在輸入端提供 Prompts(提示語),根據(jù)提示輸出含有決策邏輯鏈 (Chain of Thought) 的未來序列。
毫末 CSS 自動(dòng)駕駛場(chǎng)景庫是 CoT 的重要輸入,擁有超過幾十萬個(gè)細(xì)顆粒度場(chǎng)景,將 Prompt 提示語和完整決策過程的樣本交給模型去學(xué)習(xí),學(xué)到推理關(guān)系,從而將完整駕駛策略拆分為自動(dòng)駕駛場(chǎng)景的動(dòng)態(tài)識(shí)別過程,完成可理解、可解釋的推理邏輯鏈生成。
除了用作認(rèn)知決策,DriveGPT 雪湖·海若還可以逐步應(yīng)用到城市 NOH、捷徑推薦、智能陪練以及脫困場(chǎng)景中。
有了 DriveGPT 雪湖·海若的加持,車輛行駛會(huì)更安全;動(dòng)作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動(dòng)作。
對(duì)于普通用戶來說,車輛越來越像老司機(jī),用戶對(duì)智能產(chǎn)品的信任感會(huì)更強(qiáng),理解到車輛的行為都是可預(yù)期、可理解的。
盡管 DriveGPT 雪湖·海若剛出世就擁有強(qiáng)大的功能,但這還不是它的「終局」,毫末對(duì)于 DriveGPT 雪湖·海若的目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛,后續(xù)毫末會(huì)持續(xù)將多個(gè)大模型的能力整合到 DriveGPT 雪湖·海若中。
與此同時(shí),毫末也對(duì)外構(gòu)建 DriveGPT 雪湖·海若生態(tài),通過對(duì)行業(yè)提供開放服務(wù),促進(jìn)自動(dòng)駕駛的從業(yè)者和研究機(jī)構(gòu),快速構(gòu)建基礎(chǔ)能力,釋放創(chuàng)新。
汽車之心獲知,毫末 DriveGPT 雪湖·海若首批定向邀請(qǐng)了北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等加入。
事實(shí)上,毫末對(duì)于大模型的開放從 DriveGPT 雪湖·海若的中文名「雪湖·海若」即可窺見。
據(jù)了解,「海若」一詞出自《莊子·秋水》中的神話人物北海若,在該書中,另一神話人物河伯請(qǐng)教北海若,何謂大小之分,北海若教導(dǎo)河伯說,不因天地而覺大,不因毫末而覺小。
毫末據(jù)此把 DriveGPT 中文名命名為「海若」,寓意著智慧包容、海納百川,為行業(yè)發(fā)展貢獻(xiàn)力量。
02、自動(dòng)駕駛生成式大模型「第一槍」,為何由毫末打響
自動(dòng)駕駛領(lǐng)域頂級(jí)玩家眾多,毫末憑何在全球首個(gè)推出了自動(dòng)駕駛生成式大模型 DriveGPT 雪湖·海若?
要回答這個(gè)問題,首先要理清楚毫末 DriveGPT 雪湖·海若的本質(zhì),它是應(yīng)用在智能駕駛上的人工智能,就必然離不開人工智能三要素:算法、數(shù)據(jù)和算力,而這三者恰恰是毫末具備領(lǐng)先性優(yōu)勢(shì)的地方。
首先在算法的技術(shù)路線上,毫末早早就堅(jiān)定選擇走漸進(jìn)式發(fā)展路線,比「躍進(jìn)式」玩家的量產(chǎn)時(shí)間更早,更快形成規(guī)?;?,從用戶真實(shí)使用場(chǎng)景中積累足夠多的數(shù)據(jù)。
毫末還清晰地提出了從自動(dòng)駕駛 1.0 時(shí)代到自動(dòng)駕駛 3.0 時(shí)代的演進(jìn)路徑,并率先進(jìn)入以數(shù)據(jù)驅(qū)動(dòng)為核心的新時(shí)代。
從這時(shí)開始,自動(dòng)駕駛獲取的數(shù)據(jù)量與數(shù)據(jù)多樣性將呈現(xiàn)指數(shù)級(jí)膨脹,在深度學(xué)習(xí)主導(dǎo)中,與大模型相輔相成,真正去解決自動(dòng)駕駛最后的長(zhǎng)尾難題。
在 2021 年 12 月第四屆 HAOMO AI DAY 上,毫末發(fā)布中國首個(gè)數(shù)據(jù)智能體系 MANA,其由四大板塊組成,分別是 TARS、LUCAS、VENUS 和 BASE。
其中,BASE 是整個(gè)系統(tǒng)架構(gòu)的底層,包括數(shù)據(jù)底座、數(shù)據(jù)融合、PoseidonOS 等。
其他三大板塊置于上層:
- TARS 代表毫末智行的開發(fā)的原型算法,包括感知、規(guī)劃決策、地圖定位、仿真引擎;LUCAS 是提取數(shù)據(jù)價(jià)值,以數(shù)據(jù)驅(qū)動(dòng)系統(tǒng)能力持續(xù)迭代的核心子系統(tǒng),解決場(chǎng)景泛化,評(píng)測(cè)和部署的問題;VENUS 則是數(shù)據(jù)看板,以參考標(biāo)準(zhǔn)評(píng)價(jià)算法的好壞。
<span style
【本文來自易車號(hào)作者汽車之心,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請(qǐng)聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
毫末發(fā)布自動(dòng)駕駛生成式大模型DriveGPT 中文名"雪湖·海若"
易車訊 日前,我們從官方渠道獲悉,在第八屆HAOMO AI DAY上,毫末智行發(fā)布自動(dòng)駕駛生成式大模型DriveGPT,中文名"雪湖·海若"。生態(tài)方面,毫末官宣取得3個(gè)主機(jī)廠定點(diǎn)合同,商業(yè)化迎來躍升一步;同時(shí)毫末推出的中國首個(gè)重感知、不依賴高精地圖的城市NOH即將量產(chǎn)上車,最先落地北京、上海、保定等城市。
毫末打造的自動(dòng)駕駛生成式大模型DriveGPT雪湖·海若通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題,終極目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛。
毫末DriveGPT雪湖·海若已開啟對(duì)限量首批生態(tài)伙伴的開放合作,北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等高校與企業(yè)加入。
產(chǎn)品方面,毫末中國首款可大規(guī)模量產(chǎn)落地、重感知城市NOH,將首批落地北京、保定、上海等城市,并開啟泛化測(cè)試,到2024年有序落地100城。首款搭載HPilot3.0的新摩卡DHT-PHEV即將重磅上市,這也是毫末DriveGPT雪湖·海若的首發(fā)落地車型,全面確保毫末城市NOH的行業(yè)領(lǐng)先性。
生態(tài)層面,毫末乘用車6P開放合作取得重大突破,已與3家主機(jī)廠簽署定點(diǎn)合同,相關(guān)項(xiàng)目正在交付中。這是毫末商業(yè)化的重要一躍,全面保障了毫末高速發(fā)展態(tài)勢(shì)。
毫末智行董事長(zhǎng)張凱判斷:“2023年智駕產(chǎn)品進(jìn)入全線爆發(fā)期,大模型開啟在車端的落地應(yīng)用,車主的使用頻率和滿意度成為產(chǎn)品競(jìng)爭(zhēng)力的重要衡量標(biāo)準(zhǔn)。毫末不斷進(jìn)步的數(shù)據(jù)驅(qū)動(dòng)的六大閉環(huán)能力將進(jìn)一步加速毫末進(jìn)入自動(dòng)駕駛3.0時(shí)代的步伐并形成相應(yīng)的護(hù)城河?!?span style="display:none">3uS創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司
張凱認(rèn)為,智駕產(chǎn)品正在進(jìn)入快速增長(zhǎng)的全線爆發(fā)期,2023年是非常關(guān)鍵的一年。首先,城市導(dǎo)航輔助駕駛產(chǎn)品在2023年將圍繞量產(chǎn)上車發(fā)力,主要玩家的城市導(dǎo)航輔助駕駛產(chǎn)品進(jìn)入到真實(shí)用戶覆蓋和多城市落地的比拼。其次,行泊一體和末端物流自動(dòng)配送產(chǎn)業(yè)商業(yè)化將成為自動(dòng)駕駛公司深耕的重點(diǎn)。在乘用車領(lǐng)域,搭載行泊一體功能的智駕產(chǎn)品將迎來前裝量產(chǎn)潮;在末端物流自動(dòng)配送領(lǐng)域,末端物流自動(dòng)配送車在商超、快遞等場(chǎng)景迎來爆發(fā),2023年將在這些場(chǎng)景實(shí)現(xiàn)可持續(xù)商業(yè)化閉環(huán)。
首款搭載HPilot3.0的新摩卡DHT-PHEV即將重磅上市,第二款搭載毫末HPilot3.0的車型魏牌藍(lán)山也將在今年發(fā)布。毫末HPilot整體已搭載近20款車型。用戶輔助駕駛行駛里程突破4000萬公里,HPilot2.0輔助駕駛?cè)站旭偫锍淌褂寐蔬_(dá)到了12.6%。海外布局方面,搭載毫末HPilot的車輛已運(yùn)往歐盟、以色列等地區(qū)和國家,陸續(xù)交付到用戶手中,接下來將在中東、南非、澳大利亞等市場(chǎng)陸續(xù)投放;同時(shí),毫末HPilot即將量產(chǎn)墨西哥版本及俄羅斯版本。
3月,高工智能汽車研究院在每個(gè)年度基于前裝量產(chǎn)數(shù)據(jù)庫及定點(diǎn)車型庫數(shù)據(jù)進(jìn)行綜合評(píng)估,通過對(duì)毫末前裝近20款車輛等數(shù)據(jù)研究,為毫末頒發(fā)年度高階智能駕駛系統(tǒng)量產(chǎn)份額領(lǐng)軍獎(jiǎng)。第三方數(shù)據(jù)佐證毫末是中國量產(chǎn)自動(dòng)駕駛絕對(duì)領(lǐng)軍者。
其次是“MANA大模型巔峰之戰(zhàn)”,中國首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系MANA架構(gòu)已迎來全線升級(jí)。到2023年4月,MANA學(xué)習(xí)時(shí)長(zhǎng)超56萬小時(shí),相當(dāng)于人類司機(jī)6.8萬年。毫末DriveGPT雪湖·海若,已經(jīng)完成基于4000萬公里駕駛數(shù)據(jù)的訓(xùn)練,參數(shù)規(guī)模達(dá)1200億。
第三是“城市NOH百城大戰(zhàn)”,中國首款可大規(guī)模量產(chǎn)落地、重感知城市NOH,已在北京、保定、上海等城市開啟泛化測(cè)試,即將量產(chǎn)上車,到2024年有序落地100城。毫末會(huì)以“安全為先、用戶為先、規(guī)模為先”的原則,加速贏得城市NOH百城大戰(zhàn)。
最后是“末端物流自動(dòng)配送商業(yè)之戰(zhàn)”,毫末末端物流自動(dòng)配送車小魔駝已在商超履約、智慧社區(qū)、校園配送、餐飲零售、機(jī)場(chǎng)巡邏、高校教育、快遞接駁、智慧園區(qū)、大氣環(huán)評(píng)等九大場(chǎng)景開啟運(yùn)營,加速商業(yè)化閉環(huán)能力。2023年3月,小魔駝2.0獲北京亦莊無人配送車車輛編碼,開啟亦莊運(yùn)營。毫末也成為《北京智能網(wǎng)聯(lián)汽車政策先行區(qū)無人配送測(cè)試規(guī)范》升級(jí)后,準(zhǔn)許在北京市高級(jí)別自動(dòng)駕駛示范區(qū)公開道路進(jìn)行無人配送車測(cè)試的首個(gè)公司。
“技術(shù)領(lǐng)先是生存根本,毫末鼓勵(lì)所有技術(shù)研發(fā)同學(xué)投入到技術(shù)創(chuàng)新當(dāng)中?!睆垊P在演講中再次強(qiáng)調(diào)了毫末對(duì)于技術(shù)研發(fā)投入的堅(jiān)定決心。截至目前,毫末已獲得專利證書164件,國際頂級(jí)學(xué)術(shù)會(huì)議論文收錄6篇,最新2篇更是分別入選計(jì)算機(jī)視覺識(shí)別領(lǐng)域三大頂會(huì)之一的CVPR和全球首個(gè)智能車專業(yè)期刊IEEE TIV。毫末已將所有論文在GitHub開源,與業(yè)內(nèi)共享。
現(xiàn)場(chǎng),張凱還向外界公布了毫末6P開放合作的重要進(jìn)展,目前已與3家主機(jī)廠簽署定點(diǎn)合同,相關(guān)項(xiàng)目正在交付中?!昂聊┦冀K認(rèn)為,自動(dòng)駕駛是一個(gè)共同進(jìn)退、共享成果的前沿產(chǎn)業(yè)。只有健康的生態(tài)伙伴才能支持毫末高速發(fā)展?!睆垊P表示。
此外,毫末一直堅(jiān)持場(chǎng)景化用戶體驗(yàn)設(shè)計(jì)、人工智能技術(shù)、技術(shù)工程化能力均衡發(fā)展,不斷以數(shù)據(jù)驅(qū)動(dòng)閉環(huán)的方式完善用戶體驗(yàn)。張凱介紹,三個(gè)月時(shí)間,毫末在數(shù)據(jù)驅(qū)動(dòng)六大閉環(huán)體系上實(shí)現(xiàn)多重進(jìn)展。
用戶需求閉環(huán)方面,毫末對(duì)駕駛場(chǎng)景數(shù)據(jù)持續(xù)分析完善策略,并進(jìn)行新功能體驗(yàn)反饋;研發(fā)效能閉環(huán)方面,毫末將數(shù)據(jù)驅(qū)動(dòng)理念深入到產(chǎn)品需求定義、感知與認(rèn)知算法開發(fā)等產(chǎn)品開發(fā)流程,整體開發(fā)效率提升30%;數(shù)據(jù)積累閉環(huán)方面,毫末在車端部署診斷服務(wù)數(shù)據(jù)場(chǎng)景標(biāo)簽覆蓋92%的駕駛場(chǎng)景。
數(shù)據(jù)價(jià)值閉環(huán)方面,毫末大模型正在持續(xù)挖掘數(shù)據(jù)價(jià)值解決關(guān)鍵問題;產(chǎn)品自完善閉環(huán)方面,毫末實(shí)現(xiàn)售后問題處理速度較傳統(tǒng)方式的十倍效率提升,實(shí)現(xiàn)最快10分鐘定位售后問題。兩年時(shí)間有效挖掘產(chǎn)品提升點(diǎn),問題閉環(huán)率達(dá)76%;業(yè)務(wù)工程化閉環(huán)方面,毫末進(jìn)一步完善了從采集回流、標(biāo)注訓(xùn)練、系統(tǒng)標(biāo)定、仿真驗(yàn)證等環(huán)節(jié)到最終OTA釋放環(huán)節(jié)的產(chǎn)品研發(fā)全流程工程化閉環(huán)。
毫末DriveGPT雪湖·海若通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。它的最終目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題,后續(xù)持續(xù)會(huì)將毫末多個(gè)大模型的能力整合到DriveGPT。目前,毫末DriveGPT雪湖·海若實(shí)現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級(jí),參數(shù)規(guī)模達(dá)到1200億,預(yù)訓(xùn)練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù),RLHF階段引入 5萬段人工精選的困難場(chǎng)景接管Clips。
DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,與ChatGPT使用自然語言進(jìn)行輸入與輸出不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場(chǎng)景文本序列,即將自動(dòng)駕駛場(chǎng)景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測(cè)以及決策邏輯鏈的輸出等任務(wù)。
DriveGPT雪湖·海若的實(shí)現(xiàn)過程是,首先在預(yù)訓(xùn)練階段通過引入量產(chǎn)駕駛數(shù)據(jù),訓(xùn)練初始模型,再通過引入駕駛接管Clips數(shù)據(jù)完成反饋模型(Reward Model)的訓(xùn)練,然后再通過強(qiáng)化學(xué)習(xí)的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對(duì)自動(dòng)駕駛認(rèn)知決策模型的持續(xù)優(yōu)化。同時(shí),DriveGPT雪湖·海若還會(huì)根據(jù)輸入端的提示語以及毫末CSS自動(dòng)駕駛場(chǎng)景庫的決策樣本去訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系,從而將完整駕駛策略拆分為自動(dòng)駕駛場(chǎng)景的動(dòng)態(tài)識(shí)別過程,完成可理解、可解釋的推理邏輯鏈生成。
現(xiàn)場(chǎng),毫末宣布DriveGPT雪湖·海若首發(fā)車型是新摩卡DHT-PHEV,即將量產(chǎn)上市。顧維灝提到,DriveGPT雪湖·海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場(chǎng)景中。有了DriveGPT雪湖·海若的加持,車輛行駛會(huì)更安全;動(dòng)作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動(dòng)作。對(duì)于普通用戶來說,車輛越來越像老司機(jī),用戶對(duì)智能產(chǎn)品的信任感會(huì)更強(qiáng),理解到車輛的行為都是可預(yù)期、可理解的。
毫末DriveGPT雪湖·海若將攜手生態(tài)伙伴率先探索四大應(yīng)用能力,包括智能駕駛、駕駛場(chǎng)景識(shí)別、駕駛行為驗(yàn)證、困難場(chǎng)景脫困。當(dāng)前,毫末在使用數(shù)據(jù)過程中,逐步建立起一套基于4D Clips駕駛場(chǎng)景識(shí)別方案,具備極高性價(jià)比。在行業(yè)上,給出正確的標(biāo)注結(jié)果,一張圖片需要約5元;如果使用DriveGPT雪湖·海若的場(chǎng)景識(shí)別服務(wù),一張圖片的價(jià)格將下降到0.5元。單幀圖片整體標(biāo)注成本僅相當(dāng)于行業(yè)的1/10。接下來,毫末會(huì)將圖像幀及4D Clips場(chǎng)景識(shí)別服務(wù)逐步向行業(yè)開放使用,這將大幅降低行業(yè)使用數(shù)據(jù)的成本,提高數(shù)據(jù)質(zhì)量,從而加速自動(dòng)駕駛技術(shù)的快速發(fā)展。
顧維灝介紹,毫末在2023年1月發(fā)布的中國自動(dòng)駕駛行業(yè)最大的智算中心MANA OASIS(雪湖· 綠洲)此次從算力優(yōu)化等層面升級(jí)了三大能力,進(jìn)一步支持DriveGPT雪湖·海若的算力。首先,毫末與火山引擎全新搭建了“全套大模型訓(xùn)練保障框架”,實(shí)現(xiàn)了異常任務(wù)分鐘級(jí)捕獲和恢復(fù)能力,可以保證千卡任務(wù)連續(xù)訓(xùn)練數(shù)個(gè)月沒有任何非正常中斷,有效保證了大模型訓(xùn)練穩(wěn)定性;其次,毫末研發(fā)出以真實(shí)數(shù)據(jù)回傳為核心的增量學(xué)習(xí)技術(shù),并將其推廣到了大模型訓(xùn)練,構(gòu)建了一個(gè)大模型持續(xù)學(xué)習(xí)系統(tǒng),自主研發(fā)任務(wù)級(jí)彈性伸縮調(diào)度器,分鐘級(jí)調(diào)度資源,集群計(jì)算資源利用率達(dá)到95%;最后,MANA OASIS通過提升數(shù)據(jù)吞吐量來降本增效,滿足Transformer大模型訓(xùn)練效率,通過引入火山引擎提供的Lego算子庫實(shí)現(xiàn)算子融合,端到端吞吐提升84%。
毫末打造的中國首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系MANA,在經(jīng)過一年多的應(yīng)用迭代后,本次AI DAY也迎來了全面的升級(jí),正式開放賦能。顧維灝介紹,MANA計(jì)算基礎(chǔ)服務(wù)針對(duì)大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項(xiàng)優(yōu)化,并集成到OASIS中;其次,MANA感知和認(rèn)知相關(guān)大模型能力統(tǒng)一整合到DriveGPT雪湖·海若中;第三,增加了使用NeRF技術(shù)的數(shù)據(jù)合成服務(wù),降低Corner Case數(shù)據(jù)的獲取成本;同時(shí)針對(duì)多種芯片和多種車型的快速交付難題優(yōu)化了異構(gòu)部署工具和車型適配工具。
此外,MANA的視覺感知能力持續(xù)提升,一方面可同時(shí)學(xué)習(xí)三維空間結(jié)構(gòu)和圖片紋理,并將純視覺測(cè)距精度超過了超聲波雷達(dá),BEV方案也擁有了更強(qiáng)的通用性和適配性;另一方面可實(shí)現(xiàn)單趟和多趟純視覺NeRF三維重建,道路場(chǎng)景更逼真,肉眼幾乎看不出差異。通過NeRF進(jìn)行場(chǎng)景重建后,可以編輯合成真實(shí)環(huán)境難以收集到的Corner Case。在原有的全局視角修改、添加光照/天氣效果的基礎(chǔ)上,新增合成虛擬動(dòng)態(tài)物體的能力,可以在原有設(shè)定的運(yùn)動(dòng)軌跡上,合成各種Hard Case,模擬城市復(fù)雜交通環(huán)境,用更低成本測(cè)試提升城市NOH能力邊界,更好提升應(yīng)對(duì)城市復(fù)雜交通環(huán)境。
值得一提的是,面對(duì)目前行業(yè)里最難的視覺任務(wù)之一——單目視覺測(cè)量,繼特斯拉后,毫末也在中國率先開始驗(yàn)證能否使用魚眼相機(jī)代替超聲波雷達(dá)進(jìn)行測(cè)距,以滿足泊車要求。毫末把視覺BEV感知框架引入到了車端魚眼相機(jī),做到了在15米范圍內(nèi)達(dá)到30cm的測(cè)量精度,2米內(nèi)精度高于10cm的視覺精度效果。泊車場(chǎng)景使用純視覺測(cè)距來取代超聲波雷達(dá),將進(jìn)一步降低整體智駕成本。
易車超級(jí)評(píng)測(cè)體系重磅上線!專業(yè)、硬核、全面的汽車評(píng)測(cè)內(nèi)容云集,易車年度車型榜單新鮮出爐!上易車App搜索“超級(jí)評(píng)測(cè)”,等你來看!
HAOMO發(fā)布自動(dòng)駕駛生成式大模型DriveGPT
【TechWeb汽車】4月12日消息,在HAOMO AI DAY上,HAOMO發(fā)布業(yè)內(nèi)首個(gè)自動(dòng)駕駛生成式大模型DriveGPT,中文名“雪湖•海若”,毫末智行CEO顧維灝表示,DriveGPT將重塑汽車智能化技術(shù)路線。據(jù)介紹,DriveGPT雪湖•海若首發(fā)車型是新摩卡DHT-PHEV,即將量產(chǎn)上市。
毫末智行董事長(zhǎng)張凱表示:“2023年智駕產(chǎn)品進(jìn)入全線爆發(fā)期,大模型開啟在車端的落地應(yīng)用,車主的使用頻率和滿意度成為產(chǎn)品競(jìng)爭(zhēng)力的重要衡量標(biāo)準(zhǔn)?!?span style="display:none">3uS創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計(jì)、營銷策劃公司
顧維灝介紹,DriveGPT通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題,終極目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛。
目前,毫末DriveGPT雪湖•海若實(shí)現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級(jí),參數(shù)規(guī)模達(dá)到1200億,預(yù)訓(xùn)練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù),RLHF階段引入 5萬段人工精選的困難場(chǎng)景接管Clips。
DriveGPT雪湖•海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,與ChatGPT使用自然語言進(jìn)行輸入與輸出不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場(chǎng)景文本序列,即將自動(dòng)駕駛場(chǎng)景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測(cè)以及決策邏輯鏈的輸出等任務(wù)。
顧維灝進(jìn)一步闡釋,DriveGPT雪湖•海若具有三個(gè)能力:
1. DriveGPT雪湖•海若可以按概率生成很多個(gè)場(chǎng)景序列,每個(gè)場(chǎng)景都是一個(gè)全局的場(chǎng)景,每個(gè)場(chǎng)景序列都是未來有可能發(fā)生的一種實(shí)際情況;
2.在所有場(chǎng)景序列都產(chǎn)生的情況下,DriveGPT雪湖•海若能把場(chǎng)景中最受關(guān)注的自車行為軌跡量化出來,也就是生成場(chǎng)景的同時(shí),會(huì)產(chǎn)生自車未來的軌跡信息;
3. 有了自車未來的軌跡信息之后,希望這條軌跡是可解釋的,而GPT模型最擅長(zhǎng)的領(lǐng)域便是對(duì)話和推理,DriveGPT雪湖•海若也很好地繼承了這種特性,在生成場(chǎng)景序列、軌跡的同時(shí),也會(huì)把整個(gè)決策邏輯鏈給輸出。
顧維灝介紹,毫末在2023年1月發(fā)布的中國自動(dòng)駕駛行業(yè)最大的智算中心MANA OASIS(雪湖• 綠洲)此次從算力優(yōu)化等層面升級(jí)了三大能力,進(jìn)一步支持DriveGPT雪湖•海若的算力。
首先,毫末與火山引擎全新搭建了“全套大模型訓(xùn)練保障框架”,實(shí)現(xiàn)了異常任務(wù)分鐘級(jí)捕獲和恢復(fù)能力,可以保證千卡任務(wù)連續(xù)訓(xùn)練數(shù)個(gè)月沒有任何非正常中斷,有效保證了大模型訓(xùn)練穩(wěn)定性;
其次,毫末研發(fā)出以真實(shí)數(shù)據(jù)回傳為核心的增量學(xué)習(xí)技術(shù),并將其推廣到了大模型訓(xùn)練,構(gòu)建了一個(gè)大模型持續(xù)學(xué)習(xí)系統(tǒng),自主研發(fā)任務(wù)級(jí)彈性伸縮調(diào)度器,分鐘級(jí)調(diào)度資源,集群計(jì)算資源利用率達(dá)到95%;
最后,MANA OASIS通過提升數(shù)據(jù)吞吐量來降本增效,滿足Transformer大模型訓(xùn)練效率,通過引入火山引擎提供的Lego算子庫實(shí)現(xiàn)算子融合,端到端吞吐提升84%。
談到DriveGPT雪湖•海若的實(shí)現(xiàn)過程,顧維灝介紹稱,首先在預(yù)訓(xùn)練階段通過引入量產(chǎn)駕駛數(shù)據(jù),訓(xùn)練初始模型,再通過引入駕駛接管Clips數(shù)據(jù)完成反饋模型(Reward Model)的訓(xùn)練,然后再通過強(qiáng)化學(xué)習(xí)的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對(duì)自動(dòng)駕駛認(rèn)知決策模型的持續(xù)優(yōu)化。
DriveGPT雪湖•海若的一個(gè)關(guān)鍵設(shè)計(jì),就是場(chǎng)景的Token化表達(dá),顧維灝把這種方式叫做Drive Language。
同時(shí),DriveGPT雪湖•海若還會(huì)根據(jù)Drive Language輸入端的提示語以及毫末CSS自動(dòng)駕駛場(chǎng)景庫的決策樣本去訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系,從而將完整駕駛策略拆分為自動(dòng)駕駛場(chǎng)景的動(dòng)態(tài)識(shí)別過程,完成可理解、可解釋的推理邏輯鏈生成。
另外,顧維灝提到,DriveGPT雪湖•海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場(chǎng)景中。有了DriveGPT雪湖•海若的加持,車輛行駛會(huì)更安全;動(dòng)作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動(dòng)作。對(duì)于普通用戶來說,車輛越來越像老司機(jī),用戶對(duì)智能產(chǎn)品的信任感會(huì)更強(qiáng),理解到車輛的行為都是可預(yù)期、可理解的。
當(dāng)前,毫末在使用數(shù)據(jù)過程中,逐步建立起一套基于4D Clips駕駛場(chǎng)景識(shí)別方案,具備極高性價(jià)比。在行業(yè)上,給出正確的標(biāo)注結(jié)果,一張圖片需要約5元;如果使用DriveGPT雪湖•海若的場(chǎng)景識(shí)別服務(wù),一張圖片的價(jià)格將下降到0.5元。單幀圖片整體標(biāo)注成本僅相當(dāng)于行業(yè)的1/10。接下來,毫末會(huì)將圖像幀及4D Clips場(chǎng)景識(shí)別服務(wù)逐步向行業(yè)開放使用,這將大幅降低行業(yè)使用數(shù)據(jù)的成本,提高數(shù)據(jù)質(zhì)量,從而加速自動(dòng)駕駛技術(shù)的快速發(fā)展。
目前,毫末DriveGPT雪湖•海若已正式對(duì)外開放,開啟對(duì)限量首批客戶的合作,北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等已經(jīng)加入。毫末DriveGPT雪湖•海若大模型的成果將首發(fā)落地在搭載毫末HPilot3.0的新摩卡DHT-PHEV上。
顧維灝表示,毫末DriveGPT雪湖•海若將攜手生態(tài)伙伴率先探索四大應(yīng)用能力,包括智能駕駛、駕駛場(chǎng)景識(shí)別、駕駛行為驗(yàn)證、困難場(chǎng)景脫困。
【本文來自易車號(hào)作者TechWeb,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請(qǐng)聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
以上就是關(guān)于GPT大模型將發(fā)布相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
萬源品牌VI全案設(shè)計(jì)公司哪家好(萬源品牌vi全案設(shè)計(jì)公司哪家好)
高端logo設(shè)計(jì)(高端logo設(shè)計(jì)圖片)