-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 營銷推廣 > 專題列表 > 正文
- 「大模型+大算力」加持,通用人工智能和智能駕駛雙向奔赴
- 當(dāng)GPT遇到自動駕駛,毫末首發(fā)DriveGPT
- 吉普提的算力核心由什么構(gòu)成
- DriveGPT落地后,卷激光雷達(dá)和算力會變得毫無意義?
gpt算力(gpt算力需求)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于gpt算力的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器
問友Ai官網(wǎng):https://ai.de1919.com。
本文目錄:
「大模型+大算力」加持,通用人工智能和智能駕駛雙向奔赴
開年以來 ChatGPT、GPT-4 的相繼面世再度掀起計(jì)算機(jī)科學(xué)領(lǐng)域通用人工智能(AGI)研究熱潮,也不斷刷新我們對 AI 的認(rèn)知。
作為具有人類水平表現(xiàn)的大型多模態(tài)模型,GPT-4 被視為邁向 AGI 的重要一步,標(biāo)志著創(chuàng)新范式的深度變革和生產(chǎn)力的重新定義,也必將帶來更多元的產(chǎn)品遷移。
截至目前,全球已經(jīng)有超百萬家初創(chuàng)公司聲稱使用這一秘密武器來創(chuàng)造新產(chǎn)品,而這些產(chǎn)品將徹底改變從法律到股票交易,從游戲到醫(yī)療診斷的近乎一切領(lǐng)域。
盡管其中很多是營銷泡沫,但與所有技術(shù)突破一樣,總會存在炒作周期和意想不到的遠(yuǎn)期效果。
事實(shí)上在另一邊,進(jìn)入 2023 年智能汽車領(lǐng)域同樣十分熱鬧。
智能化已然成為上海車展全場關(guān)注的最大焦點(diǎn),除了激光雷達(dá)等關(guān)鍵傳感器的單點(diǎn)式突破,各大巨頭也紛紛展示智能駕駛?cè)a(chǎn)品矩陣,城市場景輔助駕駛量產(chǎn)落地加速推進(jìn)。
更加值得注意的是,BEV、大模型、超算中心等計(jì)算機(jī)熱詞正在與自動駕駛、行泊一體、城市 NOA 等智駕焦點(diǎn)火速排列組合,頗有相互交融、雙向奔赴的味道。
在這背后,一方面是近年來智駕、智艙持續(xù)升級對 AI 在汽車場景落地的數(shù)據(jù)、算法、算力不斷提出更高要求,另一方面,AGI 的重大突破也已將觸角伸向智能汽車,將其視為實(shí)現(xiàn)閉環(huán)應(yīng)用的重要場景,很多企業(yè)布局已經(jīng)相當(dāng)高調(diào)。
日前,商湯科技 SenseTime 舉辦技術(shù)交流日活動,分享了以「大模型+大算力」推進(jìn) AGI 發(fā)展的戰(zhàn)略布局,并公布該戰(zhàn)略下的「日日新 SenseNova」大模型體系。
在「大模型+大算力」加持下,本次上海車展商湯絕影駕、艙、云一體產(chǎn)品體系已全棧亮相,近 30 款合作量產(chǎn)車型集中展出,商湯也再度分享了智能汽車時(shí)代的 AGI 落地新思考。
本次上海車展亮相的部分絕影合作車型展示
01、算法:AI 正式步入大模型時(shí)代
如商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、絕影智能汽車事業(yè)群總裁王曉剛所言,「AGI 催生了新的研究范式,即基于一個強(qiáng)大的多模態(tài)基模型,通過強(qiáng)化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務(wù)。」
通用大模型并非為自動駕駛而生,或?yàn)闈M足自動駕駛的特定任務(wù)需求而設(shè)計(jì)。但智能駕駛開發(fā)的諸多新需求已在推動算法從專用小模型向通用大模型快速演進(jìn)。
首先是應(yīng)對海量數(shù)據(jù)處理和 Corner Case 問題的迫切需求。
對于感知系統(tǒng)低頻出現(xiàn)但至關(guān)重要的小目標(biāo)及帶來的潛在安全隱患,算法開發(fā)需要面對海量數(shù)據(jù),傳統(tǒng)的 AI 小模型將難以同時(shí)處理大數(shù)據(jù)量和高復(fù)雜度的任務(wù)。通用大模型則可用在長尾目標(biāo)的初篩過程,并疊加語料文字處理得到很好的效果。
再比如智駕算法開發(fā)對自動化數(shù)據(jù)標(biāo)注、降低人工成本的訴求。相比于人工標(biāo)注,通用大模型將自動化對海量數(shù)據(jù)完成標(biāo)注任務(wù),大幅降低標(biāo)注數(shù)據(jù)獲取的時(shí)間成本和本身的金錢成本,從而縮短研發(fā)周期、提升成本效益。
處于類似的考量,近年來國內(nèi)外巨頭企業(yè)已圍繞大模型紛紛展開各自智駕布局。
繼 Google 于 2017 年提出將 Transformer 結(jié)構(gòu)應(yīng)用在 CV 領(lǐng)域圖像分類,大模型已在 GPT-2、GPT-3、BERT 等當(dāng)中不斷證明實(shí)力,特斯拉率先站臺 Transformer 大模型征戰(zhàn)圖像視覺。
國內(nèi)企業(yè)也緊隨其后:
毫末智行已宣布自動駕駛認(rèn)知大模型正式升級為 DriveGPT,百度表示利用大模型來提升自動駕駛感知能力并將大模型運(yùn)用到數(shù)據(jù)挖掘,華為也已宣布加入大模型爭霸賽,自研「盤古」即將對外上線。
作為行業(yè)領(lǐng)先的人工智能公司,商湯在大模型領(lǐng)域可謂乘風(fēng)破浪,過去一兩年則全面將大模型能力在各業(yè)務(wù)線 20 多個場景落地,包括智能駕駛。
商湯「日日新 SenseNova」大模型體系背后是大模型研發(fā)中深厚的積累。商湯有自己的全棧大模型研發(fā)體系,其中就包括針對大模型的底層訓(xùn)練及實(shí)施過程中的各種系統(tǒng)性優(yōu)化。
例如,商湯近期向社區(qū)發(fā)布的用于真實(shí)感知、重建和生成的多模態(tài)的數(shù)據(jù)集 OmniObject3D 中包含 190 類 6000 個物體,數(shù)據(jù)質(zhì)量非常高。
再比如,商湯在 2019 年就已首次發(fā)布 10 億參數(shù)的視覺大模型,到 2022 年參數(shù)規(guī)模已達(dá)到 320 億,這也是世界上迄今為止最大的視覺模型。
此外,商湯也在智駕領(lǐng)域持續(xù)展示大模型能力。2021 年開發(fā)的 BEV 感知算法在 Waymo 挑戰(zhàn)賽以絕對優(yōu)勢取得冠軍,2021 年 BEV Former 的 Transformer 結(jié)構(gòu)至今仍是行業(yè)最有影響力的 BEV 工作,今年開發(fā)的 UniAD 是業(yè)內(nèi)首個感知決策一體化的端到端自動駕駛解決方案。
在技術(shù)實(shí)力的另一端是量產(chǎn)進(jìn)度。商湯也給出了自己的智能駕駛量產(chǎn)公式:
自動駕駛技術(shù)能力=場景數(shù)據(jù) x 數(shù)據(jù)獲取效率 x 數(shù)據(jù)利用效率² =場景數(shù)據(jù) x 數(shù)據(jù)獲取效率 x 先進(jìn)算法 x 先進(jìn)算力。
而先進(jìn)的算法大模型不僅將通過跨行業(yè)數(shù)據(jù)匯聚提升駕駛場景數(shù)據(jù)資源,通過數(shù)據(jù)閉環(huán)開發(fā)模式和自動數(shù)據(jù)標(biāo)注提升數(shù)據(jù)獲取效率,更將大幅提升感知精度和感知豐富度進(jìn)而成倍提升數(shù)據(jù)利用效率。
依托原創(chuàng) AI 算法和模型積累,商湯領(lǐng)先的 BEV 感知算法推進(jìn)國內(nèi)首批量產(chǎn)應(yīng)用,并采用 Domain Adaption 算法有效解決跨域泛化問題。商湯首創(chuàng)的自動駕駛 GOP 感知體系將目標(biāo)數(shù)據(jù)獲取的人力成本降低 94%,實(shí)現(xiàn)低成本的車端模型開發(fā),目前也已投入量產(chǎn)應(yīng)用。
02、算力:智能汽車時(shí)代的重要基礎(chǔ)設(shè)施
隨電子電氣架構(gòu)技術(shù)由分布式不斷向集中式演進(jìn),大算力芯片成為新型電子電氣架構(gòu)實(shí)現(xiàn)的物理基礎(chǔ)。
近年來車端芯片算力發(fā)展突飛猛進(jìn),如英偉達(dá)規(guī)劃中的 Atlan 單顆芯片算力超 1000TOPS,THOR 單顆算力超 2000TOPS,將大幅提升單車感知決策能力。
而在云端,AGI 在自動駕駛、網(wǎng)聯(lián)等場景的泛化應(yīng)用將提出比車端指數(shù)級更高的算力要求——從數(shù)據(jù)標(biāo)注到模型訓(xùn)練,從場景仿真到算法迭代。
算力將是智能汽車時(shí)代的新型基礎(chǔ)設(shè)施。
在此背景下,近年來主流企業(yè)紛紛開啟雙線并行探索,車端自研算力平臺,云端建立超算中心。而進(jìn)入大模型時(shí)代后,數(shù)據(jù)量隨著多模態(tài)的引入也將大規(guī)模增長,因此必然也會導(dǎo)致 AGI 對算力需求的劇增。
可以看到,英偉達(dá)車端云端同步布局并將提供端到端的全棧式 AI 加速計(jì)算解決方案,特斯拉也早在 2021 年 8 月發(fā)布自研云端超算中心 Dojo。
據(jù)近期報(bào)道,埃隆·馬斯克也將成立一家人工智能公司來與 OpenAI 競爭,已購買數(shù)千個英偉達(dá) GPU 并一直招募 AI 研究人員和工程師。
國內(nèi)方面,吉利、蔚來、特斯拉、毫末智行、小鵬等企業(yè)也已跟進(jìn)布局云端算力集群,投入巨大以提升智駕開發(fā)算力儲備。
對于商湯來說,如果說大模型將是支撐智能駕駛的上層建筑,那么大算力就是數(shù)字基座。
商湯科技董事長兼 CEO 徐立表示,目前大模型對基礎(chǔ)算力、基礎(chǔ)設(shè)施的需求非常旺盛,基礎(chǔ)算力對并行效率的要求也非常高,但真正好用的基礎(chǔ)設(shè)施其實(shí)十分稀缺。
出于這一原因,商湯歷時(shí)五年自建了業(yè)界領(lǐng)先的 AI 大裝置 SenseCore,完成 2.7 萬塊 GPU 的部署并實(shí)現(xiàn) 5.0 exa FLOPS 的算力輸出能力,是亞洲目前最大的智能計(jì)算平臺之一,可同步支持 20 個千億規(guī)模參數(shù)量的超大模型同時(shí)訓(xùn)練。
位于上海臨港的 AIDC 人工智能計(jì)算中心將為智能汽車的數(shù)據(jù)存儲、標(biāo)注、脫敏、仿真訓(xùn)練、算法迭代到部署的閉環(huán)提供算力支持,打通基于數(shù)據(jù)驅(qū)動的算法生產(chǎn)全流程,加速高級別智能駕駛技術(shù)的 AI 模型生產(chǎn)和持續(xù)迭代,推動實(shí)現(xiàn)規(guī)模化量產(chǎn)。
在 AIDC 的基礎(chǔ)上,AI 大裝置也將提供支持大模型生產(chǎn)的一系列服務(wù):
- 處理大模型需要的自動化數(shù)據(jù)標(biāo)注,將使智能標(biāo)注效率提升百倍;大模型推理部署,使得推理效率提升 100% 以上;大模型并行訓(xùn)練,最大 4000 塊卡并聯(lián)的單集群,可訓(xùn)練參數(shù)量超 5000 億的稠密模型,可訓(xùn)練超萬億參數(shù);大模型增量訓(xùn)練,增量微調(diào)成本降低 90%;開源模型和大模型訓(xùn)練開發(fā)者工具,大規(guī)模提升開發(fā)效率。
如此規(guī)模的算力設(shè)施即使特斯拉同期也尚難以望其項(xiàng)背,也必將推動大模型的高效閉環(huán)。
03、「大模型+大算力」推動智能汽車行業(yè)整體進(jìn)程
汽車行業(yè)正在面臨百年未有之大變革。盡管此次以「大模型+大算力」推進(jìn) AGI 發(fā)展是商湯提出的戰(zhàn)略布局,但事實(shí)上,這一理念早已在行業(yè)層面達(dá)成共識。
基于感知、決策規(guī)控和 AI 云三大核心能力,商湯「大模型+大算力」已賦能絕影駕、艙、云三位一體產(chǎn)品體系量產(chǎn)落地:
除智能駕駛領(lǐng)域的全棧能力和行泊一體量產(chǎn)解決方案外,「大模型+大算力」也正在助力商湯打造智能座艙跨場景生態(tài)。
車展期間,與商湯「日日新 SenseNova」大模型體系深度融合的絕影未來展示艙升級亮相,語言大模型「商湯商量 SenseChat」以及 AIGC 文生圖平臺「商湯秒畫 SenseMirage」也已上車,多點(diǎn)融合重構(gòu)人車交互方式,打造第三空間。
以「商量」為例,作為千億級參數(shù)的自然語言處理模型,其使用大量數(shù)據(jù)訓(xùn)練并充分考慮中文語境,展示出出色的多輪對話和超長文本的理解能力。
商湯也展示了語言大模型支持的諸多汽車場景創(chuàng)新應(yīng)用,如在行車過程中化身「郵件助手」自動提煉關(guān)鍵信息,作為「會議助理」自動生成會議紀(jì)要,大大節(jié)省用戶行車時(shí)處理工作的時(shí)間和精力,為未來出行的應(yīng)用場景拓展帶來豐富的想象空間。
此外,以人工智能大模型開發(fā)、生產(chǎn)、應(yīng)用為核心,一站式
【本文來自易車號作者汽車之心,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
當(dāng)GPT遇到自動駕駛,毫末首發(fā)DriveGPT
GPT之于自動駕駛意味著什么?
文丨智駕網(wǎng) 黃華丹
ChatGPT帶火了AI,那么,當(dāng)GPT遇到自動駕駛,又會發(fā)生怎樣的化學(xué)反應(yīng)?
GPT全稱Generative Pre-trained Transformer,即生成式預(yù)訓(xùn)練Transformer。簡單概括即是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型。
4月11日,在第八屆毫末AI DAY上,毫末CEO顧維灝正式發(fā)布了基于GPT技術(shù)的DriveGPT,中文名雪湖·海若。
DriveGPT能做到什么?又是如何構(gòu)建的?顧維灝在AI DAY上都做了詳細(xì)解讀。此外,AI DAY還展示了毫末自動駕駛數(shù)據(jù)體系MANA的升級情況,主要是其在視覺感知能力上的進(jìn)展。
01.
什么是DriveGPT?能實(shí)現(xiàn)什么?
顧維灝首先講解了GPT的原理,生成式預(yù)訓(xùn)練Transformer模型本質(zhì)上是在求解下一個詞出現(xiàn)的概率,每一次調(diào)用都是從概率分布中抽樣并生成一個詞,這樣不斷地循環(huán),就能生成一連串的字符,用于各種下游任務(wù)。
以中文自然語言為例,單字或單詞就是Token,中文的Token詞表有5萬個左右。把Token輸入到模型,輸出就是下一個字詞的概率,這種概率分布體現(xiàn)的是語言中的知識和邏輯,大模型在輸出下一個字詞時(shí)就是根據(jù)語言知識和邏輯進(jìn)行推理的結(jié)果,就像根據(jù)一部偵探小說的復(fù)雜線索來推理兇手是誰。
而作為適用于自動駕駛訓(xùn)練的大模型,DriveGPT雪湖·海若三個能力:
1.可以按概率生成很多個這樣的場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發(fā)生的一種實(shí)際情況。
2.是在所有場景序列都產(chǎn)生的情況下,能把場景中最關(guān)注的自車行為軌跡給量化出來,也就是生成場景的同時(shí),便會產(chǎn)生自車未來的軌跡信息。
3.有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場景序列、軌跡的同時(shí),輸出整個決策邏輯鏈。
也就是說,利用DriveGPT雪湖·海若,在一個統(tǒng)一的生成式框架下,就能做到將規(guī)劃、決策與推理等多個任務(wù)全部完成。
具體來看,DriveGPT雪湖·海若的設(shè)計(jì)是將場景Token化,毫末將其稱為Drive Language。
Drive Language將駕駛空間進(jìn)行離散化處理,每一個Token都表征場景的一小部分。目前毫末擁有50萬個左右的Token詞表空間。如果輸入一連串過去已經(jīng)發(fā)生的場景Token序列,模型就可以根據(jù)歷史,生成未來所有可能的場景。
也就是說,DriveGPT雪湖·海若同樣像是一部推理機(jī)器,告訴它過去發(fā)生了什么,它就能按概率推理出未來的多個可能。
一連串Token拼在一起就是一個完整的駕駛場景時(shí)間序列,包括了未來某個時(shí)刻整個交通環(huán)境的狀態(tài)以及自車的狀態(tài)。
有了Drive Language,就可以對DriveGPT進(jìn)行訓(xùn)練了。
毫末對DriveGPT的訓(xùn)練過程首先是根據(jù)駕駛數(shù)據(jù)以及之前定義的駕駛嘗試做一個大規(guī)模的預(yù)訓(xùn)練。
然后,通過在使用過程中接管或者不接管的場景,對預(yù)訓(xùn)練的結(jié)果進(jìn)行打分和排序,訓(xùn)練反饋模型。也就是說利用正確的人類開法來替代錯誤的自動駕駛開法。
后續(xù)就是用強(qiáng)化學(xué)習(xí)的思路不斷優(yōu)化迭代模型。
在預(yù)訓(xùn)練模型上,毫末采用Decode-only結(jié)構(gòu)的GPT模型,每一個Token用于描述某時(shí)刻的場景狀態(tài),包括障礙物的狀態(tài)、自車狀態(tài)、車道線情況等等。
目前,毫末的預(yù)訓(xùn)練模型擁有1200億個參數(shù),使用4000萬量產(chǎn)車的駕駛數(shù)據(jù),本身就能夠?qū)Ω鞣N場景做生成式任務(wù)。
這些生成結(jié)果會按照人類偏好進(jìn)行調(diào)優(yōu),在安全、高效、舒適等維度上做出取舍。同時(shí),毫末會用部分經(jīng)過篩選的人類接管數(shù)據(jù),大概5萬個Clips去做反饋模型的訓(xùn)練,不斷優(yōu)化預(yù)訓(xùn)練模型。
在輸出決策邏輯鏈時(shí),DriveGPT雪湖·海若利用了prompt提示語技術(shù)。輸入端給到模型一個提示,告訴它“要去哪、慢一點(diǎn)還是快一點(diǎn)、并且讓它一步步推理”,經(jīng)過這種提示后,它就會朝著期望的方向去生成結(jié)果,并且每個結(jié)果都帶有決策邏輯鏈。每個結(jié)果也會有未來出現(xiàn)的可能性。這樣我們就可以選擇未來出現(xiàn)可能性最大,最有邏輯的鏈條駕駛策略。
可以用一個形象的示例來解釋DriveGPT雪湖·海若的推理能力。假設(shè)提示模型要“抵達(dá)某個目標(biāo)點(diǎn)”,DriveGPT雪湖·海若會生成很多個可能的開法,有的激進(jìn),會連續(xù)變道超車,快速抵達(dá)目標(biāo)點(diǎn),有的穩(wěn)重,跟車行駛到終點(diǎn)。這時(shí)如果提示語里沒有其他額外指示,DriveGPT雪湖·海若就會按照反饋訓(xùn)練時(shí)的調(diào)優(yōu)效果,最終給到一個更符合大部分人駕駛偏好的效果。
02.
實(shí)現(xiàn)DriveGPT毫末做了什么?
首先,DriveGPT雪湖·海若的訓(xùn)練和落地,離不開算力的支持。
今年1月,毫末就和火山引擎共同發(fā)布了其自建智算中心,毫末雪湖·綠洲MANA OASIS。OASIS的算力高達(dá)67億億次/秒,存儲帶寬2T/秒,通信帶寬達(dá)到800G/秒。
當(dāng)然,光有算力還不夠,還需要訓(xùn)練和推理框架的支持。因此,毫末也做了以下三方面的升級。
一是訓(xùn)練穩(wěn)定性的保障和升級。
大模型訓(xùn)練是一個十分艱巨的任務(wù),隨著數(shù)據(jù)規(guī)模、集群規(guī)模、訓(xùn)練時(shí)間的數(shù)量級增長,系統(tǒng)穩(wěn)定性方面微小的問題也會被無限放大,如果不加處理,訓(xùn)練任務(wù)就會經(jīng)常出錯導(dǎo)致非正常中斷,浪費(fèi)前期投入的大量資源。
毫末在大模型訓(xùn)練框架的基礎(chǔ)上,與火山引擎共同建立了全套訓(xùn)練保障框架,通過訓(xùn)練保障框架,毫末實(shí)現(xiàn)了異常任務(wù)分鐘級捕獲和恢復(fù)能力,可以保證千卡任務(wù)連續(xù)訓(xùn)練數(shù)月沒有任何非正常中斷,有效地保障了DriveGPT雪湖·海若大模型訓(xùn)練的穩(wěn)定性。
二是彈性調(diào)度資源的升級。
毫末擁有量產(chǎn)車帶來的海量真實(shí)數(shù)據(jù),可自動化的利用回傳數(shù)據(jù)不斷的學(xué)習(xí)真實(shí)世界。由于每天不同時(shí)段回傳的數(shù)據(jù)量差異巨大,需要訓(xùn)練平臺具備彈性調(diào)度能力,自適應(yīng)數(shù)據(jù)規(guī)模大小。
毫末將增量學(xué)習(xí)技術(shù)推廣到大模型訓(xùn)練,構(gòu)建了一個大模型持續(xù)學(xué)習(xí)系統(tǒng),研發(fā)了任務(wù)級彈性伸縮調(diào)度器,分鐘級調(diào)度資源,集群計(jì)算資源利用率達(dá)到95%。
三是吞吐效率的升級。
在訓(xùn)練效率上,毫末在Transformer的大矩陣計(jì)算上,通過對內(nèi)外循環(huán)的數(shù)據(jù)拆分、盡量保持?jǐn)?shù)據(jù)在SRAM中來提升計(jì)算的效率。在傳統(tǒng)的訓(xùn)練框架中,算子流程很長,毫末通過引入火山引擎提供的Lego算之庫實(shí)現(xiàn)算子融合,使端到端吞吐提升84%。
有了算力和這三方面的升級,毫末可對DriveGPT雪湖·海若進(jìn)行更好的訓(xùn)練迭代升級。
03.
MANA大升級,攝像頭代替超聲波雷達(dá)
毫末在2021年12月的第四屆AI DAY上發(fā)布自動駕駛數(shù)據(jù)智能體系MANA,經(jīng)過一年多時(shí)間的應(yīng)用迭代,現(xiàn)在MANA迎來了全面的升級。
據(jù)顧維灝介紹,本次升級主要包括:
1.感知和認(rèn)知相關(guān)大模型能力統(tǒng)一整合到DriveGPT。
2.計(jì)算基礎(chǔ)服務(wù)針對大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項(xiàng)優(yōu)化,并集成到OASIS當(dāng)中。
3.增加了使用NeRF技術(shù)的數(shù)據(jù)合成服務(wù),降低Corner Case數(shù)據(jù)的獲取成本。
4.針對多種芯片和多種車型的快速交付難題,優(yōu)化了異構(gòu)部署工具和車型適配工具。
前文我們已經(jīng)詳細(xì)介紹了DriveGPT相關(guān)的內(nèi)容,以下主要來看MANA在視覺感知上的進(jìn)展。
顧維灝表示,視覺感知任務(wù)的核心目的都是恢復(fù)真實(shí)世界的動靜態(tài)信息和紋理分布。因此毫末對視覺自監(jiān)督大模型做了一次架構(gòu)升級,將預(yù)測環(huán)境的三維結(jié)構(gòu),速度場和紋理分布融合到一個訓(xùn)練目標(biāo)里面,使其能從容應(yīng)對各種具體任務(wù)。目前毫末視覺自監(jiān)督大模型的數(shù)據(jù)集超過400萬Clips,感知性能提升20%。
在泊車場景下,毫末做到了用魚眼相機(jī)純視覺測距達(dá)到泊車要求,可做到在15米范圍內(nèi)達(dá)測量精度30cm,2米內(nèi)精度高于10cm。用純視覺代替超聲波雷達(dá),進(jìn)一步降低整體方案的成本。
此外,在純視覺三維重建方面,通過視覺自監(jiān)督大模型技術(shù),毫末不依賴激光雷達(dá),就能將收集的大量量產(chǎn)回傳視頻轉(zhuǎn)化為可用于BEV模型訓(xùn)練的帶3D標(biāo)注的真值數(shù)據(jù)。
通過對NeRF的升級,毫末表示可以做到重建誤差小于10
【本文來自易車號作者智駕網(wǎng),版權(quán)歸作者所有,任何形式轉(zhuǎn)載請聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
吉普提的算力核心由什么構(gòu)成
吉普提的算力核心由深度神經(jīng)網(wǎng)絡(luò)構(gòu)成。吉普提(GPT)是由OpenAI開發(fā)的一種自然語言處理模型,它的算力核心是由深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetworks,DNN)構(gòu)成的。吉普提模型采用了基于Transformer架構(gòu)的神經(jīng)網(wǎng)絡(luò),其核心是由多層變壓器(Transformer)模塊組成的深度神經(jīng)網(wǎng)絡(luò)。每個變壓器模塊包括多頭自注意力機(jī)制、前饋神經(jīng)網(wǎng)絡(luò)等組件,用于對輸入文本進(jìn)行編碼和解碼,從而實(shí)現(xiàn)自然語言處理的各種任務(wù)。DriveGPT落地后,卷激光雷達(dá)和算力會變得毫無意義?
席卷自動駕駛行業(yè)的寒冬還沒有過去,開發(fā)周期長、成本高,又難落地的問題并沒有完全被解決,而大量的車企都在激進(jìn)的進(jìn)行電動化和智能化的轉(zhuǎn)型,自動駕駛的研發(fā)又是繞不開的重要一部分。
可是靠自動駕駛技術(shù)和故事去吸引消費(fèi)者的路線已經(jīng)逐漸走不通了,比亞迪王傳福也站出來炮轟自動駕駛,讓自動駕駛的寒意更濃了。
其實(shí)自動駕駛難落地的問題,對于誰都一樣,誰都繞不過去這個問題,但是車企和自動駕駛企業(yè)們可以在“開發(fā)周期和成本”方面開卷,因?yàn)樵诖蟓h(huán)境不利的情況下,誰能用更低的成本和更高的效率堅(jiān)持并維持住,才可能在春暖花開之時(shí)迎來綻放。
自動駕駛寒冬之下,靠AI真能降成本?在本周的在第八屆毫末AI DAY上,毫末智行發(fā)布了首個應(yīng)用GPT模型和技術(shù)邏輯的自動駕駛算法模型DriveGPT,并正式官宣中文名為“雪湖·海若”。DriveGPT首發(fā)車型是即將量產(chǎn)上市的全新摩卡DHT-PHEV,有了DriveGPT之后,自動駕駛開發(fā)中的周期和成本都會大幅縮短和降低。
目前的自動駕駛技術(shù)發(fā)展情況,主流的自動駕駛訓(xùn)練方式主要有兩種:真實(shí)道路測試和虛擬仿真測試。
真實(shí)道路測試最大的特點(diǎn)是能夠與真實(shí)交通環(huán)境相匹配,模擬真實(shí)生活中的各種復(fù)雜情況。同時(shí),真實(shí)道路測試還可以發(fā)現(xiàn)一些不常見或難以預(yù)測的情況,提高自動駕駛系統(tǒng)的適應(yīng)性和可靠性。然而,真實(shí)道路測試需要大量的時(shí)間和金錢投入,同時(shí)還涉及交通安全、法律法規(guī)以及人員傷害等問題,給測試過程帶來了一定的風(fēng)險(xiǎn)和壓力。這些都會導(dǎo)致測試成本的增加。
另一種方式就是虛擬仿真測試,它是在計(jì)算機(jī)模擬環(huán)境下測試自動駕駛系統(tǒng),通過虛擬場景來訓(xùn)練模型。虛擬仿真測試可以避免真實(shí)道路測試中的安全問題和成本壓力,同時(shí)還可以快速生成大量的數(shù)據(jù),提高測試效率和數(shù)據(jù)量,而且在其中已經(jīng)輔以了不少AI人工智能技術(shù)。
但是,虛擬仿真測試中的數(shù)據(jù)和場景是人為設(shè)計(jì)的,可能無法完全反映真實(shí)道路的復(fù)雜性和不確定性。因此,虛擬仿真測試有時(shí)需要進(jìn)行一定程度的真實(shí)道路測試來驗(yàn)證其結(jié)果。
DriveGPT采用了與ChatGPT一樣的Transformer模型與RLHF人類反饋學(xué)習(xí)能力,通過引入真實(shí)駕駛場景和人駕接管數(shù)據(jù),可對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,從而為自動駕駛開發(fā)降低成本。
由于DriveGPT是在虛擬仿真環(huán)境下進(jìn)行訓(xùn)練的,因此可以省去真實(shí)道路測試中的安全問題和成本壓力。DriveGPT能夠生成大量的仿真數(shù)據(jù)用于訓(xùn)練模型,這些數(shù)據(jù)能夠很好地模擬真實(shí)道路的復(fù)雜性和不確定性,從而保證模型的魯棒性和可靠性。同時(shí),在仿真環(huán)境下進(jìn)行訓(xùn)練還可以大大節(jié)約時(shí)間和成本。
15天就能完成1年的任務(wù)量,還能“賺外快”?與傳統(tǒng)的真實(shí)道路測試相比,DriveGPT能夠快速高效地獲取大量數(shù)據(jù)。DriveGPT的訓(xùn)練過程是完全自動化的,不受測試時(shí)間、環(huán)境等因素的影響,從而大大提高了測試效率和數(shù)據(jù)量。這不僅節(jié)約了訓(xùn)練時(shí)間,還可以提高模型的精度和魯棒性。
DriveGPT自身能區(qū)分駕駛場景和非駕駛場景,并可以理解駕駛環(huán)境,還可用于場景識別標(biāo)注任務(wù),比如標(biāo)注車道線、交通參與者、紅綠燈、路牌等細(xì)節(jié)信息,并且每張圖的識別優(yōu)化價(jià)格從約 5 元下降到 0.5 元,成本下降了近10倍,在OpenAI的GPT-4出來的時(shí)候,它的識圖能力引起了我們的高度關(guān)注,而與其底層類似的DriveGPT,已經(jīng)把這項(xiàng)能力用了起來。
AI自動識圖逐漸開始代替人工,人工標(biāo)注的效率和成本是繞不過的問題,機(jī)器不需要休息,也幾乎不會眼花,而自動標(biāo)注的成本僅是過去使用人工的十分之一不到,而且半個月就能完成人力一年的需求。
DriveGPT使用大量的仿真數(shù)據(jù)來訓(xùn)練模型,這些數(shù)據(jù)能夠很好地反映真實(shí)道路的復(fù)雜性和不確定性,DriveGPT它能夠更好地處理自然語言、圖像等多種數(shù)據(jù)類型,還可以去自行學(xué)習(xí),從而提高模型的復(fù)雜性和準(zhǔn)確性。
另外在產(chǎn)品迭代方面,DriveGPT能夠?yàn)樽詣玉{駛開發(fā)者提供快速有效的反饋,幫助它們更快地調(diào)試和優(yōu)化系統(tǒng),從而進(jìn)一步降低系統(tǒng)迭代方面的開發(fā)成本。
通過DriveGPT訓(xùn)練出來的模型可以轉(zhuǎn)移到真實(shí)道路測試中進(jìn)行驗(yàn)證,進(jìn)一步提高了系統(tǒng)的安全性和可靠性。DriveGPT訓(xùn)練出來的模型能夠很好地反映真實(shí)道路的復(fù)雜性和不確定性,從而在真實(shí)道路測試中能夠更快地適應(yīng)各種情況,DriveGPT還可以同時(shí)讓系統(tǒng)處于多個平行宇宙之中,也就是提前做好再一次遇到類似情況可能發(fā)生的各種駕駛情況,在預(yù)測人車軌跡能力上也得到了大幅提升。
DriveGPT的能力不只局限于自動駕駛領(lǐng)域內(nèi),我們看到毫末的合作伙伴還有北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、火山引擎、華為云、京東科技、高通、四維圖新、英特爾等,當(dāng)然這里面有很多是供應(yīng)商伙伴,但四維圖新這個伙伴,可能是DriveGPT要去賦能的另外一部分。
此次四維圖新也官宣表示:接入毫末DriveGPT雪湖·海若,可實(shí)現(xiàn)持續(xù)雙向賦能。借助DriveGPT雪湖·海若算法能力可提升地圖成圖自動化水平。DriveGPT對于圖像強(qiáng)大的理解能力,可以應(yīng)用于地圖測繪方面,DriveGPT可以使用AI大模型來進(jìn)行對物體的識別,特別是建筑物,具體來說,它可以通過大量的地圖數(shù)據(jù)和衛(wèi)星影像數(shù)據(jù)進(jìn)行訓(xùn)練,然后利用這些數(shù)據(jù)來識別、分類和標(biāo)注建筑物信息。同時(shí),由于DriveGPT使用的是AI技術(shù),因此其識別準(zhǔn)確率和效率都比傳統(tǒng)的人工測繪方法更高。
除了建筑物識別,DriveGPT還可以用于其他地圖測繪任務(wù),例如道路標(biāo)注、地形分析、地圖更新等,特別是隨著搭載DriveGPT的車型越來越多,它們甚至可以去試試生成鮮度比較高的高精地圖,雖然毫末打造的是重感知、輕地圖的系統(tǒng),DriveGPT也是為了去加深這一目的,但是高精地圖可以給到供應(yīng)商去做別的事情,并不是只有自動駕駛需要高精地圖。
總結(jié):與傳統(tǒng)的自動駕駛訓(xùn)練方式相比,DriveGPT能夠省去真實(shí)道路測試中的安全問題和成本壓力,同時(shí)能夠高效快速地獲取大量數(shù)據(jù)、精準(zhǔn)地反映真實(shí)道路的復(fù)雜性和不確定性、提供快速有效的反饋以及能夠轉(zhuǎn)移到真實(shí)道路測試中進(jìn)行驗(yàn)證等優(yōu)點(diǎn)。毫末接下來的輔助駕駛方案,可能會把軟硬件的成本卷得更低。
DriveGPT具有很大的應(yīng)用前景,雖然我們看到目前只看到了毫末智行入局GPT類自動駕駛,但其他車企和供應(yīng)商們肯定不會放過這個機(jī)會,AI技術(shù)大爆發(fā)的當(dāng)下,或許比DriveGPT更高階的自動駕駛訓(xùn)練方式也在來的路上。
而且隨著AI的全面接入,再靠堆硬件,比激光雷達(dá)數(shù)量、攝像頭像素和個數(shù)、算力芯片能力,可能不再是吃香的辦法,沒人愿意為能力低,而靠堆硬件帶來的高成本而買單。
【本文來自易車號作者路咖汽車,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
以上就是關(guān)于gpt算力相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
蘋果手機(jī)如何下載chatGpt(蘋果手機(jī)如何下載軟件)_1
萊西恒星學(xué)院是一所什么學(xué)校?。ㄈR西恒星學(xué)院是一所什么學(xué)校啊多少分)