在輔助駕駛的黃金三角——數(shù)據(jù)、算法、算力中,數(shù)據(jù)被普遍視為驅(qū)動大模型進(jìn)化的「燃料」。
然而,在數(shù)據(jù)驅(qū)動的這條主軸上,車企與供應(yīng)商似乎面臨著不同命運(yùn)。
車企憑借終端用戶的天然觸角,構(gòu)建起數(shù)據(jù)護(hù)城河:理想、奇瑞、吉利等車企近期都宣稱數(shù)據(jù)量達(dá)到了 1000 萬 Clips;小鵬更是把這一數(shù)字拉到了兩倍:2000 萬 Clips。
馬斯克認(rèn)為,對于端到端輔助駕駛,用 1000 萬個(gè) Clips 進(jìn)行訓(xùn)練,系統(tǒng)會有驚人表現(xiàn)。
這似乎意味著,車企憑借數(shù)據(jù)積累將更容易抵達(dá)大模型的升維奇點(diǎn)。而供應(yīng)商除非獲得車企信任,否則在 1000 萬 Clips 的數(shù)據(jù)積累上勢必要下更多功夫。
但數(shù)據(jù)驅(qū)動的競爭邏輯,從來不是單純的「以量取勝」。
地平線創(chuàng)始人兼 CEO 余凱一針見血指出,「AI 時(shí)代,99% 的用戶數(shù)據(jù)其實(shí)不值得學(xué)習(xí)」。
這條「反共識」觀點(diǎn)背后,是數(shù)據(jù)價(jià)值的深度重構(gòu)。
由此,在端到端架構(gòu)與生成式 AI 的沖擊下,數(shù)據(jù)戰(zhàn)爭的勝負(fù)手不再是「誰擁有更多燃料」,而是「誰能用 1% 的數(shù)據(jù)實(shí)現(xiàn) 100% 的效能躍遷」。
后端到端時(shí)代,有必要對數(shù)據(jù)課題重新審視了。
01、1000 萬 Clips 等于「職業(yè)老司機(jī)」
在明確 1000 萬 Clips 的意義之前,需要先明晰「Clip」的含義。
「Clip」通常指向一個(gè)特定時(shí)間段內(nèi)的多模態(tài)數(shù)據(jù)片段,這些數(shù)據(jù)由激光雷達(dá)、攝像頭、毫米波雷達(dá)等傳感器同時(shí)捕獲。
而這一概念通常與 4D 標(biāo)注技術(shù)密切相關(guān)。
所謂 4D 標(biāo)注,是在傳統(tǒng)三維空間坐標(biāo)之外,還加入了時(shí)間維度。對比以往的單幀 2D 框、3D 框標(biāo)注,4D 標(biāo)注除了要記錄當(dāng)前幀的車輛坐標(biāo),還要追溯前幾幀的運(yùn)動軌跡,因而能夠更加全面與準(zhǔn)確地描述物體在空間中的運(yùn)動情況。
一位業(yè)內(nèi)人士指出,Clip 指一段時(shí)間的視頻切片,時(shí)間取決于模型設(shè)計(jì),一般在 30 秒左右。
毫末智行認(rèn)為,4D Clips 的數(shù)據(jù)規(guī)模對比此前 2D、3D 數(shù)據(jù)標(biāo)記方式,達(dá)到了百倍級的驚人增長,是當(dāng)前價(jià)值最高的感知數(shù)據(jù)形態(tài)。
由此,1000 萬 Clips 模型,意味著其擁有 1000 萬個(gè)信息高密度的視頻切片,具備兩個(gè)維度的特點(diǎn)。
一是極端場景覆蓋率高。
數(shù)據(jù)包含難以處理的極限場景,例如高難度、連續(xù) S 彎的山路;180°發(fā)卡彎等大曲率彎道;通過岔路口并連續(xù)變道進(jìn)入轉(zhuǎn)彎車道場景等。
二是數(shù)據(jù)場景分布合理。
理想汽車將道路行駛中的場景,分為靜態(tài)場景和動態(tài)場景,靜態(tài)場景包含城市主干道、國省道、輔路等,動態(tài)場景包含繞行、變道等。在系統(tǒng)訓(xùn)練過程中,按照靜態(tài)和動態(tài)兩類場景進(jìn)行篩選,將不同復(fù)雜程度的場景均涵蓋其中,使得輔助駕駛的場景處理能力更加擬人和高效。
這是一個(gè)給系統(tǒng)投喂經(jīng)驗(yàn)的必要過程。
數(shù)量級大小相當(dāng)于一個(gè)人駕駛經(jīng)驗(yàn)的多少,如果從體驗(yàn)程度出發(fā),可以將司機(jī)能力劃分為普通司機(jī)、熟練司機(jī)、職業(yè)老司機(jī)三個(gè)級別。
理想認(rèn)為,1000 萬 Clips 模型意味著系統(tǒng)具備了一名職業(yè)老司機(jī)的能力,能夠臨危不懼,以高超的駕駛技術(shù)安全、舒適、高效地開車。
由此,這是大模型進(jìn)階的關(guān)鍵節(jié)點(diǎn)。
實(shí)際上,除了理想,小米、吉利、奇瑞在展示數(shù)據(jù)儲備時(shí)也將 1000 萬 Clips 數(shù)據(jù)作為重要論據(jù)。
這一論據(jù)主要傳遞了兩點(diǎn)關(guān)鍵信息:
一是用數(shù)據(jù)規(guī)模傳遞系統(tǒng)可靠性及未來潛力,增強(qiáng)用戶信任。
在 AI 時(shí)代,輔助駕駛依靠大量數(shù)據(jù)驅(qū)動。1000 萬 Clips 代表著豐富的駕駛場景和數(shù)據(jù)量,能讓輔助駕駛系統(tǒng)學(xué)習(xí)到各種復(fù)雜路況和駕駛情況。
以理想 AD Max V13 為例,用戶可以明確感受到 1000 萬 Clips 訓(xùn)練下,系統(tǒng)不再是基于規(guī)則呆板得執(zhí)行程序,而是有了一種「活人感」。
比如系統(tǒng)變道控車時(shí)會遵循更合理的策略,避免變道博弈失敗,在提升變道效率同時(shí)提升用戶乘坐的舒適感,并減少對旁車的影響。以及在繞行二輪車場景下,系統(tǒng)會更早對二輪車行駛意圖做出判斷并完成繞行,速度控制更加精細(xì)、平順。
二是用大模型的體驗(yàn)提升印證數(shù)據(jù)驅(qū)動方式的高效與先進(jìn)性。
在數(shù)據(jù)驅(qū)動下,理想輔助駕駛水平提升有目共睹,成為首批率先達(dá)成「車位到車位」成就的車企之一。
這背后,是訓(xùn)練數(shù)據(jù)量的線性增長曲線。
自 2024 年 7 月底開啟千人團(tuán)內(nèi)測以來,理想僅用 7 個(gè)月時(shí)間,完成了 100 萬 Clips 初版模型向 1000 萬 Clips 模型的優(yōu)化迭代。
端到端技術(shù)路徑的持續(xù)演進(jìn)下,數(shù)據(jù)模型將在不斷膨脹下,反哺輔助駕駛性能躍入 L3 時(shí)代。
而 1000 萬 Clips,也會成為輔助駕駛第一梯隊(duì)的核心量化條件。
02、數(shù)據(jù)「提純」技術(shù)是關(guān)鍵
1000 萬 Clips 有個(gè)核心限定詞:高質(zhì)量。
輕舟智航 CEO 于騫曾在 2025 電動車百人會上公開表示,數(shù)據(jù)訓(xùn)練的關(guān)鍵在于覆蓋維度與數(shù)據(jù)質(zhì)量。
前者指「泛」,后者指「精」。即在數(shù)據(jù)清洗過程中,要剔除掉重復(fù)場景與不合理駕駛行為數(shù)據(jù)。
這點(diǎn)與余凱的反共識觀點(diǎn)異曲同工,「99% 的人類司機(jī)數(shù)據(jù)不值得學(xué)習(xí)」的金句背后,是指大部分人類司機(jī)的駕駛技術(shù)與習(xí)慣并不合理,存在闖紅燈、隨意變道等不良行為。
建立嚴(yán)格的數(shù)據(jù)篩選和評估標(biāo)準(zhǔn)成為必要舉措。
于騫就強(qiáng)調(diào),需要通過專業(yè)評分系統(tǒng)從 100 名司機(jī)中篩選出 1 名最優(yōu)駕駛者(如禮賓車司機(jī)級)進(jìn)行數(shù)據(jù)對齊。
理想汽車的做法亦是如此。
從 116 萬用戶的真實(shí)駕駛數(shù)據(jù)中,理想依據(jù)駕駛順暢度、操作規(guī)范性等維度建立篩選標(biāo)準(zhǔn),最終僅將 5% 的高質(zhì)量數(shù)據(jù)納入「五星老司機(jī)」的訓(xùn)練集。
這一「極致提純」的過程,折射出輔助駕駛領(lǐng)域的核心矛盾:數(shù)據(jù)價(jià)值不在于量的堆砌,而在于質(zhì)的穿透。
倒推來看,數(shù)據(jù)難題的本質(zhì)并非「缺水」,而是「水質(zhì)凈化」。這就好比淘金者必須先囤積大量礦砂,才能通過篩洗提煉出黃金。
數(shù)據(jù)提純的前提,是擁有足夠龐大的「原始水源」。
當(dāng)前車企與供應(yīng)商獲取「水源」的方式主要有三種:
第一種是對車企更友好的眾包模式。
正如理想一般,讓用戶授權(quán)后,匿名采集用戶的真實(shí)駕駛數(shù)據(jù)。
特斯拉的影子模式已經(jīng)打好了樣。用戶在駕駛車輛時(shí),系統(tǒng)在后臺模擬駕駛決策,將其與駕駛員實(shí)際操作進(jìn)行對比,若兩者不同則上傳相關(guān)數(shù)據(jù),用于優(yōu)化算法。
某種程度上,車賣得越多,用戶開得越多,數(shù)據(jù)資源就積累得越多。
關(guān)鍵一點(diǎn),在眾包模式下,車企還能把用戶接管數(shù)據(jù)的驅(qū)動閉環(huán)(回傳-存儲-分析-訓(xùn)練)也全部打通。
但上游的智駕供應(yīng)商注定與大批量數(shù)據(jù)資源之間隔著一道坎,這道坎關(guān)乎車企信任。
Momenta 創(chuàng)始人兼 CEO 曹旭東說過一句很體面的話:供應(yīng)商與車企之間信任關(guān)系的建立,關(guān)鍵在于供應(yīng)商能否為用戶和客戶創(chuàng)造價(jià)值。
說白了,數(shù)據(jù)主動權(quán)不在自己手里,想要獲得數(shù)據(jù)資產(chǎn),得看表現(xiàn)。
既然不能輕易調(diào)動水源,就只能自己建水庫——也就是第二種方式:組建專業(yè)的路測團(tuán)隊(duì)自采數(shù)據(jù)。
這已經(jīng)是輔助駕駛供應(yīng)商的必有任務(wù)。即將傳感器安裝在測試車上,在行駛過程中感應(yīng)周圍環(huán)境,進(jìn)行物體辨識、偵測與追蹤,并結(jié)合高精度地圖數(shù)據(jù)采集數(shù)據(jù)。據(jù)悉,一輛測試車每天路面測試產(chǎn)生的數(shù)據(jù)可達(dá) TB 級。
除了采集,路測車隊(duì)的另一核心任務(wù)在于測試。因此,自采數(shù)據(jù)的優(yōu)勢一方面在于精準(zhǔn)控制采集場景,比如根據(jù)研發(fā)需求定向采集特定場景數(shù)據(jù)(如暴雨、隧道、復(fù)雜路口等),另一方面在于提升訓(xùn)練效率,針對長尾場景的數(shù)據(jù)被訓(xùn)練后,系統(tǒng)可以在實(shí)地測試中反哺算法迭代。
當(dāng)然,自建車隊(duì)采集數(shù)據(jù)的成本注定會隨著數(shù)據(jù)累積水漲船高。
看得見的是車隊(duì)數(shù)量、設(shè)備配置、人員薪酬等硬性成本,看不見的則是數(shù)據(jù)存儲與傳輸?shù)碾[形成本。
有媒體報(bào)道過,一家頭部智駕供應(yīng)商企業(yè)每年回傳數(shù)據(jù)的流量費(fèi)以億元為單位,云端數(shù)據(jù)存儲成本每月可能數(shù)百萬到上千萬元。
可以說,自采數(shù)據(jù)就像在走獨(dú)木橋,在人力、財(cái)力耗費(fèi)大量成本的同時(shí),還伴隨著采集極端場景的高安全風(fēng)險(xiǎn)。
因?yàn)樵谡鎸?shí)道路上,暴雨、暴雪、夜間強(qiáng)光等極端天氣場景出現(xiàn)概率極低,需要耗費(fèi)大量精力才能采集到。Waymo 就曾披露過,其路測車隊(duì)需累計(jì)行駛超 10 億英里才能覆蓋約 2.5 萬種長尾場景。
由此,第三種數(shù)據(jù)采集方式——數(shù)據(jù)仿真,走進(jìn)輔助駕駛玩家們的視野。
即在仿真平臺中通過生成式 AI 技術(shù),批量生成數(shù)百萬種虛擬場景,來覆蓋真實(shí)路測中難以遇到的極端情況。
AI 企業(yè)在這點(diǎn)上掌握先發(fā)優(yōu)勢,比如商湯絕影打造的「開悟」世界模型,基于一個(gè) BEV 視角下的初始主車和他車位置,就可以生成主車視角下 11V(11 個(gè)攝像頭)的傳感器仿真數(shù)據(jù),并且 1 個(gè) GPU 產(chǎn)生的仿真數(shù)據(jù)相當(dāng)于 500 臺量產(chǎn)車的數(shù)據(jù)采集效果。
可見,仿真數(shù)據(jù)通過低成本、高安全、廣覆蓋的特性,能夠解決真實(shí)世界「測不全、測不起、測不快」的難題。
但這僅局限于未來的理想狀態(tài),目前數(shù)據(jù)仿真技術(shù)仍主要扮演數(shù)據(jù)采集過程中的輔助角色。
不過,可以確定的是,隨著輔助駕駛向 L3、L4 級持續(xù)進(jìn)階,優(yōu)質(zhì)的數(shù)據(jù)資源將越來越稀缺,這也意味著三種「找水源」方式的權(quán)重也將發(fā)生動態(tài)變化。
就像馬斯克篤定認(rèn)為,現(xiàn)實(shí)世界中能夠用于 AI 訓(xùn)練的數(shù)據(jù)幾乎已經(jīng)被消耗殆盡,而數(shù)據(jù)仿真才是未來數(shù)據(jù)驅(qū)動的有效解法。
03、后端到端時(shí)代,打的還是數(shù)據(jù)資源戰(zhàn)
在輔助駕駛的當(dāng)下語境內(nèi),行業(yè)討論的技術(shù)焦點(diǎn)不再是「你端沒端」,而是「端到端之后,下一步該研究什么?」
后端到端時(shí)代,行業(yè)正呈現(xiàn)出全新生態(tài)。
最直觀一點(diǎn),在量產(chǎn)落地場景上,城區(qū)智能輔助駕駛的擂臺已經(jīng)被選手?jǐn)D滿了,主要區(qū)別在于搭載哪種芯片,基于多大算力,滲透到多少萬車型。
而在更高一層的「車位到車位」競技場,華為、理想、小鵬、Momenta、極氪等多名玩家也已經(jīng)沖線。
L3 成為了新的挑戰(zhàn)門檻。
投射到技術(shù)層面上,一些技術(shù)趨勢浮出水面,逐漸成為共識。
一是從模仿學(xué)習(xí)到強(qiáng)化學(xué)習(xí)。
簡單而言,模仿學(xué)習(xí)是依賴人類駕駛數(shù)據(jù)的「標(biāo)準(zhǔn)答案」,被動模仿人類司機(jī),而強(qiáng)化學(xué)習(xí)是通過虛擬環(huán)境的「獎懲反饋」,主動地試錯探索。
強(qiáng)化學(xué)習(xí)的最直觀優(yōu)點(diǎn),在于系統(tǒng)可以自主探索人類沒有教過的復(fù)雜場景,讓駕駛決策更加靈活智能。
在地平線提出的輔助駕駛算法「快思考、慢思考」路徑中,就是引入強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)駕駛模型的智能涌現(xiàn)。
Momenta 也計(jì)劃在今年下半年,推出基于強(qiáng)化學(xué)習(xí)框架的 Momenta R6 飛輪大模型。
二是從 VLM(視覺語言模型)到 VLA(視覺-語言-動作模型)。
理想是 VLA 的代表選手。李想曾將從規(guī)則算法到「端到端+VLM」,再到 VLA 的技術(shù)路線進(jìn)化類比為昆蟲動物智能、哺乳動物智能、人類智能三個(gè)階段。
相當(dāng)于,基于 VLA 路徑,系統(tǒng)表現(xiàn)得像專職司機(jī),可以隨時(shí)聽懂并執(zhí)行「開快點(diǎn)、左拐」等指令,也能在陌生地庫漫游尋找車位。
相比 VLM,VLA 在可解釋性、泛化性及復(fù)雜場景適應(yīng)性上都有顯著提升。
由此,在算法、算力、數(shù)據(jù)三者的命運(yùn)共同體之下,算法的演進(jìn)同樣倒逼數(shù)據(jù)產(chǎn)生新的化學(xué)反應(yīng)。
但主軸依然還是:數(shù)據(jù)閉環(huán)。
可以說,現(xiàn)在沒有一家車企或供應(yīng)商能繞開數(shù)據(jù)閉環(huán)。
曹旭東做過一個(gè)簡單總結(jié),在輔助駕駛這條路上,百萬數(shù)據(jù)大概能做個(gè)演示樣品,千萬數(shù)據(jù)大概能做一個(gè)及格產(chǎn)品,上億數(shù)據(jù)大概能做到接近比較好的一個(gè)產(chǎn)品,十億級別能做到超越人類水平的產(chǎn)品。
小鵬做好了準(zhǔn)備,在達(dá)到 2000 萬 Clips 數(shù)據(jù)節(jié)點(diǎn)后,年底預(yù)計(jì)數(shù)據(jù)存儲量會飆升至 2 億 Clips。
毫無疑問,海量且高質(zhì)量的數(shù)據(jù)是推動智能駕駛前進(jìn)的核動力。
所以無論是強(qiáng)化學(xué)習(xí)還是 VLA,兩條技術(shù)趨勢對于高質(zhì)量數(shù)據(jù)的渴求是不變的。
只不過,如今關(guān)于數(shù)據(jù)探討的分歧,已演變?yōu)樵凇笍恼鎸?shí)數(shù)據(jù)中提取有效數(shù)據(jù)」與「從仿真數(shù)據(jù)中生成有效數(shù)據(jù)」之間,二者權(quán)重該如何權(quán)衡的博弈。
目前來看,兩者并重是最優(yōu)解。
一方面,強(qiáng)化學(xué)習(xí)生長的虛擬環(huán)境同樣需要高質(zhì)量數(shù)據(jù)充當(dāng)數(shù)據(jù)采集源頭。
另一方面,仿真模擬和 AI 生成數(shù)據(jù)的質(zhì)量目前還不如實(shí)車行駛收集的數(shù)據(jù)。
余凱就指出,數(shù)據(jù)差別的關(guān)鍵在于,人類還無法教機(jī)器充分認(rèn)識世界,也無法在虛擬世界中完整復(fù)刻現(xiàn)實(shí)。
在小馬智行創(chuàng)始人樓天城看來,真實(shí)駕駛數(shù)據(jù)對建立世界模型的作用存在局限性。世界模型若想真正理解真實(shí)世界,不僅需要駕駛數(shù)據(jù),還需大量涵蓋環(huán)境、生活等多維度的真實(shí)數(shù)據(jù)。這就如同 DeepSeek 能夠解決物理問題,并非僅靠學(xué)習(xí)物理知識,而是融合了物理、化學(xué)、生物等多學(xué)科內(nèi)容。
可以確定的是,輔助駕駛的未來發(fā)展離不開世界模型,且世界模型的精度直接決定了車載模型的上限。
不過,在數(shù)據(jù)應(yīng)用過程中,如何規(guī)避幻覺數(shù)據(jù)干擾、構(gòu)建科學(xué)的評價(jià)體系,仍是一個(gè)持續(xù)性探索過程。
而如果跳出技術(shù)細(xì)節(jié)用更宏觀的視角看待這個(gè)過程,各玩家對于高質(zhì)量數(shù)據(jù)的追求背后,其實(shí)是對龐大資源的不斷消耗,關(guān)乎人力、物力、財(cái)力。
曹旭東在采 訪中直言,現(xiàn)在一年投入小幾十個(gè)億,就能做到第二梯隊(duì)或準(zhǔn)第一梯隊(duì)水平,但再往后,要幾百億才能做到同樣水平。如果要做到量產(chǎn) L4 自動駕駛,每年的研發(fā)投入至少是百億甚至幾百億。
輔助駕駛賽道越向深水區(qū)延伸,越需要具備「高舉高打」的戰(zhàn)略視野。
特斯拉已經(jīng)做了示范,但極高的競爭壁壘下,還沒有玩家能抄到特斯拉的作業(yè)。
因此輔助駕駛開啟淘汰賽后,規(guī)則很清晰,競爭格局也很清晰。
由技術(shù)投入強(qiáng)度、數(shù)據(jù)積累速度、場景覆蓋廣度構(gòu)成的核心篩網(wǎng),讓頭部玩家與追趕者的分化不斷加速。
在當(dāng)前這個(gè)關(guān)鍵賽點(diǎn)上,一個(gè)最直觀的實(shí)力刻度已經(jīng)出現(xiàn),即誰先邁過 1000 萬 Clips 的數(shù)據(jù)門檻,誰就能拿到輔助駕駛第一梯隊(duì)的入場券。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://m.healthsupplement-reviews.com/kol/269315
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。