18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛上常提的VLA與世界模型有什么區(qū)別?

智駕最前沿 ? 來源:智駕最前沿 ? 2025-10-18 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

VLA:把“看”和“說”連到“做”上

[首發(fā)于智駕最前沿微信公眾號]自動駕駛中常提的VLA,全稱是Vision-Language-Action,直譯就是“視覺-語言-動作”。VLA的目標是把相機或傳感器看到的畫面、能理解和處理自然語言的大模型能力,和最終控制車輛的動作輸出連到一起。這樣一套模型既能把路面情況轉(zhuǎn)成語義信息(比如識別行人、車道、交通標志),又能在內(nèi)部用類語言的方式做推理(比如判斷行人的意圖是否會橫穿),最后直接輸出控制量或軌跡建議,從而完成從感知到?jīng)Q策到動作的閉環(huán)。

VLA常把視覺特征先經(jīng)過編碼器變成一組向量,然后把這些向量與語言模型連接,語言模型負責做高層推理或上下文理解,最后再用一個動作生成模塊把推理結(jié)果映射到可執(zhí)行的控制指令。因為有“語言”這條中間線索,VLA在解釋模型為什么這樣決策、把決策用人能看懂的方式表達方面有天然優(yōu)勢,這對事故回溯、人工審查和人機交互都很有幫助。

世界模型:在“腦?!崩?a href="http://cshb120.cn/analog/" target="_blank">模擬未來

世界模型的核心是讓系統(tǒng)學會預測環(huán)境會如何變化。給定當前的觀測和一系列動作,世界模型嘗試預測接下來一段時間內(nèi)的感知輸出或場景演化,例周圍車輛會怎么走、行人會如何移動,或者道路上的占用情況會如何變化等。它更像是一個可以在內(nèi)部反復“試驗”的模擬器。

世界模型可以是像素級的,也可以是抽象的潛在空間表示。像素級的會直接生成未來幾幀圖像,抽象的潛在表示則在更緊湊的編碼下預測物體的狀態(tài)和動力學。自動駕駛中常把世界模型用來做兩件事,一是在線短時預測,輔助規(guī)劃器評估當前動作的后果;二是離線大規(guī)模仿真,用來生成難例、做策略評估和安全驗證。世界模型的強項在于對因果關(guān)系和動力學的建模,它能回答“如果我這么做,環(huán)境會怎樣”,這對安全評估非常關(guān)鍵。

兩者的核心差別與各自擅長的事

把VLA和世界模型放在一起對比,其實有非常大的差別。VLA更強調(diào)把復雜語義和推理能力直接引入決策鏈,善于解釋性和把人類語義知識(比如規(guī)則、常識)融入行為判斷;世界模型更強調(diào)動力學與未來狀態(tài)的預測,擅長評估動作后果和生成訓練用的極端場景。

因為語言式推理要靠語料和場景標簽來訓練,因此VLA需要大量多模態(tài)、標注或與人類語義對齊的數(shù)據(jù);世界模型更依賴連續(xù)的時序數(shù)據(jù)與準確的動力學反饋,或是高保真仿真器來補足現(xiàn)實數(shù)據(jù)不足。

對于自動駕駛行業(yè)來說,VLA能讓系統(tǒng)“說出理由”,有利于合規(guī)和用戶信任;世界模型能把長期風險提前顯現(xiàn),有利于安全驗證和策略穩(wěn)健性。兩者在算力和實時性上的要求也不同,端到端的VLA若要部署在車端,需要在多模態(tài)推理與延時之間做平衡;高保真世界模型若用于在線預測,也要保證預測速度和穩(wěn)定性,否則實時控制就受影響。

如何將這兩者用好?

自動駕駛行業(yè)常見做法是把世界模型放在云端或仿真平臺,用來大規(guī)模生成極端和稀有場景,做訓練數(shù)據(jù)擴充和策略評估;把VLA或其它決策模型放到車端,負責實時感知-推理-動作映射,并把可解釋的中間表示(例如“為什么剎車”)記錄下來,用于審計。還有一種做法是在車端保留一個輕量的世界模型,用于短時軌跡預測和冗余校驗,作為主決策器的安全網(wǎng)。

在選擇技術(shù)路線時,務(wù)必要考慮幾個現(xiàn)實問題,即目標場景是什么(城市復雜路況還是高速長途)、能否承擔大量真實路測、對可解釋性和監(jiān)管合規(guī)的要求有多高。面向消費者的駕駛輔助系統(tǒng)可能更重視用戶體驗和自然交互,VLA能提高語義層面的表現(xiàn);面向商用車隊或?qū)Π踩弦?guī)嚴格的場景,則更需要強大的世界模型做仿真與驗證。無論哪條路,一定要建立嚴格的sim-to-real校準流程、冗余策略以及持續(xù)的在線/離線評估體系,避免把過擬合的語言推理或低保真仿真直接當成“能上路”的決策依據(jù)。

對于自動駕駛企業(yè)來說,可以用世界模型生成的極端場景來補齊訓練集,但要用真實數(shù)據(jù)來校準;在車端實現(xiàn)可解釋性輸出和異常檢測機制,以便監(jiān)管和事后分析;在設(shè)計系統(tǒng)邊界時明確何時由人工接管、何時由系統(tǒng)限制能力,避免模型在不確定情況下做出過激動作。混合使用兩者并通過嚴格驗證可以讓自動駕駛系統(tǒng)既能“想清楚后果”,又能“把理由講清楚”,是比較穩(wěn)妥的路線。

最后的話

VLA和世界模型不是誰替代誰,而是兩種互補的工具。VLA把語言式的推理能力帶進決策里,提升對復雜語義場景的處理和可解釋性;世界模型讓系統(tǒng)能在“腦子里”模擬未來,提升對風險和后果的評估能力。對于自動駕駛行業(yè)來說,更實際的做法是把兩者的優(yōu)點結(jié)合起來,用世界模型來補數(shù)據(jù)、做驗證,用VLA提升語義理解與交互,同時確保有清晰的安全邊界和多層冗余。這樣既能提高功能性,也能把安全性和可審計性放在首位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3616

    瀏覽量

    51493
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14551

    瀏覽量

    174284
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛中常的ODD是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一個概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文譯為“運行設(shè)計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?407次閱讀
    <b class='flag-5'>自動駕駛</b>中常<b class='flag-5'>提</b>的ODD是個啥?

    低速和高速自動駕駛的應用場景和技術(shù)方向何不同?

    和任務(wù)完成度也非常高,這是否代表著自動駕駛技術(shù)已然達到了非常高的水平?其實與我們的乘用車自動駕駛而言,快遞、外賣小車的自動駕駛完全不屬于
    的頭像 發(fā)表于 08-03 09:35 ?575次閱讀

    車規(guī)級和消費級什么區(qū)別?為什么自動駕駛需要車規(guī)級?

    區(qū)別主要體現(xiàn)在可靠性、環(huán)境適應、質(zhì)量管理與安全保障等多個方面。對于汽車,尤其是自動駕駛系統(tǒng)而言,任何一次失效都可能帶來嚴重后果,因此必須選用符合車規(guī)級標準的硬件與軟件。那什么是車規(guī)級?什么是消費級?為什么自動駕駛需要車規(guī)級?
    的頭像 發(fā)表于 07-15 08:55 ?824次閱讀
    車規(guī)級和消費級<b class='flag-5'>有</b><b class='flag-5'>什么區(qū)別</b>?為什么<b class='flag-5'>自動駕駛</b>需要車規(guī)級?

    為什么自動駕駛端到端大模型黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,端到端(End-to-End)大模型也成為行業(yè)研究與應用的熱門方向。相較于傳統(tǒng)自動駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端到端模型嘗試直接從感知輸
    的頭像 發(fā)表于 07-04 16:50 ?461次閱讀
    為什么<b class='flag-5'>自動駕駛</b>端到端大<b class='flag-5'>模型</b><b class='flag-5'>有</b>黑盒特性?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?

    ,自動駕駛技術(shù)也得到了充足的應用,但因應用場景不同,技術(shù)的側(cè)重方向也有所區(qū)別。今天就來和大家聊一聊這個話題。 應用場景:開放道路vs封閉場地 首先要理解的是,自動駕駛所面對的環(huán)境決定了它的技術(shù)基礎(chǔ)。乘用車
    的頭像 發(fā)表于 06-28 11:38 ?544次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術(shù)要求上有何不同?

    自動駕駛中常世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型
    的頭像 發(fā)表于 06-24 08:53 ?440次閱讀
    <b class='flag-5'>自動駕駛</b>中常<b class='flag-5'>提</b>的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個啥?

    VLA,是完全自動駕駛的必經(jīng)之路?

    芯片,以及英偉達Thor的上車,越來越多的智駕方案選擇VLA的路徑。 ? 那么本文就梳理一下當前智駕領(lǐng)域集中主流的大模型技術(shù)路線,以及各家廠商實現(xiàn)方式的區(qū)別和發(fā)展。 ? VLA 和VL
    的頭像 發(fā)表于 06-18 00:06 ?8311次閱讀

    自動駕駛安全基石:ODD

    和限制下可以正常工作,是自動駕駛安全的核心概念之一。 ? 對于人類司機來說,在不同的道路上駕駛的能力也有所區(qū)別,比如新手司機在一些窄路、山路,或者交通狀況復雜的道路上可能會無所適從,人也會判斷哪些路自己沒有
    的頭像 發(fā)表于 05-19 03:52 ?5575次閱讀

    自動駕駛行業(yè)的高階智駕是個啥?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著人工智能、大數(shù)據(jù)、傳感器技術(shù)及高性能計算平臺的迅速發(fā)展,自動駕駛行業(yè)不斷突破。從最初的駕駛輔助系統(tǒng)到最近火熱的端到端,再到如今的高階智駕,智駕行業(yè)關(guān)鍵詞
    的頭像 發(fā)表于 04-18 12:24 ?674次閱讀
    <b class='flag-5'>自動駕駛</b>行業(yè)<b class='flag-5'>常</b><b class='flag-5'>提</b>的高階智駕是個啥?

    自動駕駛模型中常的Token是個啥?對自動駕駛何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強大的特征提取、信息融合和預測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,一個“Token”的概念,有些人看到后或許
    的頭像 發(fā)表于 03-28 09:16 ?692次閱讀

    理想汽車推出全新自動駕駛架構(gòu)

    2025年3月18日,理想汽車自動駕駛技術(shù)研發(fā)負責人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動駕駛物理智能體的關(guān)鍵一步》,分享了理想汽車對于下一代自動駕駛技術(shù)M
    的頭像 發(fā)表于 03-19 14:12 ?754次閱讀

    為什么聊自動駕駛的越來越多,聊無人駕駛的越來越少?

    自動駕駛什么區(qū)別?為什么現(xiàn)在一直都在聊自動駕駛,卻鮮少有企業(yè)無人駕駛?今天智駕最前沿就圍繞
    的頭像 發(fā)表于 02-23 10:52 ?839次閱讀
    為什么聊<b class='flag-5'>自動駕駛</b>的越來越多,聊無人<b class='flag-5'>駕駛</b>的越來越少?

    華為、理想、特斯拉、商湯的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人說世界模型是終極自動駕駛解決方案,實際上它只是端到端大
    的頭像 發(fā)表于 01-14 09:27 ?1594次閱讀
    華為、理想、特斯拉、商湯的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    自動駕駛中常的魯棒性是個啥?

    隨著自動駕駛技術(shù)的快速發(fā)展,魯棒性(Robustness)成為評價自動駕駛系統(tǒng)的重要指標之一。很多小伙伴也會在自動駕駛相關(guān)的介紹中,對某些功能用魯棒性進行描述。一個魯棒的系統(tǒng)能夠在復雜多變的環(huán)境中保
    的頭像 發(fā)表于 01-02 16:32 ?8025次閱讀
    <b class='flag-5'>自動駕駛</b>中常<b class='flag-5'>提</b>的魯棒性是個啥?

    自動駕駛中常的SLAM到底是個啥?

    隨著自動駕駛技術(shù)的迅速發(fā)展,車輛在不同環(huán)境中的定位與導航需求愈加迫切,自動駕駛的核心任務(wù)是讓車輛在未知或動態(tài)變化的環(huán)境中安全、智能地行駛,這需要系統(tǒng)能夠準確地回答:1)我在哪里?2)我該去哪里
    的頭像 發(fā)表于 11-21 15:17 ?2136次閱讀
    <b class='flag-5'>自動駕駛</b>中常<b class='flag-5'>提</b>的SLAM到底是個啥?