混合模型(Mixture Models)是一種強(qiáng)大的工具,能夠有效表征多模態(tài)分布(Multimodality)。根據(jù)正組分(Positive Mixture Component)匹配方式,主流的混合模型方法主要分為兩類:基于錨點(diǎn)(Anchor-Based)匹配和基于預(yù)測(cè)(Prediction-Based)匹配。然而,Prediction-Based方法存在預(yù)測(cè)聚類現(xiàn)象,難以選擇具有代表性的預(yù)測(cè)結(jié)果;而Anchor-Based方法則回歸精度受限。
本文提出了一種全新的混合模型正組分匹配范式:可更新且具區(qū)分度錨點(diǎn)(EDA,Evolvingand Distinct Anchors),巧妙結(jié)合上述兩類方法的優(yōu)勢(shì),實(shí)現(xiàn)更高效的多峰分布學(xué)習(xí)。我們?cè)诙嗄B(tài)運(yùn)動(dòng)預(yù)測(cè)(Multimodal Motion Prediction)任務(wù)上進(jìn)行了廣泛實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,EDA方法(單模型)在Waymo Motion Prediction Challenge中展現(xiàn)了優(yōu)秀的性能。
? 原文鏈接:
https://ojs.aaai.org/index.php/AAAI/article/view/28130
?代碼鏈接:
https://github.com/Longzhong-Lin/EDA
多模態(tài)運(yùn)動(dòng)預(yù)測(cè)
在自動(dòng)駕駛領(lǐng)域,運(yùn)動(dòng)預(yù)測(cè) (Motion Prediction) 是一個(gè)重要任務(wù),它有助于場(chǎng)景理解和安全決策。該任務(wù)利用歷史狀態(tài)和道路地圖來預(yù)測(cè)目標(biāo)智能體的未來軌跡。其主要挑戰(zhàn)來自未來行為的多模態(tài)性 (Multimodality) ,即智能體在相同環(huán)境和狀態(tài)下可能展現(xiàn)出多種不同的行為模式。

圖表1 智能體在相同環(huán)境和狀態(tài)下可能展現(xiàn)出多種不同的行為模式
混合模型與正樣本匹配
近年來,混合模型 (Mixture Model)例如高斯混合模型 (GMM) 已成為表征多峰未來行為分布的主流方法?;旌夏P屯ǔ2捎谩摆A家通吃”的回歸損失和分類損失,這需要明確混合組分 (Mixture Component) 中的正負(fù)樣本,來作為分類損失的標(biāo)簽,以及計(jì)算正組分對(duì)應(yīng)預(yù)測(cè)軌跡的回歸損失。那么根據(jù)正樣本匹配的方式,當(dāng)前主流的混合模型方法可以分為兩類:基于預(yù)測(cè) (Prediction-Based)匹配和基于錨點(diǎn) (Anchor-Based)匹配。
Prediction-Based / Anchor-Free:選擇與真實(shí)軌跡 (Ground Truth) 最接近的預(yù)測(cè)軌跡,將其所對(duì)應(yīng)的混合組分作為正樣本。這類方法生成的預(yù)測(cè)結(jié)果能夠真實(shí)反映未來行為的高度不確定性,但生成的軌跡往往會(huì)聚集在最有可能的區(qū)域,且具有相似的得分。這種現(xiàn)象導(dǎo)致模型難以選擇具有代表性的軌跡,不利于下游任務(wù)。
Anchor-Based:將各個(gè)混合組分與預(yù)定義的錨點(diǎn) (Anchor) 相關(guān)聯(lián),并選擇與Ground Truth最接近的錨點(diǎn)所對(duì)應(yīng)組分作為正樣本。錨點(diǎn)的引入顯著降低了分類(即給混合組分評(píng)分)的優(yōu)化難度,同時(shí)預(yù)測(cè)軌跡將傾向于生成在對(duì)應(yīng)的錨點(diǎn)附近。為了降低計(jì)算成本并保證評(píng)分性能,錨點(diǎn)的分布通常會(huì)比Prediction-Based方法生成的軌跡更稀疏,這種稀疏性則限制了模型的軌跡回歸能力。

圖表2 不同正樣本匹配范式的結(jié)果
可更新且具區(qū)分度錨點(diǎn) (EDA)
在本文中,我們提出了一種全新的混合模型正樣本匹配范式:可更新且具區(qū)分度錨點(diǎn) (EDA, Evolving and Distinct Anchors)。

圖表3 EDA:全新的混合模型正樣本匹配范式
可更新錨點(diǎn) (Evolving Anchors)
對(duì)于Evolving Anchors,我們引入錨點(diǎn)并通過中間預(yù)測(cè)結(jié)果對(duì)其進(jìn)行動(dòng)態(tài)更新,使錨點(diǎn)能夠根據(jù)具體場(chǎng)景上下文信息進(jìn)行自適應(yīng)調(diào)整,從而在保留空間先驗(yàn)的同時(shí)提升了模型的靈活性。

圖4 Evolving Anchors的作用
具區(qū)分度錨點(diǎn) (Distinct Anchors)
隨著錨點(diǎn)的動(dòng)態(tài)更新,我們觀察到了類似Prediction-Based方法的預(yù)測(cè)結(jié)果聚集現(xiàn)象。

圖表5 Evolving Anchors中的預(yù)測(cè)軌跡聚集現(xiàn)象
為了緩解預(yù)測(cè)聚集引發(fā)的分類標(biāo)簽歧義性問題(即對(duì)于相近的2個(gè)組分,有可能一個(gè)被標(biāo)記為正樣本,而另一個(gè)被標(biāo)記為負(fù)樣本),我們借鑒目標(biāo)檢測(cè)領(lǐng)域中的DDQ方法,提出先從錨點(diǎn)中篩選出Distinct Anchors,再將這些錨點(diǎn)與Ground Truth進(jìn)行匹配。

圖表6 可更新且具區(qū)分度錨點(diǎn) (EDA, Evolving and Distinct Anchors)
實(shí)驗(yàn)結(jié)果
消融實(shí)驗(yàn)
隨著錨點(diǎn)更新頻率的增加,模型的回歸能力在逐步增長(zhǎng),并且錨點(diǎn)的每次更新都會(huì)帶來顯著的回歸精度提升。

圖表7 隨著錨點(diǎn)更新頻率的增加,模型的回歸能力在逐步提升
軌跡聚集問題確實(shí)影響了Evolving Anchors的軌跡評(píng)分能力,導(dǎo)致模型的Top-6軌跡預(yù)測(cè)指標(biāo)尤其是mAP (mean Average Precision) 出現(xiàn)衰減;而Distinct Anchors的引入則如預(yù)期一樣,全面且顯著地提升了模型的Top-6軌跡預(yù)測(cè)指標(biāo)。

圖表8 消融模型的Top-6指標(biāo)
對(duì)比實(shí)驗(yàn)
在Waymo Open Motion Dataset上,EDA的單模型表現(xiàn)超越了之前的Ensemble-Free方法,在所有指標(biāo)上均優(yōu)于基線模型MTR,特別是在Miss Rate上實(shí)現(xiàn)了13.5%的相對(duì)降低。此外,EDA還超越了MTR++,后者為改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)的MTR升級(jí)方法。

圖標(biāo)9 Benchmark結(jié)果
總結(jié)與展望
本文針對(duì)軌跡預(yù)測(cè)中Mixture Model存在模態(tài)坍縮和精度不足的問題進(jìn)行了研究,提出了一種新的正負(fù)樣本匹配策略——Evolving and Distinct Anchors來解決該問題,保證了軌跡預(yù)測(cè)模型在具備較高模態(tài)豐富度的同時(shí)擁有很高的歸回精度。我們的方法在Waymo Open Motion Dataset上達(dá)到了SOTA的水平。我們認(rèn)為正負(fù)樣本匹配策略具有很高的研究?jī)r(jià)值,不僅僅是在軌跡預(yù)測(cè)任務(wù)上,在端到端軌跡規(guī)劃、智能體行為仿真等任務(wù)上也具備廣泛的應(yīng)用潛力和重要的研究意義。
-
模型
+關(guān)注
關(guān)注
1文章
3618瀏覽量
51535 -
混合模型
+關(guān)注
關(guān)注
0文章
6瀏覽量
6519 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
791文章
14559瀏覽量
174559
原文標(biāo)題:開發(fā)者說 | EDA:采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測(cè)
文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于多模態(tài)語義SLAM框架
HT for Web (Hightopo) 使用心得(3)- 吸附與錨點(diǎn)
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
錨桿與圍巖加載過程紅外特征研究
5G傳輸錨點(diǎn)創(chuàng)新方案分析及研究
動(dòng)態(tài)可更新分布式監(jiān)測(cè)系統(tǒng)設(shè)計(jì)
多文化場(chǎng)景下的多模態(tài)情感識(shí)別
預(yù)應(yīng)力錨具之錨具連接器的知識(shí)
研發(fā)全新多模態(tài)感知AI框架 AI能同時(shí)模擬人眼和手預(yù)測(cè)物體運(yùn)動(dòng)
基于類間區(qū)分度的屬性約簡(jiǎn)方法及其研究
如何利用LLM做多模態(tài)任務(wù)?
更強(qiáng)更通用:智源「悟道3.0」Emu多模態(tài)大模型開源,在多模態(tài)序列中「補(bǔ)全一切」
基于多模態(tài)學(xué)習(xí)的虛假新聞檢測(cè)研究

采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測(cè)研究
評(píng)論