Think2Drive：首個用於自動駕駛的模型為基礎的RL方法（上海交大）-人工智慧-PHP中文網

Think2Drive：首個用於自動駕駛的模型為基礎的RL方法（上海交大）

王林

發布： 2024-03-01 16:31:02

轉載

766 人瀏覽過

在CARLA v2中以專家級的熟練程度運作。

主題：Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

作者單位：上海交通大學

現實世界中的自動駕駛（AD），尤其是城市駕駛，涉及許多corner case。最近發布的AD模擬器CARLA v2在駕駛場景中增加了39個常見事件，並提供了比CARLA v1更接近真實的測試平台。這給社區帶來了新的挑戰，到目前為止，還沒有文獻報告CARLA v2中的新場景取得了任何成功，因為現有的工作大多必須依賴特定規則進行規劃，但它們無法涵蓋CARLA v2中更複雜的情況。這項工作主動直接訓練一個規劃器，希望能夠靈活有效地處理corner case，認為這也是AD的未來方向。據我們所知，我們開發了第一個基於模型的強化學習方法，名為Think2Drive，用於AD，具有一個世界模型來學習環境的轉變，然後它充當神經模擬器來訓練規劃器。這種範式大大提高了訓練效率，因為世界模型中的低維度狀態空間和張量的平行計算。

結果，Think2Drive能夠在單一A6000 GPU上進行3天的訓練後，在CARLA v2中以專家級的熟練程度運行，據我們所知，迄今為止尚未報告有關CARLA v2的成功（100 %的路線完成）。也提出了CornerCase-Repository，這是一個支援透過場景評估駕駛模型的基準。此外，提出了一個新的平衡指標來評估效能，包括路線完成、違規次數和場景密度，以便駕駛分數可以提供更多關於實際駕駛表現的資訊。

實驗結果

Think2Drive：首個用於自動駕駛的模型為基礎的RL方法（上海交大）

########################################### ###歡迎您來到我們的倉庫！這裡涵蓋了眾多技術領域，包括BEV、多模態融合、車輛佔用偵測、毫米波雷達視覺感知、車道線偵測以及3D感知等。我們也分享了關於線上地圖、多感測器校準、Nerf、大型模型、規劃控制和軌跡預測的綜述和論文。希望您喜歡我們的內容，並且不忘star和follow我們的倉庫以獲取更多精彩資訊！感謝您的支持！ ##########

以上是Think2Drive：首個用於自動駕駛的模型為基礎的RL方法（上海交大）的詳細內容。更多資訊請關注PHP中文網其他相關文章！