新浪科技訊 12月28日下午消息,近日,人工智能領域國際會議AAAI 2026公布了論文錄用結果,由小鵬汽車和北京大學計算機學院多媒體信息處理全國重點實驗室聯(lián)合完成的論文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入選。這篇論文最大的貢獻在于,提出了一種專門為端到端自動駕駛VLA模型定制的、高效的視覺Token剪枝框架——FastDriveVLA。
據(jù)介紹,F(xiàn)astDriveVLA包含一個即插即用的視覺Token剪枝器ReconPruner。在車端模型的推理階段, ReconPruner可直接嵌入自動駕駛VLA模型用于視覺Token的剪枝,即插即用,無需重新訓練整個模型。為了輔助該剪枝器的訓練,還專門構建了包含來自6個攝像頭視角的24.1萬個圖像-掩碼對的nuScenes-FG數(shù)據(jù)集。這一大規(guī)模的自動駕駛前景分割標注數(shù)據(jù)集,可廣泛用于未來自動駕駛的研究。
最終,nuScenes自動駕駛數(shù)據(jù)集上的測試顯示,采用這一剪枝框架,在不同剪枝率下均取得當前最優(yōu)即SOTA效果:剪枝比例達25%視覺Token時,駕駛性能幾乎不下降,其L2軌跡誤差與碰撞率指標甚至超越未剪枝的基準模型;剪枝比例達50%Token時,在所有指標上表現(xiàn)更平衡;與此同時,VLA模型的推理效率得到了顯著提升。
小鵬汽車聯(lián)合北大提出的FastDriveVLA,建立了自動駕駛VLA模型的高效視覺Token剪枝的新范式,同時樹立了車端大模型高效部署上車的新標桿。小鵬汽車董事長何小鵬在微博上對此表示,“很高興我們在探索L4的路上又取得新的突破。我們會在物理AI領域繼續(xù)發(fā)力,期待第二代VLA給鵬友們帶來更棒的智駕體驗?!?/p>