百度 Apollo已更新到2.5版本 但其數據會如何開放最值得關注
轉眼間,百度的 Apollo 平臺已經公布了一年多了。這項聲勢浩大的自動駕駛開源計劃到現在為止已經更新到了 Apollo2.5 版本。Apollo 平臺陸續開放了高精度地圖、參考硬件、云計算、視覺感知等眾多模塊。在最新的 2.5 版本中,Apollo 的方案已經開放了高速公路上的自動駕駛能力,并開始開放車輛控制相關的模塊。
對于汽車行業來說,這個迭代速度可以說是非常快了。
百度 Apollo 的數據開放計劃
其實除了迭代速度之外,百度 Apollo 計劃還有一個需要重視的舉措——開放數據。
自動駕駛的核心在于需要深度的 AI 算法,這又依靠海量大數據和高性能計算。數據分成原始數據、標注數據、邏輯數據和仿真數據四個層次。原始數據由 Lidar、攝象頭、雷達、GNSS、IMU、CAN 總線等數據構成。光有原始數據還不夠,為了做深度學習養料,要教會機器數據表達的是什么,這就需要標注。進而需要對邏輯的理解和各種模型的刻畫。要呈現一個完整的自動駕駛要解決相當多的問題,還需要構建更廣泛的場景,重組出無窮的場景,成為仿真數據。
熟悉自動駕駛的人都知道,數據是驅動整個技術優化的核心資源。很多汽車廠商對數據十分珍視,輕易絕不愿意拿出來。
而作為一個開放平臺,百度 Apollo 數據作為重要組成部分也開放了出來。在 Apollo1.0 版本發布時,就率先將百度積累多年的數據資源對外開放,包括 2D 紅綠燈檢測、2D 紅綠燈檢測及 Road Hackers 等。此后的 Apollo1.5、2.0 及 2.5 版本中,Apollo 的數據開放類型及數據量也都持續擴大。
在今年的 3 月份,百度又公布了一個全新的模塊:ApolloScape。你可以把它看作是 Apollo 平臺下一個相對獨立的「子品牌」。它的本質是一個公開的數據集,包含自動駕駛數據和仿真技術兩個部分。
自動駕駛數據將包括具有高分辨率圖像和像素級別標注的 RGB 視頻,具有場景級語義分割的密集三維點云、基于雙目立體視覺的視頻和全景圖像。數據集中提供的圖像為通過采集系統每米采集一幀的方式采集,分辨率為 3384 x 2710。
百度數據采集車是配備了高分辨率相機和 Riegl 采集系統的中型 SUV。采集場景包括不同城市的不同交通狀況的道路行駛數據,平均每張圖中移動障礙物的數量從幾十到上百不等。(例如,單張圖像中多達 162 輛交通工具或 80 名行人)
除了采集數據之外,百度還會用自己的視覺感知算法給每一幀畫面中的像素做相應的語義分割。當前支持的語義分割種類已經達到了 25 項,包括車輛、行人、自行車、摩托車、道路、交通標識等等。這樣的分割有助于開發者可以在這個數據集中直接訓練以及驗證自己的自動駕駛算法。換言之這套數據集是可以讓開發者直接拿來就用的,而不用再做初始的數據解析。
截止到今年 3 月 8 日,百度共發布了包含 74555 幀視頻圖像序列及對應的逐像素標注和姿態文件。從今年到 2019 年底,百度計劃在數據集中陸續加入更改多傳感器支持以及更廣泛的數據覆蓋面。同時,百度還計劃在今年年底引入「眾包」的數據采集模式,用于收集更多的罕見交通場景。
而在仿真技術上,百度也將逐漸開放行駛軌跡制定,駕駛決策模塊,以及感知融合和導航等模塊。這也是為了能夠更方便的讓開發者驗證和訓練自己的算法。
ApolloScape 的定位
可以明顯的感受到,百度希望通過 ApolloScape 這個數據集吸引到更多的開發者來參與到 Apollo 計劃中。但是為何要建立一個獨立的子品牌?這里有什么特殊的定位嗎?
在 4 月 24 日 ApolloScape 舉辦的一場學術峰會中,小編找到了答案:來參加會議的分享者全部是來自中、美、德、澳等國內外的自動駕駛/機器視覺研究專家。ApolloScape 正在嘗試打通自動駕駛產業界和學術界,搭建自動駕駛產學研結合的交流平臺。
在自動駕駛領域一直有兩個研究方向:落地應用和前沿學術。
落地應用: 主要指的是汽車廠商和零部件供應商,他們更加關注自動駕駛技術如何在現有產品上落地,以及自動駕駛會對汽車行業的商業模式產生怎樣的影響。
前沿學術: 主要指的是一些知名高校、研究機構或者是創新科技公司。他們主要關注的是機器視覺、人工智能等技術在自動駕駛推動下的技術革新。
由于落地應用上直接關系到商業利益,因此一般情況下,汽車廠商對于數據的態度都是比較封閉的。
反倒是以高校為主的前沿學術領域,由于大家的目標都是推動技術創新,且相互之間利益關系相對簡單。因此對數據開放的接受度很高。
其實在前沿學術領域,已經出現過幾個自動駕駛的開放數據集了,最著名的應該就是由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯合創辦 KITTI。很多研究機構都會在 KITTI 數據集內驗證、評估自己的視覺算法。甚至還將 KITTI 作為一個評判標準來做算法排名。
百度這次的 ApolloScape 其實與 KITTI 的定位是一致的,只不過將數據的核心采集點設定在了中國。由于中國在政策以及駕駛環境上的特殊性,一般的研究機構(尤其是海外的)要是想要靠自己在中國獲得駕駛數據是非常困難的。而百度這次的數據集就是為這些研究機構提供了便利。
Kitti,CityScapes 和 ApolloScape 關于數據實例的對比
據了解,Apollo 開放平臺還與加州大學伯克利分校在 CVPR 2018(IEEE 國際計算機視覺與模式識別會議)期間聯合舉辦自動駕駛研討會(Workshop on Autonomous Driving),基于 ApolloScape 的大規模數據集定義了多項任務挑戰。WAD 已正式于國外知名機器學習競賽平臺 Kaggle 上線 Video Segmentation Challenge(視頻場景解析挑戰賽),比賽中所提供的數據集中將包含大量的分段原始駕駛圖像,包含有 20+種場景標注信息。賽事將持續到 6 月 12 日。目前已有來自全球的三十多只隊伍正式報名參加。
其實在自動駕駛領域,應用和學術一直是兩個相輔相成的方向。比如在應用領域的標桿企業 Mobileye,其靈魂人物 Shashua 教授同樣也擁有著很高的學術地位,從學術領域跳槽到應用企業就職的人也屢見不鮮。
畢竟前沿學術的成果,最終也會落地到實際應用領域,只不過是時間早晚的問題。百度這次的 ApolloScape 計劃估計也是在默默地為自己的底層技術創新以及人才聚集做儲備。
