來自雷鋒網(wǎng)(leiphone-sz)的報(bào)道 一向講究開放、不斷吸吸納新成員加入的百度 Apollo 自動(dòng)駕駛平臺(tái),最近「一反常態(tài)」,主動(dòng)宣布加入加州大學(xué)伯克利 DeepDrive 自動(dòng)駕駛產(chǎn)業(yè)聯(lián)盟。 美國時(shí)間 3 月 8 日,百度方面宣布 Apollo 自動(dòng)駕駛開放平臺(tái)正式加入 DeepDrive 深度學(xué)習(xí)自動(dòng)駕駛產(chǎn)業(yè)聯(lián)盟,并發(fā)布了 Apollo 自動(dòng)駕駛數(shù)據(jù)集 ApolloScape。 如此吸引百度 Apollo 平臺(tái)主動(dòng)加入這個(gè)產(chǎn)業(yè)聯(lián)盟,恐怕是后者更為豐富的自動(dòng)駕駛學(xué)術(shù)成果和產(chǎn)業(yè)資源。 如果你對(duì) UC Berkeley(加州大學(xué)伯克利分校)足夠了解,就知道 DeepDrive 是 UC Berkeley 兩大與汽車智能化相關(guān)的實(shí)驗(yàn)室之一(另一個(gè)是 InterACT)。 DeepDrive 的研究成果并非停留在實(shí)驗(yàn)室,而是與產(chǎn)業(yè)界結(jié)合緊密,目前合作伙伴有諸如博世、采埃孚等一級(jí)供應(yīng)商,大眾、本田、現(xiàn)代等車企,恩智浦、英偉達(dá)等芯片廠商,以及華為、馭勢(shì)等中國公司均是其合作對(duì)象。 *Deep Drive研究項(xiàng)目的合作伙伴 而 DeepDrive 深度學(xué)習(xí)自動(dòng)駕駛產(chǎn)業(yè)聯(lián)盟則是由加州大學(xué)伯克利分校領(lǐng)導(dǎo)的研究應(yīng)用于汽車領(lǐng)域的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)前沿技術(shù)的產(chǎn)業(yè)聯(lián)盟。 它的成員包括:英偉達(dá)、高通、通用、福特等 20 家全球自動(dòng)駕駛領(lǐng)域頂尖企業(yè),研究項(xiàng)目覆蓋感知、規(guī)劃決策、深度學(xué)習(xí)等自動(dòng)駕駛關(guān)鍵領(lǐng)域。 百度加入這個(gè)聯(lián)盟的目的,是希望通過攜手全球自動(dòng)駕駛領(lǐng)先企業(yè)以及頂級(jí)學(xué)術(shù)研究機(jī)構(gòu),共享研究成果、加速自動(dòng)駕駛的技術(shù)創(chuàng)新和落地應(yīng)用進(jìn)程,以此來壯大自動(dòng)駕駛研發(fā)力量。 ApolloScape:數(shù)據(jù)量是同類數(shù)據(jù)集10倍以上這次發(fā)布的另一個(gè)看點(diǎn)是百度開放的 ApolloScape 數(shù)據(jù)集。數(shù)據(jù)集一般分為兩類:一類是通用數(shù)據(jù)集,這是由純計(jì)算機(jī)視覺領(lǐng)域提出的數(shù)據(jù)集,這類數(shù)據(jù)集僅僅因?yàn)橛小败嚒钡脑?;另一類是自?dòng)駕駛數(shù)據(jù)集,不光包括計(jì)算機(jī)視覺信息,還有 IMU、GPS 等信息。例如 KITTI,這是目前國際上最大的自動(dòng)駕駛場(chǎng)景下的計(jì)算機(jī)視覺算法評(píng)測(cè)數(shù)據(jù)集,地位不可小覷。 顯然,百度也希望將 ApolloScape 打造成為這樣一個(gè)數(shù)據(jù)集。那么,ApolloScape 數(shù)據(jù)集有哪些亮點(diǎn)呢? 百度認(rèn)為,海量、高質(zhì)的真實(shí)數(shù)據(jù)是自動(dòng)駕駛開發(fā)測(cè)試中必不可缺的「原料」,因此 ApolloScape 的數(shù)據(jù)量是同類數(shù)據(jù)集(如 Cityscapes )的 10 倍以上。 其中,數(shù)據(jù)量?jī)?nèi)容包括:感知、仿真場(chǎng)景、路網(wǎng)數(shù)據(jù)等數(shù)十萬幀逐像素語義分割標(biāo)注的高分辨率圖像數(shù)據(jù)。百度方面介紹,從數(shù)據(jù)難度維度看,ApolloScape 數(shù)據(jù)集涵蓋了更復(fù)雜的道路狀況。一個(gè)例子是單張圖像中多達(dá) 162 輛交通工具或 80 名行人。 除此之外,這個(gè)開放數(shù)據(jù)集采用了逐像素語義分割標(biāo)注的方式,百度稱這是「目前環(huán)境最復(fù)雜、標(biāo)注最精準(zhǔn)、數(shù)據(jù)量最大的自動(dòng)駕駛數(shù)據(jù)集。」 ApolloScape標(biāo)注數(shù)據(jù)示例 ApolloScape深度數(shù)據(jù)示例 Kitti,CityScapes和 ApolloScape 關(guān)于數(shù)據(jù)實(shí)例的對(duì)比 ApolloScape 另一個(gè)特點(diǎn)是包含了數(shù)十萬幀逐像素語義分割標(biāo)注的高分辨率圖像數(shù)據(jù)。 為便于研究人員更好的利用數(shù)據(jù)集的價(jià)值,百度在數(shù)據(jù)集中定義了共 26 個(gè)不同語義項(xiàng)的數(shù)據(jù)實(shí)例(例如汽車、自行車、行人、建筑、路燈等),并將進(jìn)一步涵蓋更復(fù)雜的環(huán)境、天氣和交通狀況等。 數(shù)據(jù)中包含的各類實(shí)例的信息 仿真也是這個(gè)數(shù)據(jù)集的一個(gè)重點(diǎn)項(xiàng)目。百度的目標(biāo)是打造真實(shí)世界還原度最高、場(chǎng)景最豐富的仿真平臺(tái)。 據(jù)雷鋒網(wǎng)了解,基于 Apollo 仿真平臺(tái),ApolloScape 計(jì)劃將數(shù)十輛自動(dòng)駕駛車輛投入到同一個(gè)路網(wǎng)中行駛,通過模擬真實(shí)復(fù)雜駕駛場(chǎng)景和多車博弈過程,幫助研發(fā)人員有效檢驗(yàn)并優(yōu)化預(yù)測(cè)、決策和路徑規(guī)劃等算法,提升自動(dòng)駕駛測(cè)試的多樣性。 為了盤活這個(gè)數(shù)據(jù)集,吸引更多開發(fā)者使用 ApolloScape 數(shù)據(jù)集,在今年的 CVPR 期間,百度 Apollo 將聯(lián)合加州大學(xué)伯克利分校舉辦自動(dòng)駕駛研討會(huì)(Workshop on Autonomous Driving),希望借此為全球自動(dòng)駕駛開發(fā)者和研究人員提供一個(gè)技術(shù)突破和應(yīng)用創(chuàng)新平臺(tái)。 「大系統(tǒng)」與「小模塊」在過去,計(jì)算機(jī)視覺一直面臨的一個(gè)通病是舊的算法在新的數(shù)據(jù)集上不起作用。「我們號(hào)稱解決了一個(gè)問題,只不過是解決了一個(gè)數(shù)據(jù)集,并不能說明我們真正解決了這個(gè)問題,而這種情況經(jīng)常發(fā)生?!箛鴥?nèi)某家自動(dòng)駕駛公司 CTO 對(duì)雷鋒網(wǎng)表示。 舉例而言,我們可以將自動(dòng)駕駛這個(gè)「大系統(tǒng)」拆成 100 個(gè)小的計(jì)算機(jī)視覺問題。 但這里就存在值得深思的兩點(diǎn):第一,我們不知道這 100 個(gè)問題中哪個(gè)問題更重要;第二,我們不知道在解決了哪個(gè)問題、解決到何種程度以后,就能號(hào)稱我們完全解決了自動(dòng)駕駛問題。 所以,如何解決自動(dòng)駕駛「大系統(tǒng)」和自動(dòng)駕駛「小模塊」之間的問題,這才是百度 ApolloScape 數(shù)據(jù)集需要建立的下一步優(yōu)勢(shì),也是從業(yè)者和開發(fā)者們需要的自動(dòng)駕駛數(shù)據(jù)集。 |
|