ECCV,即歐洲計算機視覺國際會議,是計算機視覺領(lǐng)域中最頂級的會議之一,與ICCV和CVPR并稱為計算機視覺領(lǐng)域的“三大頂會”。ECCV每兩年舉行一次,其專業(yè)性、權(quán)威性和高含金量廣受認(rèn)可。據(jù)官方透露,ECCV2024共接收論文8585篇,創(chuàng)下歷史新高,最終錄用論文2395篇,接收率為27.9%。
中科慧拓入選的2篇論文研究成果分別為《DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation》,《Generative End-to-End Autonomous Driving》。
Generative End-to-End Autonomous Driving
中科慧拓提出了GenAD,這是第一個將自動駕駛轉(zhuǎn)化為生成建模問題的生成框架,在以視覺為中心的端到端自動駕駛方面實現(xiàn)了最先進(jìn)的性能,并且效率很高。
該技術(shù)顛覆了UniAD的漸進(jìn)式流程端到端方案,探討了一種新的端到端自動駕駛范式,關(guān)鍵在于采用生成式人工智能的方式預(yù)測自車和周圍環(huán)境在過去場景中的時序演變方式。
技術(shù)上本方案提出以實例中心的場景表示,首先將周圍場景轉(zhuǎn)換為地圖和感知實例。然后,使用變分自編碼器在結(jié)構(gòu)潛在空間中學(xué)習(xí)未來軌跡分布,用于軌跡先驗建模。進(jìn)一步采用時序模型來捕捉潛在空間中的代理和自車運動,以生成更有效的未來軌跡。最終,GenAD通過在學(xué)習(xí)的結(jié)構(gòu)潛在高斯空間分布中采樣,并使用學(xué)習(xí)的時序模型生成未來信息,同時執(zhí)行運動預(yù)測和規(guī)劃。該模型在城市場景數(shù)據(jù)集Nuscenes已經(jīng)取得了SOTA的性能,并在實時性能上遠(yuǎn)超UniAD。
DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation
中科慧拓提出了DiffusionDepth,一種新的單目深度估計方法,將單目深度估計任務(wù)重新建模為去噪擴(kuò)散過程。該模型通過單目RGB圖像的特征為條件引導(dǎo),迭代地將隨機深度分布精細(xì)化為詳細(xì)的深度圖,克服了生成模型應(yīng)用于稀疏真值深度場景的局限性。實驗結(jié)果表明,在KITTI和NYU-Depth-V2數(shù)據(jù)集上,DiffusionDepth達(dá)到了最新的性能。
本次入選ECCV的兩篇論文,充分展示了中科慧拓在自動駕駛視覺感知技術(shù)領(lǐng)域的強大研發(fā)能力。這一成就不僅證明了公司在該領(lǐng)域的領(lǐng)先地位,還彰顯了公司科研成果的國際影響力。展望未來,中科慧拓將繼續(xù)踐行“長期主義”戰(zhàn)略,平衡技術(shù)突破與商業(yè)化推進(jìn)。公司將持續(xù)專注于核心技術(shù)的深耕與創(chuàng)新,并大力推動量產(chǎn)項目的落地實施,為自動駕駛行業(yè)的發(fā)展貢獻(xiàn)力量。
往期推薦
客戶之聲|哈爾烏素露天煤礦無人駕駛編組數(shù)量增至4個!
了解慧拓文化
關(guān)注愚公博士
閱讀原文
進(jìn)入官方知乎
點擊“在看
資訊不錯過
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請讀者僅作參考,并自行核實相關(guān)內(nèi)容。若對該稿件內(nèi)容有任何疑問或質(zhì)疑,請立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做處理,再次感謝您的閱讀與關(guān)注。
不想錯過新鮮資訊?
微信"掃一掃"