中科慧拓2篇論文入選ECCV2024，深度估計算法再獲新突破

2024年10月12日 07:35 中科慧拓WAYTOUS 責(zé)編：戚金榮作者：中科慧拓WAYTOUS

語音播報

點擊播放

ECCV,即歐洲計算機視覺國際會議，是計算機視覺領(lǐng)域中最頂級的會議之一，與ICCV和CVPR并稱為計算機視覺領(lǐng)域的“三大頂會”。ECCV每兩年舉行一次，其專業(yè)性、權(quán)威性和高含金量廣受認(rèn)可。據(jù)官方透露，ECCV2024共接收論文8585篇，創(chuàng)下歷史新高，最終錄用論文2395篇，接收率為27.9%。

中科慧拓入選的2篇論文研究成果分別為《DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation》,《Generative End-to-End Autonomous Driving》。

Generative End-to-End Autonomous Driving

中科慧拓提出了GenAD，這是第一個將自動駕駛轉(zhuǎn)化為生成建模問題的生成框架，在以視覺為中心的端到端自動駕駛方面實現(xiàn)了最先進(jìn)的性能，并且效率很高。

該技術(shù)顛覆了UniAD的漸進(jìn)式流程端到端方案，探討了一種新的端到端自動駕駛范式，關(guān)鍵在于采用生成式人工智能的方式預(yù)測自車和周圍環(huán)境在過去場景中的時序演變方式。

技術(shù)上本方案提出以實例中心的場景表示，首先將周圍場景轉(zhuǎn)換為地圖和感知實例。然后，使用變分自編碼器在結(jié)構(gòu)潛在空間中學(xué)習(xí)未來軌跡分布，用于軌跡先驗建模。進(jìn)一步采用時序模型來捕捉潛在空間中的代理和自車運動，以生成更有效的未來軌跡。最終，GenAD通過在學(xué)習(xí)的結(jié)構(gòu)潛在高斯空間分布中采樣，并使用學(xué)習(xí)的時序模型生成未來信息，同時執(zhí)行運動預(yù)測和規(guī)劃。該模型在城市場景數(shù)據(jù)集Nuscenes已經(jīng)取得了SOTA的性能，并在實時性能上遠(yuǎn)超UniAD。

DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation

中科慧拓提出了DiffusionDepth，一種新的單目深度估計方法，將單目深度估計任務(wù)重新建模為去噪擴(kuò)散過程。該模型通過單目RGB圖像的特征為條件引導(dǎo)，迭代地將隨機深度分布精細(xì)化為詳細(xì)的深度圖，克服了生成模型應(yīng)用于稀疏真值深度場景的局限性。實驗結(jié)果表明，在KITTI和NYU-Depth-V2數(shù)據(jù)集上，DiffusionDepth達(dá)到了最新的性能。

本次入選ECCV的兩篇論文，充分展示了中科慧拓在自動駕駛視覺感知技術(shù)領(lǐng)域的強大研發(fā)能力。這一成就不僅證明了公司在該領(lǐng)域的領(lǐng)先地位，還彰顯了公司科研成果的國際影響力。展望未來，中科慧拓將繼續(xù)踐行“長期主義”戰(zhàn)略，平衡技術(shù)突破與商業(yè)化推進(jìn)。公司將持續(xù)專注于核心技術(shù)的深耕與創(chuàng)新，并大力推動量產(chǎn)項目的落地實施，為自動駕駛行業(yè)的發(fā)展貢獻(xiàn)力量。

往期推薦

客戶之聲｜哈爾烏素露天煤礦無人駕駛編組數(shù)量增至4個！

客戶之聲｜央視關(guān)注的無人礦卡大揭秘！

了解慧拓文化

關(guān)注愚公博士

閱讀原文

進(jìn)入官方知乎

點擊“在看

資訊不錯過

聲明：本文系轉(zhuǎn)載自互聯(lián)網(wǎng)，請讀者僅作參考，并自行核實相關(guān)內(nèi)容。若對該稿件內(nèi)容有任何疑問或質(zhì)疑，請立即與鐵甲網(wǎng)聯(lián)系，本網(wǎng)將迅速給您回應(yīng)并做處理，再次感謝您的閱讀與關(guān)注。

相關(guān)文章

我要評論

表情

不想錯過新鮮資訊？
微信"掃一掃"

大家都在看

中科慧拓2篇論文入選ECCV2024，深度估計算法再獲新突破

中科慧拓2篇論文入選ECCV2024，深度估計算法再獲新突破