Depth Anything代表了單眼深度感知領域的突破性進步。


單目深度感知是(shì) 3D 計算機視(shì)覺的關鍵方面,它能夠從(cóng)單個二維圖像估計三維結構。與依賴多(duō)個視(shì)點來(lái)推斷深度的立體(tǐ)技術不(bù)同,單目深度感知算法必須從(cóng)各種圖像特征(例如紋理梯度、對象大(dà)小(xiǎo)、陰影和透視(shì))中提取深度線索。

心理學研究表明,人(rén)類視(shì)覺系統利用一系列線索(包括線性透視(shì)、紋理梯度和運動視(shì)差)來(lái)測量深度。利用這(zhè)些見(jiàn)解,計算機視(shì)覺研究人(rén)員(yuán)開(kāi)發了模仿這(zhè)種功能的算法,利用單個圖像中的模式和不(bù)一緻性來(lái)估計距離(lí)。