▲AI 藉由不同角度的平面照片,生成立體的圖型。(圖/翻攝 TechCrunch)
記者黃肇祥/綜合報導
AI 沒有人類的視覺神經,不像我們看到照片就能想像背後的聲音與實際場景。尤其是對於立體與平面的判斷,人類可以輕易猜想實際模樣,但若給 AI 看平面照片,系統是無法自動生產 3D 的想像畫面。Google DeepMind 團隊的一份研究,讓 AI 藉由觀察生成 3D 的畫面。
從 DeepMind 所釋出的實驗影片來看,研究團隊將一個場景以不同角度拍攝三次,AI 藉此分析場景架構,最後製作出一部 360 度立體的畫面。AI 系統分成兩個部分,首先觀察場景,對角度、形狀等條件進行編碼,並套用複雜的數學公式,另一部分則是生產,依據前面累積的數據,對預測的場景進行模擬。
此外,研究還展示從單一視角,創作出 3D 模型的技術。
研究人員 Ali Eslam 於報告中寫道,目前還不清楚系統對於物件生產的能力,是否能保持精確,「然而我們發現,這種深度學習機制可以理解角度、遮蔽物、光影,且無須任何人為介入,這是驚奇的成果。」
從平面照片去生成立體畫面,這種想像力對於 AI 來說是相當重要的,除了讓他們具有與人類相當的視覺能力,重要的是不被有限的訊息給限制,若只能看見眼前的物品,無法預判障礙物後的場景,將導致 AI 反應慢半拍或是執行不合理的判斷。
讀者迴響