▲照片並非合成或搜尋而來,是藉由像素畫成。(圖/翻攝微軟)
實習記者黃肇祥/綜合報導
讓 AI 描繪簡單的物體,以現在的技術來說已經不稀奇,但若藉由文字添加更多細節,讓 AI 去畫出更生動的畫面呢?甚至未來只要將動畫的劇本寫好輸入電腦,是否能直接藉由 AI 的能力將畫面完成呢?微軟最新的 AI 技術就希望達成這項目標。
在微軟最新的研究報告中,他們發展出一項技術,讓 AI 分析理解文本的內容,進而繪畫出細緻的圖片,微軟首席研究員何曉東在文章中這麼形容,「如果去 Bing 搜尋一隻鳥,會找到一張鳥的圖片,但微軟 AI 所構置的圖片是由電腦重新開始畫出來的,這支鳥並不存在於現實中,只是由電腦繪畫出來的鳥類。」
▲輸入複雜的句子,AI 會自動滿足其條件。(圖/翻攝微軟)
微軟的 AI 可以生成各類圖片,包含田園風景、草原放牧甚至到晃動的雙層巴士,該技術結合兩種機器學習模型,其中一個是由文字產生畫面,另一種則是透過文字描述判斷影像的正確性,藉由兩者創造出更精確的畫面。
輸入複雜的句子而非單字,AI 會完成句子中的所有條件,例如要求畫一隻黑色翅膀、黃色毛髮的鳥,生成的畫面就會滿足上述設立的條件,不過越複雜的句子自然會影響到畫面最終的準確度,研究中也提到,就算只輸入單一字詞,該 AI 也具備填補空白的能力。
對於這項技術的應用,微軟提到可以作為室內設計師以及畫家的草稿幫手,或是發展成語音工具,藉由聲音去填補照片的細節,若未來 AI 擁有更強大的功能,根據劇本完成動畫作品或是減少電影製作的人力成本,不過該項技術仍不夠成熟,距離正式應用或許還需要一段時間。
讀者迴響