寫詩看圖就好不用走七步！台大學生做出AI「曹植」

2017年05月29日 01:00

記者莊友直／台北報導

大家想必都知道曹植「七步成詩」的典故，如今藉由人工智慧的威能，不用走七步，或許「七秒」內就能做一首詩了！微軟在先前的 Academic Day 2017 主題演講中，來自台灣大學資工研究所的學生團隊，就成功作出讓 AI 「看圖作詩」的強大功夫！

這項計畫是由在微軟亞洲研究院時期的臺灣大學資工研究所研究生吳肇中、網路多媒體研究所畢業生鄭文峰所計畫，並由臺灣大學徐宏民、林守德教授和 MSRA 研究員宋睿華所指導。藉由人工智慧深度學習演算法的技術，讓電腦能透過偵測不同的圖片，藉此分析內部物件，並做出一首四句的現代新詩。

[廣告] 請繼續往下閱讀.

▼這項程式其實應用了 AI 中的深度學習，藉由廣納詩集和圖像分析技術，讓程式能自行「看圖作詩」。（圖／記者莊友直攝）

現場展示時可透過電腦與手機 APP 的不同介面，可藉由傳送圖片、或現場拍照（手機）的方式讓 AI 辨識並開始做詩；但畢竟是沒有規律的關係，同一張圖片在不同的辨識之下，也會有不一樣的詩句內容，可玩性其實還蠻大的。

▼不僅一般電腦可行，就連手機也有專屬 APP 可用。（圖／記者莊友直攝）

▼由於辨認技術的關係，同一張圖片在多次偵測後，寫出來的詩也不一樣，這點跟人類倒是蠻像的。（圖／記者莊友直攝）

被問到為何不做古詩時，團隊指出其實這樣的技術早期就有了，而且現代新詩不像古詩有著平仄等規律變化，在實作上反而難度更高。這項程式也收集了高達 519 位詩人作品，將比較常出現的詞語歸納化。除了在中國大陸出了詩集外，近期更獲微軟旗下的人工智慧機器人「小冰」團隊關注，先前還曾開放限時體驗；但目前已經停止了。

[廣告] 請繼續往下閱讀...

▼先前這項服務也登上了微軟智慧機器人「小冰」，但目前已經下架。（圖／記者莊友直攝）

另外，同場也有另一項利用影像辨識即時分析物體的 AI 應用「Seeing Bot」，藉由像是 Webcam 等影像辨識裝置，程式在感知接收到的畫面後，就會精準描述場景內容；但實際測試之下誤差度還是算大，可能會把黑桌當成鋼琴，或是同樣場景出現不同辨識語句的狀況，恐怕還有一段長路要走。

[廣告] 請繼續往下閱讀...

▲▼另外，同場也有偵測圖像並即時描述物件的 Seeing Bot 應用，可惜在複雜的場景中，準確度還有待加強。（圖／記者莊友直攝）