DeepDream 圖像 Google AI 幻夢之鄉

2457

Preview Summary

website Reviews : 30 5.0

最近 Google 釋出 DeepDream 的影像辨識源碼,出乎意料地這種影像的「辨識過程」在人類感受卻如同深沈而糾結的夢境,猶如超現實的輸出圖像增添藝術感。但 DeepDream 的圖片辨識技術並不是 AI 所看到的影像世界;而是 AI 如何看待單一的影像以及它所理解的過程。某些介紹 DeepDream 的文章給了錯誤的訊息,並且忽略了 DeepDream 的本質。

DeepDream 是影像藝術化的美麗錯誤

Google 發展人工網絡智能時,不僅是分析網絡中可蒐集的文字語意,連帶圖片、照片影像與語音系統也帶入網絡神經學習 AI 的世界。最近 Google 釋出 DeepDream 的影像辨識源碼,出乎意料地這種影像的「辨識過程」在人類感受卻如同深沈而糾結的夢境,猶如超現實的辨識層輸出圖像增添藝術感。

DeepDream 簡述

根據美國麻省理工學院電算機科學與人工智能實驗室對於人工神經網絡的解說,影像解析的技術可以透過大量的基礎資料與訓練逐步調整參數,並以數學模型驗證其真偽。人工神經網絡設置 10 ~ 30 層的辨識堆疊層建造神經元,圖像通過每一層的辨識繼續進入下一層更高階的「特徵」辨識,直至輸出層完成分類。

是以 DeepDream 的圖片辨識技術並不是 AI 所看到的影像世界;而是 AI 如何看待單一的影像以及它所理解的過程。某些介紹 DeepDream 的文章給了錯誤的訊息,並且忽略了 DeepDream 的本質。所以下一節將介紹 Deep Dream 的功用。

Deepdream 影像的分類

人類眼中所見的事物究竟如何分辨呢?一張照片的主體又是如何界定呢?例如:見到某位陌生人,我是如何認為他是亞洲人而不會以為是 Caucasian 呢?一張小肥貓在大峽谷旅行的遠鏡頭照片,應該是一張「貓」為主體的照片;還是「大峽谷」的風景照?

DeepDream 測試

Google DeepDream 在分類時最終輸出項可以將一幀照片歸類為「多種可能性」,你可以嘗試上傳圖像或圖片網址至 Caffe Demos,其輸出結果顯示該影像被辨識神經元歸類的最大值。此類似 Google Images 分析只需要加上其他的參數,即可提高準確性,例如:檔案命名、Exif、地理座標。

圖像分析的功用

如果認為 DeepDream 只是個網路風潮,玩弄惡搞照片的新玩意,那可惜了!我舉一個小實例來解釋它的功用。無論你是一個圖像設計者,或是網路電子商務的經營身份,一張可靠分析過的圖像更能吸引「標的人口」的好感。要知道人工智能是仿效人類的認知,這些主觀的認知條件在客觀的大數據佔比中提供可靠的「訊息」,而這些訊息可能連本人都不自覺。

假設您從事銀髮族健康照顧相關的網路生意,請嘗試將網站內主要圖片輸入分析(或是將整個網站頁面截圖)。如果輸出分類包含「恐懼」、「孤單」、「死亡」等關聯字眼,我看您的網站還是趁早修正吧!

設計專屬的夢境圖片

終於談到如何製作 Deep Dream 圖片。懂得安裝開源碼請參考 Google GitHub

Download

另一種選擇,經由簡易上傳取得 DeepDream 圖片,請使用 Dreamscope Dreamer 的分析轉譯服務。由於該源碼可自訂各種分析層參數,不同網站源碼設計者的輸出圖像會不一樣;或說強度不同。設定解析輸出的風格類似 Photoshop 的藝術風格濾鏡,點擊本文頂端範例可見燈箱內的比照圖樣。

動物化與變形

或許有讀者疑惑為何動物化出現許多狗狗?其實並非偏好汪星人。文前提過人工神經網絡需要不斷提供資料養分讓它成長,DeepDream 只是一項代碼,無數據庫支援的情形下,在比對生物特徵時僅能依據現有的辨識圖當成參考。基本源碼提供的就是汪星人。

實際上它可以比對更多其他物件特徵,但由於提供的辨識基礎不足反而讓 DeepDream 產生許多變形(不正確的辨識),此種奇妙的意外居然成為美麗的錯誤。

DeepDream 台灣地圖
30
· ·