我們都知道電腦會完全按照我們的要求去做,這點在神經網路的訓練也是如此,AI 會嘗試各種方法達成團隊設定的目標,然而史丹佛大學和 Google 團隊在 2017 年訓練 AI 轉換地圖的研究發現,如果表達不夠清楚,AI 也是會找到方法「偷吃步」達成目標。
2017 年的這項研究中,研究團隊開發出稱為 CycleGAN 的神經網路,希望透過大量訓練,讓 CycleGAN 學會有效準確地將地圖在「衛星地圖」和「街道地圖」間互相轉換。
訓練過程中,CycleGAN 的表現都非常好,甚至有些太好了──即使團隊要求 CycleGAN 從轉換完成的街道地圖重建衛星照片時,CycleGAN 也能「完美」做到,甚至一些在街道地圖消失的細節又平空冒出,這引起團隊的懷疑。
雖然我們難以深入了解 AI 神經網路的處理訊息過程,但團隊還是可以輕鬆審核生成的數據,透過一些實驗,他們終究發現 CycleGAN 究竟動了什麼手腳讓自己表現完美。
訓練 CycleGAN 轉換兩種地圖過程中,團隊目的是希望 AI 能解讀兩種地圖的任何一種特徵,並且將其與另一種地圖的正確特徵互相匹配,然而實際上 CycleGAN 被評分的關鍵是「衛星地圖與原始地圖有多接近」以及「街道地圖有多清晰」,而問題正出於此。
CycleGAN 並沒有達成團隊希望達成的目標,學會如何將一個地圖轉換為另一個。相反的,CycleGAN 學會的,是如何在評分時取得高分:透過將特徵巧妙編碼到另一張圖片,CycleGAN 讓衛星地圖的細節變成在街道地圖只有 AI 可見的「小抄」。 ▲ (a)為來源圖片,(b)為 CycleGAN 製作的街道圖片,(c)是電腦展現的可視化細微差別,(d)為 CycleGAN 用街景圖重建的衛星圖片。
從(c)圖你可看到 CycleGAN 在街道地圖暗藏了和衛星地圖一樣的形狀,但除非這些差別仔細放大並突顯,人們永遠無法注意到,但這些人眼難以察覺的數千個微小顏色變化,電腦卻可以輕鬆偵測並使用。
事實上,電腦非常擅長將這些細節藏入街道地圖,CycleGAN 已學會將任何衛星地圖編碼成為任何街道地圖,它甚至不必知道相對街道地圖長得如何,研究人員證實,CycleGAN 可將衛星照片的所有數據無差別疊加在完全不同的街道地圖上。
將數據編碼到圖像的做法並不新鮮,這種技術稱為「隱寫術」(steganography),經常用於浮水印圖片或在相片加入拍攝的相機相關設定,但 AI 能找到方式創造自己的隱寫術,以另一種方式達到任務目標還是很新奇。
有些人可能會認為這顯示機器越來越聰明,然而事實上是,就像人類在一些情況下選擇「偷吃步」或「作弊」,這反而意味著 CycleGAN 並不夠聰明,正因為無法做到將這些複雜的圖像類型相互轉換,它取而代之找到一種人類難以察覺其中異樣的方式來達成任務。
可想見研究者未來將會以更嚴格的評估方式來避免這種情況,這也為我們提供一個觀點:與往常一樣,電腦完全按照人類的要求操作,因此在開口前,你最好非常非常具體了解自己要求了什麼。
在這種情況下,電腦選擇了一個有趣的解決方案,揭示了這類型的神經網路可能有的弱點,也就是如果沒有明確禁止這麼做,電腦基本上會找到一種方法將細節傳輸給自己,以便快速輕鬆解決特定問題。 |