人常常會「腦補」,但人工智慧的神經網絡也會嗎?

編譯:林采萱

人類大腦善於依據過往經驗,人常對有「瑕疵」的常會圖像生成有意義的解釋。既然神經網絡號稱是腦補模擬人類神經系統所建立,是但人否也具備類似的「腦補」能力?Google的人工智慧研究團隊設計了一個實驗來驗證這項猜想。

格式塔現象

格式塔心理學最具體的實例:可從A、B、神經C、網絡D圖中可以分別感知到三角形、也會方形、人常球形與直線 | 圖片來源:Wikipedia

20世紀初期,常會三位德國實驗心理學家開始對大腦如何接收外界刺激,腦補並將其整理為有意義資訊的但人傳統說法產生質疑,因而發展出「格式塔心理學」(Gestalt psychology,工智或譯「完形心理學」),神經主張「整體並非僅僅是網絡各組件的總和」。這概念看似抽象,卻能用來解釋許多令人匪解的人類認知現象。例如當我們看到上圖A,三個有缺口的圓形整齊排列,缺口分別對著圖像中心,我們的大腦很自然地就把三個缺口相連,腦補出一個正三角形的圖案,也就是著名的「格式塔現象」。

這顯示人類僅需零碎資訊,便可依據既有的經驗拼湊成完整圖像。在視覺設計領域中格式塔心理學被廣泛運用,藉由圖像的錯動、顏色的轉變,抑或是燈光快速切換形成視錯覺。

閉合律

長期以來,「人工智慧是否具備類似人類的認知能力」,一直是人們很感興趣的議題,只是苦於找不到一個有效的檢驗方法。然而神經網絡的架構便是模仿生物神經系統而來,尤其與靈長類動物的視覺皮質極為相近;而格式塔心理學最成功之處便在於解釋人類視覺認知,上述的格式塔現象即是其中閉合律(Law of Closure)的展現,具體且易於操作,提供了一個絕佳的實驗契機。

Google位在加州山景城(Mountain View)的人工智慧研究部門便針對「三角形錯覺」,設計出一個完整實驗。他們創建了三個圖像資料庫:第一個圖像資料庫由視覺上完整無缺的三角形組成;第二個圖像資料庫則僅勾勒出三角形的三個「角」,神經網絡必須「自行想像」,才有辦法「看見」完整的三角形;第三個圖像資料庫也是由類似「角」的圖案組成,但是彼此無規則地隨機排列,無法延伸、相連、構成完整三角形。

團隊先用第一個圖像資料庫訓練神經網絡識別正常、完整的三角形;再用第二個圖像資料庫測試神經網絡是否有能力與人類一樣,透過延伸與想像從中辨認出三角形、展現格式塔的閉合效應。第三個資料庫則作為對照組,確保神經網路不是單純看見「角」,便判定圖片中有「三角形」。

第二種圖像資料庫之圖形(左),角閉合後可形成三角形;第三種圖像資料庫之圖形(右),無法形成三角形 | 圖片來源:Emerging Technology from the arXiv, 2019

神經網絡與人類認知

除此之外,研究團隊還將訓練有素的神經網絡與未經訓練或經隨機數據訓練的網絡進行了比較,發現:相對於後兩者,經過訓練的神經網絡表現出與人類相似的格式塔現象,極可能與人類有著類似的視覺認知。

此研究將實驗心理學的應用範圍拓展,建立出一個新的試驗範本,可用以探討神經網絡的「心理現象」。未來更可能擴展到其他認知行為、比較人類與神經網絡的認知差異,甚至藉此建立起一個判斷神經網絡提取特徵或表現能力的基準。研究團隊認為,從這個全新的角度出發,有助於人類在往後創建出更強大的神經網絡。

參考資料

  • Emerging Technology from the arXiv. “Trained neural nets perform much like humans on classic psychological tests“, MIT Technology Review, 2019.
  • B. Kim, E. Reif, M. Wattenberg, and S. Bengio, “Do Neural Networks Show Gestalt Phenomena? An Exploration of the Law of Closure“, arXiv, 2019.

【科學史沙龍】秋季講座

從科學的歷史故事中認識科學知識,絕對比課本有趣簡單啦!
科普派必備講座,藝文派延伸外掛。 除了科學知識和歷史故事,還有科學家的小八卦

詳細資訊請參閱活動網頁

延伸閱讀

  • 晴天變落雨、小貓變獅子?人工智能改圖模糊真實界線

本文由臺大科學教育發展中心授權刊登,原文發表於此

責任編輯:丁肇九
核稿編輯:翁世航

苏ICP备16002488号-1