【科普論壇】“像嬰兒一樣思考”Deep Mind最新研究讓AI有人一樣的直覺感知
撰文| 徐詩露
來源|《返樸》(微信ID:fanpu2019)
早在機器人問世之時,就有許多人想像過:如果機器人能夠像人一樣思考,世界將會變成什麼樣子?這個問題已經塵封多年,但是近期的一項發表在《自然•人類行為》上的研究顯示,人工智能或許擁有了“像嬰兒一樣思考”的能力:能像嬰兒一樣理解直觀物理學。值得一提的是,這是知名人工智能公司Deep Mind科研人員發表的成果。
Luis Piloto和他的同事做了一個能學習直觀物理學的深度學習系統,名為PLATO。PLATO包含的系統受到了嬰兒學習方法相關研究的啟發。並且,PLATO遵循認為物體在我們周圍物理世界的表示和預測中扮演核心作用的理論。
具體來說,研究者通過給PLATO觀看許多描繪簡單場景的視頻來訓練它,比如球落到地上,球滾到其他物體後面又再次出現,很多球之間彈來彈去。訓練之後,PLATO在看到沒有意義的場景(如物體互相穿過卻沒有發生相互作用)時表現出了像人類嬰兒那樣“驚訝”。
令人驚訝的是,PLATO只觀看了28小時的視頻就獲得了以上學習效果。我們不禁發問,直觀物理學是什麼,嬰兒是如何理解它的?AI又是如何學到這一點的呢?
嬰兒眼裡的直觀物理學是什麼?
首先我們來明確一個概念,直觀物理學是什麼?我們可以簡單地把它理解為“直覺”或者“常識”。
比如我們在桌子上方丟下一串鑰匙,所有人都知道,鑰匙不會漂浮在半空中,也不會穿過桌面掉到地上,而是會掉落在桌面上。這就是“直觀物理學”,它是我們瞭解世界的基礎物理概念,也是思維中“常識”的關鍵組成部分。
在發展心理學領域中,直觀物理學被分為5個方面的概念:
1. 連續性:物體不會從一個地方傳送到另一個地方,而是在時間和空間中有一定的連續路徑;2. 物件持久性:物體在看不見時不會消失;3. 固體性:物體不會相互滲透;4. 不變性:物件的屬性(如形狀)不會更改;5. 定向慣性:物體運動的路徑與慣性原理一致。
是不是每一個都很好理解?沒錯,這些都是我們容易理解和接受的“常識性”概念。
如果鑰匙的掉落過程違背了我們的常識,比如懸浮在了半空中、或者穿過了桌子、或者是從桌面上duang的一下彈起來老高,甚至是化成了液體,那麼事情就會超出我們的預期,變得詭異起來。
面對這種怪異事件,每個人都會感到驚訝。即使是三個月大的嬰兒也是一樣,他們也會對這樣違背直觀物理學的現象表現出驚訝,這種驚訝反應被稱為違反期望(VoE)效應。至於嬰兒對世界的認識是否和成人一樣,這一點存在一個關於“先天”和“後天”的爭議,許多發展科學家認為這是“先天”的,也有一些學者更支持從無到有的“後天”理論。
那我們能否設計一個類比嬰兒思維的程式,通過適當的訓練,使AI能夠像嬰兒一樣思考呢?
如何把AI訓練得像嬰兒一樣思考?
為了探究這個爭論不休的“先天”和“後天”問題,Piloto等人利用PLATO模擬系統,來測試深度學習系統是否能夠通過學習視覺動畫,來獲得對直觀物理學的理解。如果“後天”的理論是正確的,那麼智力發展的關鍵就在於通過處理大量經驗和大量數據來進行鍛煉。
而這項研究使用的訓練數據少到驚人,就讓AI擁有了穩定的違反期望效應。在面對超出5個直觀物理學概念的情況時,PLATO仿真系統會顯示出魯棒(即具有穩定性)的VoE效應。這可以解釋一些直觀物理學的概念,但是這種效應與嬰兒身上看到的現象並不完全一致。
研究發現,雖然視覺動畫的經驗對智力發展有很重要的貢獻,但不足以解釋我們在嬰兒身上看到的現象。
也就是說,智力發展並非全部依靠於“後天”的經驗和數據。要形成完整的智力,還需要一些先天的認知,這項研究在“先天”派和“後天”派之間建立了一個有趣的中間立場。
此外,PLATO仿真系統可以將符合直觀物理學的期望,歸納為一組與訓練中不相同的對象和事件。其次,儘管只是接受了相對較少的視覺動畫訓練,這個仿真系統也能夠成功地演示學習,在針對嬰兒研究中也有相似的特徵。
可以看到,將仿真建模的工作和發展心理學中的關鍵問題融合起來,研究人員得到了意想不到的效果和結論。
目前,研究團隊正在將違反期望效應的研究擴展到神經生理學領域,這可能為後續的研究開闢新的可能性,也為AI的發展提供了更多的可能。(完)
《返朴》:科学家领航的好科普
新媒體編輯:爾雨林
審核校對:肖黎