2016 年 AlphaGo 戰勝世界棋王李世乭,被認為是人工智慧重要的里程碑。
之後 AlphaGo 又擊敗了世界排名第一的圍棋選手柯潔,AI 也在德州撲克、Dota 2 等遊戲戰勝了職業玩家,越來越聰明的 AI 甚至開始讓人類心生畏懼。
▲ 柯潔與 AlphaGo 對戰。
然而,這些 AI 表面聰明,實際上連國中考試都無法及格。
據《紐約時報》報導,最近西雅圖著名的艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)終於取得新突破,其 AI 系統之一通過 8 年級(等於台灣國二)的科學考試,正確回答 90% 以上問題,而在 12 年級考試(等於台灣高三)也正確回答超過 80% 的問題。
你可能會說,不就是國中考試嗎?對連頂尖圍棋選手都能打敗的 AI 來說,有什麼了不起?
其實國中考試不只是很多學生的痛苦回憶,也是 AI 難以企及的高度。
就在 AlphaGo 擊敗李世乭那一年,艾倫人工智慧研究所也舉辦了另一場 AI 競賽,邀請世界各國共 800 個研究團隊開發能通過 8 年級科學考試的 AI 程式。
結果得分最高的 AI 程式,也只能正確回答 59% 問題,也就是不及格。
有那麼難嗎?按照我們學生時的考試對策,就狂做考古題啊,看不懂就死記硬背,反正 AI 的記憶力比人類好太多,也能儲存更多資料。
然而這些 AI 要面對的 8 年級試題並不是簡單問答如「眼鏡是透過哪個部分接收光線」這類題目,而是要將多個概念結合歸納回答的題目,如 2016 年的考題:
一些魚類成年後一直生活在鹹水環境,卻能在淡水產卵,牠們可在不同環境生存的能力是____的例子?
此外,測試還有複選題,儘管 AI 擁有深度神經網路等技術,還是很難回答。艾倫人工智慧研究所 CEO Oren Etzioni 解釋原因: 這涉及自然語言理解,需要學習並理解教科書的意思,要正確回答這些問題需要更多推理,因此挑戰的難度也更高。
簡單來說,AI 做不好 8 年級測試是因為無法理解人類的閱讀和理解模式,相反地,如果 AI 能在考試取得高分,就意味著 AI 像人類一樣思考的能力更強了。
最新的測試中,艾倫人工智慧研究所使用的 AI「Aristo」,是在 Google AI 團隊開發的語言表徵模型 Bert 基礎上改進,Bert 學習維基百科的資料庫和數位圖書館大量書籍後,閱讀理解能力取得重大進步,其中兩項指標更遠超人類。 Bert 模型也被認為是自然語言處理(NLP)的重要歷史突破,Bert 透過分析文字來推斷句子缺少的單詞。
進化版 Aristo 經過學習後,已可回答一些複雜的問題。這次測試主題同樣要考驗 AI 的邏輯分析能力,比如這道選擇題: 哪種變化最可能導致某個地區的松鼠數量減少? (1)捕食者數量減少 (2)松鼠之間競爭減少 (3)可獲得的食物增加 (4)森林火災次數增加
這問題的答案並不存在某個資料庫,可讓 AI 死記硬背,而是要分析找到選項之間的關聯,如火災增加會直接殺死松鼠,也可能導致減少松鼠繁殖和生存所需的食物量。
這次 AI 已能自主思考問題並得出正確答案,是否意味著機器很快就能像人類思考?很遺憾,儘管 AI 在自然語言處理取得新突破,但只是人類理解力的皮毛。
AI 一思考,人類就發笑。現階段人類依然是 AI 的上帝,目前人工智慧還是處於弱人工智慧(Artificial Narrow Intelligence ) 階段:擁有強大的計算能力,但只在某方面比人類強,如 Siri 和 AlphaGo。
艾倫人工智慧研究所的研究,就是嘗試將 AI 朝強人工智慧(Artificial General Intelligence)發展,屆時 AI 甚至能擁有人類的批判性思維和抽象思考。
前幾天曝光的全球首個「數位人類」AndyBot,將人的樣貌、聲音、記憶等眾多資訊與 AI 結合儲存在雲端,讓親人去世後還可與之交談。
▲ Andrew Kaplan 同意成為第一個「數位人類」。
不過,這不是《黑鏡》第三季的「聖朱尼佩洛」,人類可將意識上傳到伺服器,實現雲端永生。與你對話的「數位人類」,只是 AI 根據之前資料分析後模擬出的數位人。
對這類產品,AI 對自然語言的理解,或是能否像人類一樣思考,就至關重要了。開發「數位人類」的 Fable 公司首席執行長 Edward Saatchi 表示,要讓電腦像人類處理多回合對話,即使不花上幾十年,也需要數年時間。
因此他認為現階段更現實的目標,還是讓數位人能分享關於自己的一生。如果 AI 真的掌握思考能力,那麼完全可透過 AI「複製」一個人,這「數位複製人」也許能代替我們完成很多繁瑣的工作,也可能像科幻電影那樣反抗人類。
儘管這未來還很遙遠,但我們的確讓 AI 的思考能力越來越強。 |