搜尋
搜 尋
本版
發表
會員
首頁
時事
表特
新奇
娛樂
運動
科技
有趣
登入
註冊
使用者組:LV:0 觀光客
主題
帖子
卡幣
我的帖子
我的收藏
我的好友
我的勳章
設定
登出
卡提諾論壇
»
首頁
›
看板
›
科技
›
DeepMind 打機已經勁過人類,57款遊戲超越 ...
0
3
0
DeepMind 打機已經勁過人類,57款遊戲超越
saber768
發表於 2020-4-4 18:04:36
[顯示全部樓層]
閱讀模式
3
1600
Atari(雅達利) 遊戲作為經典的遊戲始祖,玩家們的樂趣在於如何去獲得最高的分數,打破記錄。而近期,人工智能公司 DeepMind 在官方博客宣布了 AI 挑戰 Atari 遊戲的新進展,稱在57款 Atari 遊戲中實現全面超越人類,是該領域裡的第一次。
在 DeepMind 最新發布的預印本論文和博客中稱,他們構建了一個名為 Agent57 的智能體,通過在街機學習環境(Arcade Learning Environment,ALE)中學習,從而在 57 個 Atari 遊戲中表現超越人類。如果 Agent57 智能體有如此優秀,那麼將會為構建更加強大的 AI 決策模型奠定基礎,可以進行自動推理環境,實現自動化提升生產力。
DeepMind 為什麼選擇用 Atari 遊戲來進行測試呢?其實早在2012年,DeepMind 開發出 Deep Q-Network(DQN),同樣是用於挑戰 Atari 57款遊戲。但當時不能克服四款比較難的遊戲:Montezuma’s Revenge、Pitfall、Solaris 和 Skiing。
這一次同樣採用遊戲的一部分原因可能是想彌補缺憾,另一部分原因是 Atari 遊戲的一些特點。據悉 Atari 有3個特點,第一是遊戲足夠多樣性,可以用來評估智能體的泛化性能;第二是可以模擬真實環境中的情況;第三是因為 Atari 遊戲由獨立的組織構建,可以有效避免實驗偏見。
除此之外,DeepMind 在博客上公佈了 Agent57 的框架,採用強化學習算法,在多台電腦上運行。這可以讓 AI 賦能的智能體選擇最大化獎賞去執行指令。 OpenAI 的 OpenAI Five 和 DeepMind 的 AlphaStar RL 智能體分別打敗過 99.4% 的 Dota 2 玩家和 99.8% 的星際2玩家。
Agent57 的學習過程是通過把眾多 actor 信息匯總到可以採樣的一個中央存儲庫中來進行學習。 DeepMind 團隊為了更好的的學習,採用兩種不同的 AI 模型來近似每個狀態動作的價值(state-action value),價值能夠決定智能體的執行指令好壞程度,從而提供評估標準,讓智能體適應性選擇使用哪種策略。
這個全新的框架模型有著兩個優勢,一是有著策略優先級選擇,讓 Agent57 去分配更多的網絡容量;二是在評估時採用自然的方式來選擇最佳策略。
Agent57 在與 MuZero、R2D2 和 NGU 等領先算法的比較中,總體上限更高。在訓練 50億幀後就可以在 51種遊戲上超越人類,而在訓練 780億幀後可以在 Skiing 遊戲上超越人類。
雖然 Agent57 已經在51種遊戲上超越了人類,但是 DeepMind 團隊並不滿於此,向我們透漏了下一步計劃「Agent57 最終在所有基準測試集最困難的遊戲中都超過了人類水平。但這並不意味著 Atari 遊戲研究的結束,我們不僅要關注數據效率,也需要關注總體表現……未來的主要改進可能會面向 Agent57 在探索、規劃和信度分配上。」期待在未來,AI 能夠帶來更多生活上的便捷。
回覆
檢舉
已有(3)人回文
電梯直達
升序瀏覽
劉士傑
發表於 2020-4-5 08:42
人工智慧的發展的是越來越進步..從棋藝到電玩通通都被征服啦
回覆
檢舉
gary1968
發表於 2020-4-5 14:10
有時候看到科技發展一日千里會很感動
但有時候也會為擔心電腦會取代人類而憂慮
回覆
檢舉
k2256kk
發表於 2020-4-5 22:20
希望這種人工智慧不會發展到變成魔鬼終結者的天啟
回覆
檢舉
進階模式
B
Color
Image
Link
Quote
Code
Smilies
你需要登入後才可以回覆
登入
|
註冊會員
本版積分規則
發表回文
回覆並轉播
回覆後切換到最後一頁
發表新帖
saber768
LV:9 元老
追蹤
13445
主題
46659
回文
12
粉絲
卡提諾狂新聞
卡提諾論壇 Ck101.com