繼 AlphaGo 之後,人工智慧已在無數的遊戲領域擊敗人類,而微軟亞洲研究院(MSRA)打造的 AI 系統「Super Phoenix」(Suphx),近期也在人們相當熟悉的遊戲嶄露頭角:麻將。
與圍棋等棋類遊戲不同,麻將是典型的不完美資訊(Imperfect Information)遊戲,玩家在整場遊戲都無法掌握許多資訊,他們必須考慮對手手上未知的牌來決定如何棄牌及虛張聲勢,出牌順序還可能因碰槓改變。
除此之外,以 Suphx 主要訓練的日本麻將規則為例,遊戲常常以半莊為單位進行,這意味著一場遊戲包含 8 局,結束後得比較 8 局總得分才能分出排名,AI 得因應不斷變動的局勢調整策略,這種複雜的獎勵機制可說進一步提高推理和決策水準的需求。
微軟亞洲研究院院長洪小文表示,好的麻將玩家得依靠觀察、直覺、戰略、計算和機會的組合,這也為 AI 系統帶來獨特的挑戰。
「麻將比其他棋盤遊戲更複雜,玩法既是藝術也是科學」。
為了讓 Suphx 能與人類玩家切磋中學習,研究團隊在今年 3 月開始讓 Suphx 登上日本麻將遊戲平台「天鳳」(Tenhou)與人對戰。
截至 6 月,Suphx 參與近 5,000 場牌局,從中找到自己的遊戲風格,學會如何在攻擊和防禦打法間找到平衡,戰略性權衡短期損失與長期收益,並使用模糊的數據做決策。
通過天鳳的段位競賽後,Suphx 現在已有專家級麻將玩家水準,成為第一個進入天鳳十段排名的 AI 系統,即使是網站註冊的 30 萬名人類玩家也只有 180 人左右曾經做到。
▲ Suphx 經常在牌局表現良好,但偶爾也是會放槍。(Source:天鳳網站牌譜截圖 )但這並不意味著 Suphx 就能像 AlphaGo Master 從此戰無不勝;與圍棋不同,麻將仍有不小運氣成分存在,即使是精於計算的 AI 也無法完全掌握隨機性,只能嘗試做到最好。
有趣的是,就像 AlphaGo 為圍棋選手帶來全新思路,Suphx 的獨特打牌風格也在網路引起不小風潮,日本職業雀士、被天鳳譽為「日本麻將最強玩家」的朝倉康心便曾在推特表示,看完 Suphx 的對局後,有種看到隱士高手的感覺。 [TwitterEmbed]https://twitter.com/asakurapinpin/status/1142473124081913856[/TwitterEmbed]
▲ 「稍微看了 suphx 的對局,有種《獵人》漫畫尼特羅會長看到尼飛彼多的感覺。」 6 月初達到 10 段後,研究團隊宣布 Suphx 將「入場維修」,暫時停止與玩家對戰,待系統調整完後會再展開麻將之旅。究竟 Suphx 出關後會不會再有驚人突破,相當值得期待。 |