繼圍棋之後 小精靈遊戲被微軟AI征服了

微軟在部落格中宣佈,旗下Maluuba公司所開發的AI系統在Pac-Man遊戲中獲得系統最高分。(圖/翻攝微軟部落格)

西洋棋、圍棋與德州撲克之後,下一個被AI(人工智慧)征服的挑戰是什麼呢?答案是:小精靈遊戲(Pac-Man)。微軟在今年收購的一家深度學習(deep learning)新創公司,近日發表了最新研究成果,成功在小精靈這款遊戲取得遊戲最高分。看見電腦程式玩得比你我還厲害,真讓人無顏見江東父老了。

根據微軟官方部落格,他們在2017年1月收購的加拿大深度學習新創公司Maluuba,所研發的AI系統在Atari 2600版Pac-Man中成功取得999990的最高分。過往從沒有人類或是AI系統曾達到此一分數,相當值得注目

位於加拿大蒙特婁MaGill大學的電腦科學系副教授Doina Precup表示,這是AI研究者的一個關鍵成就。因爲AI研究者們一直在尋找各類型的遊戲來測試所研發的系統,而Pac-Mac被發現是遊戲當中最難攻克的一款。而不僅對於微軟研發團隊的成就感到印象深刻,Doina Precup更表示,他認爲研發團隊如何找出破解的方法,更是重要!

Maluuba採用的方法很特別。首先他們將過關的策略技巧分爲獨立的元素,例如「吃豆」跟「閃避敵人」,且不同的AI(研發團隊稱之爲agents)則專注於不同的遊戲任務。之後再由更高層的AI agent來決定要優先執行那一種任務。

舉例來說,如果遊戲中有100個AI agent期待往左移動來吃掉一個豆子,但只有3個AI agent決定要往右來躲避敵人。最終最高AI agent的決策會是往右移動,來避免撞上敵人而失敗。

根據微軟部落格,Pac-Man一直以來在AI研究廣泛被使用,因爲玩法具有不可預測性。而Maluuba則運用了強化學習(reinforcement learning)的技術,也就是針對某一個特定問題,讓AI獲得正面或者負面的回饋,來應對不可預測性。這一項技術被認爲可以協助AI系統自動進行決策,因爲提供了正面與負面的的案例,來協助AI系統建立起經驗基礎,與監督式學習(supervised learning,機器學習當中的一種)不同。