倍可親

回復: 0
列印 上一主題 下一主題

征服圍棋后,DeepMind為什麼把星際爭霸當成了下個目標

[複製鏈接]

1萬

主題

3萬

帖子

6萬

積分

貝殼光輝歲月

倍可親決策會員(19級)

Rank: 6Rank: 6

積分
60345
跳轉到指定樓層
樓主
新鮮人 發表於 2016-11-21 22:20 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  時間: 2016年11月21日 | 作者: Alex Hern | 來源: 衛報即時戰略

        遊戲會給AI帶來截然不同的挑戰,玩遊戲需要的能力對於處理現實世界的問題來說也是必不可少的。

  

  在亞洲古老的棋盤遊戲——圍棋上取得巨大成功后,DeepMind正計劃研究下一款遊戲,而他們的新目標與圍棋截然不同。

  這家倫敦的AI研發公司是Google的子公司,它正與加州的遊戲公司暴雪(Blizzard)在一款名為星際爭霸II(StarCraft II) 的實時戰略遊戲 (real-time strategy game, RTS) 上展開合作。

  作為一款全球聞名的電子競技遊戲,星際爭霸II滿足了作為DeepMind一個有趣挑戰的許多要求。不僅僅是因為在該遊戲中一流遊戲玩家能輕鬆擊敗頂級AI對手,更是因為這款遊戲會將DeepMind團隊引領到一個新的探索領域。

  最重要的是,星際爭霸II是一款充滿各種隱藏信息的遊戲。每個玩家會在地圖的兩邊開始遊戲,建立極低,訓練士兵,然後找出他們的對手。但是他們僅能直接看到隊伍周圍的區域,剩下的的地圖會隱藏在「戰爭迷霧」當中。

  「玩家必須派出他們的隊伍去偵察未知地圖,以獲取敵人的信息,並需要長時間記住獲取到的信息。」DeepMind在博客上說道。「周圍環境只有部分可見,這使得挑戰更為複雜——這也是星際爭霸和象棋和圍棋這類有完整信息的遊戲之間一個有趣的不同之處。這是一款實時戰略遊戲,雙方玩家都同步進行遊戲,因此必須快速高效地計算出每一個決定。」

  「一個人或者AI要能玩星際爭霸,就需要有效利用記憶力,具有進行長期規劃並根據新的信息調整遊戲策略的能力」

  然而,AI確實具有天生的優勢。頂級星際爭霸玩家排名的一項統計數據是「每分鐘動作」(actions per minutr, APM):實質上是每分鐘點擊的次數。因為沒有手指,肌肉,或是患上肌腱炎的可能性,AI可以在點擊上輕易超越人類玩家,這導致它可以不通過戰略思維,而僅僅通過更快的反應速度獲勝。因此,DeepMind會將AI限制在該公司的研究科學家Oriol Vinyals稱之為「高級人類」的速度上限。這也有助於確保AI不將處理能力浪費在每分鐘做出數千個無關緊要的決策上,並將注意力集中在關鍵的地方。

  Vinyals在星際爭霸中有著豐富的經驗。 2010年,在加州大學伯克利分校讀本科的他編寫了一個遊戲AI,可以在首次玩遊戲就能表現得比內置的AI更好。但那個機器人只是一個簡單的腳本系統,裡面的每個規則都是設定好的,類似於DeepMind出現之前最好的圍棋AI。和在圍棋中一樣,在星際爭霸II中, DeepMind想要專註於機器學習,設計一個可以教會自己玩遊戲的AI。

  這次,DeepMind 獲得了星際爭霸II的開發者暴雪(魔獸世界、爐石傳說和守望先鋒也是這家公司開發的)的幫助,而這一幫助會使DeepMind甩掉其他任何一家想要完成同樣挑戰的AI研發公司。在2017年第一季度,暴雪將會更新星際爭霸II,為遊戲引入一個新的AI研發環境,並提供一個API,開發者可以利用這個API從遊戲中獲取額外的信息,用以教會他們的機器人如何玩這個遊戲。

  

  DeepMind的最終目標仍然是創造一台可以像人類那樣玩星際爭霸的電腦,僅僅通過獲取屏幕上的信息並利用鍵盤和滑鼠來完成操作。但是在短期內,利用簡化視覺效果來教會他們的系統對DeepMind來說更為容易,即將地圖圖形和迷你地圖轉化為低像素的圖像,並將各種特徵分解成不同的圖層,以清晰地顯示出地形高度、單位類型和血量等各種信息。

  這項合作是雙贏的,暴雪希望通過這些新發現改進自己的遊戲。「是否能有一個遊戲世界可以具有更為複雜,甚至可以為玩家量身定製的AI?」星際爭霸II的執行製作人,暴雪的Chris Sigaty說道。「我們能根據我們教導AI的方式來教導玩家嗎?這將意味著什麼?我們這邊有很多猜測,但我們相信它將有助於改善遊戲。」

  但DeepMind的目標不僅僅是改進視頻遊戲。Vinyals說,工作室的最終目標是使用AI來解決現實世界的問題, 很自然地星際爭霸II就是它的下一步。完整信息的缺乏,現實的(狹義的「現實」)視覺,開發記憶的需求,甚至是某種想象能力,都是AI嘗試理解現實世界的重要技能。他說,比起現實世界,遊戲是一種更好的了解現實世界的方法。「你可以快速運行遊戲,它們有明確的得分,或者輸贏。而且也有其他人認為,學習和掌握遊戲對人類來說也是個有趣挑戰,他們對遊戲做出了許多優化。」

  當DeepMind將注意力轉向圍棋時,它一年內打敗了最好的AI玩家,並且在兩年內打敗了最好的人類玩家。但Vinyals和Sigaty都不確定AI需要多長時間來掌握星際爭霸II。「從研究的角度來看,我們可能會取得很大的進步,但我認為我們現在還不知道我們能否擊敗最好的玩家,」Vinyals說。

  Sigaty則表現得更有信心。 「我相信我們的職業玩家, 他們表現總是令人讚歎」。

  翻譯:張光輝  陳璟儀

知之為知之,不知為不知,是知也

海納百川,  有容乃大
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-9-2 07:22

快速回復 返回頂部 返回列表