倍可親

回復: 0
列印 上一主題 下一主題

 AlphaGo雖能戰勝人類卻不會計時時間控制仍需人類干預

[複製鏈接]

6224

主題

1萬

帖子

3萬

積分

貝殼精神領袖

Rank: 6Rank: 6

積分
30731
跳轉到指定樓層
樓主
瘋瘋顛顛 發表於 2016-6-28 23:41 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
2016年06月28日 13:33 新浪科技 微博


  

  新浪科技訊 北京時間6月28日午間消息,谷歌DeepMind的人工智慧圍棋系統AlphaGo已成為全球最知名的深度學習技術應用案例。不過,幫助AlphaGo取得成功的某些代碼仍來自人工程序員。

  今年3月,AlphaGo以4:1的比分擊敗了韓國圍棋冠軍李世石。根據此前的報道,AlphaGo自己與自己練習了幾百萬盤棋,從而掌握了圍棋技巧。

  AlphaGo是DeepMind的兩大神經網路之一。其技術包括監督學習(即研究人類棋手的棋譜),以及增強學習(自己與自己練習,並從中改進)。不過最新消息顯示,有些東西AlphaGo無法通過學習去掌握。

  DeepMind研究總監索爾·格雷佩爾(Thore Graepel)表示,最終完成的AlphaGo系統非常善於發現,應當專註於棋盤的哪個區域。不過,AlphaGo並不擅長何時停止思考,完成落子。

  這帶來了問題,因為頂級圍棋賽事有著複雜的計時系統。例如,在與李世石的對局中,雙方各有2小時的常規時間去落子,並在時間耗盡後有3次讀秒機會。棋手可以選擇在某一回合中啟動讀秒。但如果全部讀秒時間耗盡,那麼就會被判負。

  格雷佩爾表示:「人類能進行複雜的時間管理。在困難的局面下,他們會思考更長時間,而在簡單的局面下,他們花的時間較少。我們試圖讓AlphaGo也能做到這點。」

  「時間是重要資源:我們思考某一步棋的時間越長,那麼下法就可能越好。然而,時間是有限的。因此我們提出了一些方法,即如果演演算法在更長時間的思考後不會改變決策,那麼我們可以探測出這點。」

  研究團隊並未在AlphaGo的圍棋知識中加入時間規則,而是引入了額外的限制。與核心引擎不同,時間演演算法是由人工設計的。

  不過,這仍完全基於演演算法。格雷佩爾表示:「通過評價系統,我們進行了優化。我們會比較不同的耗時曲線,例如在開始階段用時較少,隨後用時增多,或是開始用時較多,隨後逐漸減少。我們測試了哪種方法效果最好。」

  因此,目前還不必擔心機器搶走人類的工作,人類仍有工作要做,例如控制秒錶。(維金)

世人皆醉我獨醒
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-9-1 14:07

快速回復 返回頂部 返回列表