左邊這張圖是關於用人工智慧技術來玩 Atarti game 的。當使用強化學習技術不斷地嘗試玩這個遊戲,一開始機器只會學到一些基本技能,玩著玩著逐漸發現一些高級的策略,甚至獲取了超過常人的技巧,比如把小球打到磚塊上面去,通過不斷回彈實現得分。
右邊這張圖是關於圍棋的。圍棋本身的策略空間非常大,每落一子,棋盤上都有很多不同的選擇,如果再考慮到後手,則對應於一個非常龐大的搜索樹。對這個搜索樹進行遍歷是遠遠超過目前計算機的計算能力的,所以大家曾一度認為在圍棋這件事情上機器很難戰勝人類。但是,最新的人工智慧技術巧妙地迴避了遍歷,像人一樣使用了 value network 來對搜索樹進行有效的剪枝,從而在以高概率保留好棋的前提下,把計算的複雜度降低到計算機可以承受的範圍內,並且最終戰勝了人類的世界冠軍。