倍可親

什麼才叫機器戰勝人

作者:mali50  於 2016-3-15 10:34 發表於 最熱鬧的華人社交網路--貝殼村

通用分類:熱點雜談|已有10評論

關鍵詞:機器人, 未知數, 從零開始, 文章, 機械

什麼才叫機器戰勝人?

馬力


最近機器人在棋盤上大戰生物人鬧得沸沸揚揚。不少人把人機博弈說成是機器人智慧與人類智慧的決賽,這實際上是對人類智慧的不了解造成的。機器與人博弈只是思維的一種形式—形式邏輯—的較量,因為機器人是按照人類輸入的形式邏輯來下棋的。在形式邏輯上利用高速計算超越人類不足為奇,就像老式機械是人力的延長一樣。就是在形式邏輯上,機器是否不可戰勝仍是未知數。這裡剛好有篇文章「陳經:感謝李世石生命般的抗爭 現在我敢說AlphaGo的命門其實很簡單討論了機器人AlphaGo在形式邏輯上的局限。
 
首先來回答一個問題:就形式邏輯而言,什麼才叫機器戰勝人?所謂的機器戰勝人不應指機器人通過人工輸入的程序打敗人,因為這還是人戰勝人,是人用機器戰勝了沒有用機器的人。就像人用棍子打敗徒手的對手一樣,不能說是棍子打敗了人。不管多麼拗口,也只能說是人用棍子打敗了另一個人。機器戰勝人應該是機器人與生物人一樣從零開始學習棋術,靠自身積累的經驗打敗人類,而不是靠人事先輸入的程序來下棋。
 
這還只是在形式邏輯方面,即人類思維的一個最基本的方面。有人喜歡把形式邏輯的演繹說成是弱智的最後功能,因為是最簡單的思維功能。許多缺乏生活能力的人卻可以是「數學家」。當然這包括了對腦筋死板的某種歧視。事實上形式邏輯中的歸納、證明和邏輯聯想,包括形象邏輯的聯想還是很有挑戰性的。

大家都說AlphaGo很厲害,為什麼?因為它是按取勝的概率來計算投子,而不是按最優化來計算的。實際上由於圍棋格點太多,不像國際象棋那樣有許多行動上的限制,目前的計算機速度難以做到圍棋博弈中的最優化選擇,只能計算勝負的概率或可能性。這在外行看來是很了不起的手段恰恰是機器人AlphaGo的問題所在。
 
機器是怎樣計算概率的?這就首先需要假定對方的應對。所謂的窮舉法只能用於很小的範圍。對整盤棋局來說,機器速度無法在限定的時間內逐個地對所有空格窮舉之後各步的每一種可能直到最後的勝負,而只能從所知棋譜中選擇對方所有的可能應對來計算概率。一旦選擇就有選擇遺漏。更多不被看好的應對就會被忽略。一旦人不按常規棋譜出牌,機器就無法事先預測並因此可能作出錯誤的決策。這就是機器人bugs的一個來源。就像谷歌無人駕駛汽車的軟體假定別人在自己接近時會讓路一樣,因此忽略了規避措施造成車禍。

我在這裡對機器人的工作原理說得很簡單,一目了然。但AlphaGo的演算法很複雜,非理工專業的很難讀懂。為什麼有這些區別?因為我說的是最基本的計算,也是最可靠的。但實際上由於比賽時間有限,機器人在比賽時不可能按這種最基本可靠的方法來運算,只能設法簡化運算步驟和數量,用統計代替逐個格點的窮舉。這樣一來就需要各種條件下的統計模擬公式。所有簡化公式都帶有多種假定條件下的參數。AlphaGo用反覆對壘和自弈來確定這些參數,即所謂的深度學習。敘述起來就變得很複雜。用統計代替真實的窮舉后,雖節省了大量時間,但失去了可靠性,也更容易產生bugs。也由於參數來自大量實驗,修改起來也很困難。

如果再說形式邏輯之外的辨識思維或辨證思維,機器人更無從談起。首先要有全部的感覺系統,還要有判斷是否值得學習的能力。然後對感覺加以判斷是否具有新的信息。如果是新的,如何用新的概念定義命名,如何建立與已知系統的聯繫,最後如何產生新的公理體系等等等等。目前談論這些還為時太早。機器的儲存遠遠不夠,因為要包括人類的所有知識和經驗。
 
舉個例子,讓一個有感官的機器人尋找新物種,人事先把所有已知物種的各個部分輸入機器人。機器人會在一天中帶回無數樣本,包括被蟲咬破,被泥土污染,被人獸踩壞和不同程度腐爛的等等。結果一無所獲。這還是有明確目標的行為。要機器人獨立建立價值目標就更難了。它會把所有時間用來數一頭死老鼠身上的毛數和螞蟻數。

高興

感動

同情

搞笑

難過

拍磚
1

支持
4

鮮花

剛表態過的朋友 (5 人)

發表評論 評論 (10 個評論)

回復 十路 2016-3-15 10:47
這篇寫得不錯,我接觸的人就是做一行的。
回復 mali50 2016-3-15 11:16
十路: 這篇寫得不錯,我接觸的人就是做一行的。
謝謝,十路。
回復 吳名子 2016-3-15 20:00
「因為機器人是按照人類輸入的形式邏輯來下棋的」

---- 不好意思地說,樓主對如今 AI 的這種認識已經過時了。如今的 AI 已經朝著真正的人類思維模式前進了。建議樓主看電影 EX Machina,雖然那是個虛構的電影。但是它指示了 AI 的前進方向。而且智商極高的 Demis Hassabis 團隊對AI 的思考絕不低於  ex machina 的創作者。
回復 mali50 2016-3-15 22:36
吳名子: 「因為機器人是按照人類輸入的形式邏輯來下棋的」

---- 不好意思地說,樓主對如今 AI 的這種認識已經過時了。如今的 AI 已經朝著真正的人類思維模式前進了。建
「真正的人類思維模式」是什麼?能不能介紹一下?是不是就是媒體思維?
回復 rockyrocky 2016-3-15 22:38
這根本不是機器戰勝人。而是相當於人和用直尺的人比賽誰畫的直線更直。
回復 mali50 2016-3-15 23:14
rockyrocky: 這根本不是機器戰勝人。而是相當於人和用直尺的人比賽誰畫的直線更直。
本質上就是這樣。人出生時不帶(智力)軟體,只有硬體。機器人則靠人類的軟體工作,目前最多就是找答案,就像用最簡計算器計算一樣。
AlphaGo多一項「學習」功能,也就是自定參數值。實際上,所有複雜的數值模擬都是通過無數實驗來確定參數的。這是因為從原理上準確地確定參數值沒有可能,否則就是新的數理公式的發明,可獲諾貝爾獎了。很多數值模型獲得參數值后需要人工輸入或修改,但AlphaGo是自動輸入和修改,但不能改變人工輸入的統計公式和方法。就這麼一點區別。
回復 吳名子 2016-3-16 03:16
mali50: 「真正的人類思維模式」是什麼?能不能介紹一下?是不是就是媒體思維?
給樓主推薦一個網頁,是一篇一個老中科學家翻譯並介紹 AlphaGo 的思維方式的。很有啟迪感。它已經完全改變了「人工輸入的統計公式和方法」 的思維模式。
blog.s_ciencenet.c_n/blog-409681-962662.h_tml
(把下橫線去掉就可以了)
回復 mali50 2016-3-16 04:28
吳名子: 給樓主推薦一個網頁,是一篇一個老中科學家翻譯並介紹 AlphaGo 的思維方式的。很有啟迪感。它已經完全改變了「人工輸入的統計公式和方法」 的思維模式。
blog.s_
我實際上已經說明了這些技術不是什麼了不起的進展,只是你可能看不懂。所以轉個在漢山上的評論:
在博弈中,窮舉是萬無一失的。AlphaGo在小區也用窮舉。在大區不用是因為計算速度不夠,只好用簡單的統計公式通過無數次實驗來確定參數。就像不能預測單個分子的運動,便只好用實際上是統計方法的經典熱力學來描述分子集合的整體變化。
    打個比方就比較容易理解AlphaGo的統計演算法。就是用統計學中常用的冪級數來模擬實驗曲線一樣,將許多實驗結果帶入擬合函數,並解出複雜方程組的解作為各次項的係數。只是AlphaGo用的統計公式比冪級數複雜。
   因此用統計方法代替窮舉是不得已的讓步,不是更好,而是可以實際用於限定時間的比賽。這種實用性改進也可算作一種提高。但要弄清楚提高了什麼,代價是什麼。王婆賣瓜,自賣自誇是地球人的通病,資本主義商業化的需要。於是報喜不報憂,不知底細的就以為是人工智慧本質上的進展。
很有點畫餅充饑的味道。吃不上天津狗不理,就在家自己做個包子,然後撰文吹噓用了什麼什麼食才設備和方法,給人超出狗不理的印象。從炒作AlphaGo可以看出科技人的墮落。
回復 Duffy 2016-3-16 11:20
寫的很好。

我覺得中國圍棋元老王汝南先生評述得很精準:圍棋比賽勝負靠的是棋藝,棋藝除了包括技法,還包括哲理性的許多更深層的東西。
也就是說:具有自學習功能的圍棋機器人只會越來越進步,越來越提高,而提高的速度遠遠超過人類。就這點來說,電腦圍棋機器人的「技法」遲早是要超越人類的。但是具有四千年歷史的圍棋除了技法之外,還有許多更深層的哲理性的東西,(這也就是中國從古至今的軍事家,政治家,哲學家都把圍棋作為一種必修課的原因,圍棋早已突破了一般棋類對抗娛樂的範疇。機器人什麼時候能夠掌握和超越人類的人生哲理,想必還有很遠的路要走。

舉個現成的例子:我不知道,在第四局中,李世石走出的扭轉局勢的白棋的「第78手」,如果換成AlphaGo是否可以走出來,我個人倒認為單靠窮舉之類的技法是算不出來這著表面看來的」臭棋「的,即便算出來,也會被當作」臭棋「而被摒棄。
回復 mali50 2016-3-16 12:23
Duffy: 寫的很好。

我覺得中國圍棋元老王汝南先生評述得很精準:圍棋比賽勝負靠的是棋藝,棋藝除了包括技法,還包括哲理性的許多更深層的東西。
也就是說:具有自學習
沒錯。機器能「下棋」,甚至可以打敗人。但機器不知道自己在做什麼,不知道這顆棋子有什麼戰略和戰術意義,而只「知道」這種走法可以「嬴」,也不知道嬴什麼?什麼是嬴,因為「嬴」是設計的人賦予機器的指令和目的。實際上,所有這些棋中和棋外地意義都是人賦予的,是人的詮注。因此從嚴格的意義上來說,甚至不能說是機器人「下棋」或「贏了」人類,只能說機器在這段時間裡成功地或準確無誤地執行了人的程序和指令。所謂的下棋是人賦予機器行為的意義和理解。
因此就更談不上機器人能從博弈中獲得什麼啟迪,舉一反三或推廣運用於其它方面。對機器人來說,世界永遠是不相關的孤立事物的組成,甚至人類思維中通用的形式邏輯和經驗也不能貫通它們。對付每一個孤立事件,都需要一套特定的邏輯公式,以往的經驗毫無用處。這正是所謂的機械智慧與人的智慧的根本不同。

facelist doodle 塗鴉板

您需要登錄后才可以評論 登錄 | 註冊

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2024-4-25 05:01

返回頂部