倍可親

人類語言與人工智慧

作者:蘇誠忠  於 2024-7-16 12:36 發表於 最熱鬧的華人社交網路--貝殼村

通用分類:文史雜談

最近一段時間,蘿蔔快跑佔據了大眾的視野。以此帶來的失業恐懼引發爭議。過去,一直傳說的AI將取代人類工作似乎已經到了眼前。不過,在我看來,問題沒有那麼簡單。為什麼這樣說呢?回顧一下歷史,電腦翻譯的歷史從上個世紀五十年代就開始了,當時是因為美蘇兩國大國爭霸。這兩國都在這上面投資。但是,直到今天,電腦依然不能取代人腦的翻譯。最近的歷史也能看出,什麼元宇宙,量子電腦,區塊鏈,人腦與電腦連接等等,每月都在出現新名詞,但都是曇花一現,實際的東西在哪裡?真正起作用的只有星鏈衛星系統。換句話說,還是物理上的進展,不需要過多的解釋,一目了然。
人工智慧被說得天花亂墜,但是,至今,人類能夠用得上的,依然是人腦的輔助設備。我相信,在語言學沒有重大突破以前,它不會變成人類的主宰。我說這話的根據是,人類至今沒能認清自己語言的各種特性。連自己都不知道是如何相互傳遞思想的,憑什麼預測電腦就能做到?
人工智慧如果能夠產生思想,那麼,一個關鍵問題來了:這個思想是用什麼語言來表達和傳遞的?動物可以有簡單的語言。那也是它們相互之間,多年磨合形成的。人工智慧,理論上就是一台電腦,它們需要大量的互動,像人類一樣,才可能有自己的語言。否則,只能使用人類語言來完成。如果使用的是人類語言,那麼,是英語還是漢語?一般人的回答都是英語,但本文恰恰是用漢語告訴大家,這個想法是有缺陷的。因為,漢語是最適應於人類的語言,而英語,相對來說適應機械。
信息科技出現在西方的根本原因,是在電子技術出現之前,許多西方的大思想家認識到,思想的邊界,就是語言的邊界。或者說,思想能夠交流或者被記憶,實際上是語言在起決定性的作用。因此,所有的知名大學,都有一個語言學系。所有西方的哲學家,從柏拉圖到維特根斯坦都對語言學進行過深入的探討。唯獨在中國的典籍中很難找到語言學的內容。我只在道德經的第一章中看到過對語言的研究。但是,由於古文用字過於簡練,許多研究道德經的人都用道家思想解釋那一段文字。
我在前面日誌中談到過,如果用西方的數學邏輯進行評估,漢語應該是最適合人類使用的語言。這種觀點來自萊布尼茲的許多成果。我們知道,他第一個發明了二進位數的運算方法。直到今天,電腦使用的所有運算,都是建立在這個基礎之上的。他同時也是第一個發明了機械計算機的人。在電腦出現以前,所有的會計系統,使用的都是機械計算機。有趣的是,萊布尼茲的機械計算機使用的是十進位數,為什麼呢?這就是我認為漢語比拼音語言適合人類的根據。使用二進位數,經過一次組合能夠得到四個結果,2X2=4,但是十進位數一次組合能得到100個結果,10X10=100。這裡要引進一個概念,載義符號。一個符號含有一個具體的意思,就稱為載義符號。高電壓和低電壓是兩個符號,它們沒有任何意思,直到人類將低壓賦予了0的意思,把高壓賦予了1的意思以後,高、低電壓就成為了載義符號。同樣從1到10這十個符號都被人類賦予了意思,所以都可以稱為載義符號。基本載義符號多,由它們組合出的載義符號就成倍地增加,但是,abcdefg這些符號,沒有具體的意思,它們不是載義符號,可稱作無意義符號。只相當於漢字的橫豎撇捺等等。正是由於字母不是載義符號,所以,萊布尼茲用它們代表數學上的未知數(我們目前使用的很多數學符號,都是萊布尼茲發明的)。而每個漢字都是載義符號,相當於英語的單詞。我們說過,漢語由於四聲的關係,聲音種類是英語的四倍以上,因此,可以給更多的單音賦予意思,成為載義符號。而拼音文字,沒有使用四聲,所以聲音種類少,只能給聲音的組合賦予意思。就是這一點點的差別,造成了今天英語需要二百萬單詞才能表達整個網際網路上的意思,而漢語,只需要四千左右的漢字,就能表達相同的意思。
這裡要解釋一下,意思是怎樣形成的。進入有記載的歷史以後,每一個新的載義符號的形成,都是由其他幾個已知的載義符號,形成一個句子來解釋的。最好的例證就是詞典,或者字典上對某一單詞或漢字的解釋,按照習慣,應該由一個句子來完成。漢語每個字只需要一個聲音,兩個字才兩個聲音,而目前,拼音語言中,多數單詞都由兩至三個聲音(不是音節)組成的,這樣一來,漢語的辭彙就非常方便地,將解釋它的那句話,化簡成單詞。比如,最近新出的一個單詞「延畢」意思是延遲畢業。如果翻譯成英語就是:delayed graduation。讀起來太長了。英語為了讀起來方便,尤其是交談或者演說的時候能夠縮短時間,因此,就需要發明一個新的單詞,這個新單詞的要求是:不與其他單詞衝突,而且使用的聲音最好在兩至三個之間。也就是說,英語用增加記憶的方法縮短表達的時間。而漢語,由於使用的聲音種類多,不需要這個記憶,只要聯想就夠了。此外,由於總體來說,聲音種類多的漢語在表達同樣內容的適合,使用的聲音比英語少,而每一個聲音消耗的時間,大約在0.25秒,因此,當兩種語言在心裡說的時候,漢語做需要的時間短。心裡說的過程,就是思維的過程,因此,用漢語思維比英語快。這一點,趙元任在他的《語言問題》中已經提到過。但是,作為物理學教授的他,依然無法用數學方法計算出來具體快了多少。他也只是定性地敘述了一遍,把問題留給了後代的數學家。也許不久後人工智慧可以用統計的方法給出數值。這個數值非常重要,假設它是1.1,那就等於說你思維和學習的時間,等於別人花費1.1 或者1/1.1的時間,也就是說,選擇快速的語言,相當於多/少活了十分之一的學習和思維生命。因此我認為,漢語是最適合人腦的語言。這也是為什麼萊布尼茲雖然發明來二進位數,但是卻要使用十進位的計算機。我們說,漢語是最適合人類使用的語言,是相對於機械語言而言。對於機械語言來說,載義符號越少越好,高低兩種電壓是一切語言中,最小數量的載義符號;或者說,如果只有一個符號,根本無法形成語言。因此,01語言最適應於機械操作。漢語則是最適合人腦的語言,而英語存在於兩者之間。你可以把電腦的輸入與輸出看成是鍵盤,計算機通過01進行的,英語的語音是通過數百個聲音進行的,而漢語是通過上千個聲音進行的。
蘇聯曾經一度希望發明一種三進位的電子計算機,後來發現,由於電壓很難穩定下來,太容易出錯,最後作罷。人腦與電腦的電壓不同,人腦能夠區分幾千種不同的聲音,不會出錯。由此可以獲得啟發,如果電腦使用的不是電壓輸入或運算,而是聲音,或者光,那麼,是否會大大加速過程呢? 從這些案例能夠知道,基本的單音載義符號越多,由它們組成的辭彙表就越大。比如,四千漢字,如果每兩個漢字組成一個單詞的話,能夠組成一千六百萬個單詞,這些單詞,通過自己的聯想,就能理解並記憶。而英語的單詞,由於幾乎沒有單音的載義符號,而它也希望快速的表達和思維,因此,必須不斷的發明新的單詞作為載義符號。這使得人們大大的增加了需要記憶的困難。電腦如果能夠達到普通人的思維水平,至少是要輸入四千漢字后,它能理解由這些漢字組成的一千六百萬單詞的意思都是什麼?萊布尼茲非常理解這個道理,他曾經根據漢語的思路,提出,全人類任何語言中,只需要有一百個最基本的載義符號,就能用它們推導出任何需要的單詞。但是,按照漢語的經驗,卻是需要四千漢字才能推導出任意多的單詞。萊布尼茲沒有注意到的是四聲的作用。萊布尼茲的想法除了受到漢語的影響,也受到亞里士多德的影響。亞里士多德曾經提出過一種「義語言」Semantics。它的結構就類似漢語。不是用字母組合后再賦予意思,而是每個基本符號帶有意思,並用意思來組成新的意思。亞里士多德的靈感來自哪裡,書上沒有記載,但是,我認為,極有可能是來自古埃及的象形文字。因為,古希臘的很多哲學家都曾經到埃及留學過。當年的埃及對於希臘而言,就如今天中國的人眼中的歐美。
從語言學的角度看問題,如果連人類語言表達都還沒能摸清楚是怎麼回事,何來的人工智慧?可悲的是,中國也有語言大學,那裡面學的其實都是從西方語言學中翻譯的內容。西方人不懂什麼是聲調,也不能像中國人一樣,透徹的理解組義語言,你跟他們學,那不是問道於盲嗎?再說,中國人為什麼要使用西方教材?因為當年魯迅,錢玄同,陳獨秀,毛澤東都相信,漢字不滅,中國必亡。他們都帶有對漢語的偏見。掌權以後就成了一種政治正確。再往下挖,就會發現,這幾個人當中,凡是留過學的,去的都是日本。因為當年去日本留學便宜,可便宜沒好貨。日本人當年正在脫亞入歐,一來他們想要否定中國文化,二來,日語中,沒有聲調,他們雖然曾經引進過漢字,但是體會不出四聲在語言中的妙用。因此,教出來的留學生們,回國就殺向了漢字。這些人的徒孫,就是當今各大學的教授。加上如今的學術氛圍,他們能教出什麼內容就不言而喻了。所以,中國的學術永遠都沒有自己的主心骨,永遠都是看著別人的發展追趕。5G沒追上,大飛機,沒心臟,航母,出洋相。永遠是以己所短,追人之所長,就不能發揮一下自己的長處嗎?
我堅信,人工智慧如果僅靠英語來發展,最大的可能就是,永遠都理解不了人類的語言,更弄不清機械語言。只有經過拼音文字與漢語的對比研究后,也許能夠最終理解人類語言。有了這種研究,才有可能理解人工智慧的語言。否則,任何沒有理論根據的巧合,都會被媒體誇大成的重大突破,僅僅是 為了抓人眼球,蹭流量而已。真正的道理是有數學根據,簡潔,明瞭的解釋,那些越解釋越糊塗的理論,最終會使發明者自己陷入迷茫的境地。
上面說過,各大學都曾經有過語言系,當年也都是像今天這樣,經過媒體不斷炒熱一個話題,消失后,再炒熱另一個話題。每個話題的興起都是一堆的論文,成果,等到學費,學位,地位拿到后,不了了之。到了今天,情況依然沒變,只不過增加了一層電腦迷霧而已。喬姆斯基的《自生語法》雖然不了了之,但是他對電腦的看法我卻很是認同,在他看來人工智慧,就是一個海市蜃樓,人類語言學過不了關,電腦語言也休想。喬老爺很明白當年那場鬧劇的來龍去脈。在這一點上,他是行家,騙不了他。用理工科的符號解釋哲學上的語言,恐怕沒那麼容易。當年柏拉圖就提出,尋找一種能使人不說謊話的語法。但是,經過千百萬人的努力,直到今天,這種語法也沒有被發明出來。人們看到的是一個個政治騙子在後世制定的各種語法規則中遊刃有餘。


高興

感動

同情

搞笑

難過

拍磚

支持

鮮花

評論 (0 個評論)

facelist doodle 塗鴉板

您需要登錄后才可以評論 登錄 | 註冊

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-7-25 05:55

返回頂部