倍可親

回復: 1
列印 上一主題 下一主題

鄭碼的秘密

[複製鏈接]
跳轉到指定樓層
樓主
newathens 發表於 2006-7-17 13:46 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  如果要說世界上普及率最高的中文筆畫輸入法(字形碼),絕對不是五筆字型,而是鄭碼。

  對大多數人來說,鄭碼是我們最熟悉同時又最陌生的輸入法。它是windows系統中唯一預裝的一套筆畫輸入法,除了鄭碼之外,其它的全拼雙拼、微軟拼音、智能ABC等都是拼音碼。然而我使用電腦的時間超過10年,從未見過任何一個人會使用鄭碼的人。

  從windows95開始,所有的中文windows系統(95/98/NT/2000/XP)都預裝了鄭碼。這到底是為什麼?鄭碼到底是誰發明的?為什麼微軟公司選擇的是鄭碼而不是五筆字型?鄭碼真的有什麼過人之處么?

  鄭碼到底是誰發明的?

  

  鄭碼的發明人是我國著名文字學家、享譽海內外的《英華大詞典》主編鄭易里教授。我家裡正好就有他編著的這本詞典,1965年版,鉛字印刷的,現在已經老舊老舊的了。所以,對他的名字我覺得很親切。

  

  鄭碼和五筆字型的淵源

  

  鄭易里教授研究漢字拆分方案幾十年,1980年時候完成了世界上首個只用通用鍵盤的26個英文字母鍵將漢字代碼輸入計算機的《26鍵位漢字拆根輸入碼方案》。但是他將自己多年對字根、對漢字編碼理論和方案的研究心得和發明成果都無私地傳授給了王永民等人。王永民等人在鄭的研究基礎上完成了五筆字型的發明。可以說,如果不是他當時的無私奉獻,現在佔中國統治地位的筆畫輸入法,就絕對不是五筆字型了。五筆誕生以後雖然獲得了很大的成功和榮譽,但鄭易里仍覺得五筆對於漢字的拆分不是很合理和完善,特別是不太符合漢字的文字規範,因此繼續不斷研究改進,在他的女兒鄭瓏的幫助下,最後共同發明了更為規範和完善的中文筆畫輸入法---《字根通用碼》。也就是我們後來看到的鄭碼。

  

  鄭碼的過人之處

  

  《鄭碼》以單字輸入為基礎,詞語輸入為主導,用2-4個英文字母便能輸2字詞、多字詞和30個字以內的短語;在這種字詞交融輸入之下,輸入一個漢字的平均碼長是1.8-1.9鍵之間。他備有兩個詞庫,分別收錄25000和50000條詞語。為了不同用戶的需求,鄭碼輸入法分為《普及型》和《標準型》兩種。《標準型》重碼率低,適合高速盲打輸入。

  《鄭碼》的優勢是,在漢字文字規律方面符合國家語言文字規範,具有規範、易學、快速、通用的特點(當然,這個易學和快速,是相對於當時的筆畫輸入法而言的),有條件在中、小學和社會上推廣應用。鄭碼因此獲得了國家無數的獎項和榮譽。(現在看來,目前中文錄入速度最快的應該是五筆字型,已經超過每分鐘300個字。而鄭碼的最高速度大約是240字。而最簡單易學的輸入法,我想還是拼音吧:D)

  但是,鄭碼具備有其它輸入法無法替代的一個重要優勢:在不改變編碼規則和字根代碼的前提下,可以方便地給10萬漢字編碼。也就是說,學會用《鄭碼》輸入幾千個常用漢字,用同一方法編碼,還可以輸入幾萬個中國的生僻漢字以及日本和韓國的漢字。有了鄭碼,我們可以輕易的完成中日韓三國的漢字錄入工作,可以完成《說文解字》乃至《康熙字典》這樣超大字符集漢字的錄入,這一優勢是其他輸入法所不可比擬的。

  1994 年末,三星公司受韓國政府委託,來中國大陸引進漢字輸入法,以完成韓國訓民中文系統和將超過5000萬漢字的珍貴國寶《高麗大藏經》(其實這個大藏經也是高麗王朝在北宋年間從中國引入的)電子化的工作,中文信息學會向韓國推薦了十幾種輸入法。不久三星公司派來三位專家。在中文信息學會的配合下,馬不停蹄地將這十幾個「碼」輪番考核、測試、篩選。經過嚴格測試和考核,公司高層領導最後決定,原來準備選三種「碼」(輸入法)的打算,現在決定只選一種就可以了,那就是鄭碼。韓國三星集團的理事長總結時候說:「《鄭碼》是1995年三星最成功的技術引進。」

  鄭碼和windows的淵源

  《鄭碼》經過一系列國家級的測試、鑒定、評審,都認為具有世界領先水平之後。這個經過千錘百鍊的漢字編碼系統可以定型推廣了。鄭易里建議接過他的接力棒的中易公司又瞄準了新的目標——曲線漢字型檔。因為,這是除了我們無力問津的操作系統以外的中文信息處理的另一個關鍵因素。

  漢字型檔是中文信息處理的最終表現,因為大家看見的不是輸入法,也不是操作系統;而是用精美的漢字列印出來的文章。電腦用漢字型檔的初級階段是由各個「點」組成的漢字字形。稱為用「點」來描述漢字。它不能無級放大、縮小,要像鉛字一樣大小分號,而且略大一些的點陣字、筆劃邊就像鋸齒一樣難看。當時通用的排版系統上的漢字型檔是中等技術級的矢量漢字型檔。即是用直線來描述漢字字形,直線部分自不必說,而曲線部分,是用許多折線來組成。這種漢字型檔,稍一放大,就會由於顯出曲線部分的折線來,產生變形而無法使用。當中易公司要進入漢字型檔開發領域時,決心越過矢量漢字型檔,迎頭趕上世界最先進的用曲線描敘漢字字型庫的技術。當時世界上只有美國 2—3 個公司有這種用曲線描敘西文的技術,而用曲線描述漢字要比西文龐大複雜的多。公司利用世界上已公開的曲線描述字形的很少資料,組織軟體工程師們向曲線字型檔的縱深領域進攻,同時聘請國內最權威的字模專家做字形的技術總監,並和中國標準技術開發公司專門開發國家標準點陣字型檔部門合作,一場向世界最高水平,符合國際曲線標準漢字字模的戰役全面展開!

  做曲線漢字字模是一件周期長、技術水平很高、風險大、資金投入大的項目。中易公司已連續創業4年,基本上都在完善《鄭碼》而沒有什麼收入。當為尋求開發曲線漢字型檔的資金,向一些大電腦公司尋求合作時,他們卻認為符合國際標準的 20902 個漢字的曲線漢字型檔的應用時機還很遙遠。現在就投入大量資金開發風險太大,怕得不償失,於是都婉言謝絕。

  但是中易公司認為,在信息時代,技術的更新,不是逐步到來的,而是像三級跳跳來的。我們是中國人,不但要在漢字輸入法方面世界領先,在漢字型檔的技術領域,也要領先,才不愧對發明漢字頗講書法藝術的老祖宗!

  事情果然像預料的那樣,1994 年初,世界最大的美國微軟公司把剛剛誕生才幾個月的 Windows3.2 中文版就準備拋開,全力開發 32 位操作系統的 Windows 95 中文版。包括中、日、韓三國的 20902 個漢字的國際標準。美國微軟的工程師很快來北京調查,誰家有這 20902 個國際標準的漢字型檔?哪個輸入法能支持(檢索)這 20902 個漢字?他們馬上找到了中易公司,他們在了解《鄭碼》能不能支持(檢索)20902個國際標準漢字時,中易公司給他們演示的卻是當時世界最大的國家6萬電腦大漢字型檔的輸入(檢索)。他們看到《鄭碼》只用4鍵就能迅速準確地輸入 6 萬漢字時,驚訝之極,難以言表。即然6萬字都這麼乾淨、利索地輸入,20902 個漢字還在話下嗎。再問到誰家有這 20902 個曲線漢字型檔時,中易公司輕鬆地將列印好的全套樣本展現在他們眼前。以後的半個月,他們曾4次派不同級別的工程師和管理專家來中易公司諮詢考查,確認一切完備無誤后,要了樣品才滿意離去。

  從這以後,隨著Windows中文版的推廣,《鄭碼》和中易字型檔一起進入了千萬中文用戶的電腦中。

0

主題

592

帖子

121

積分

貝殼網友一級

愛國華僑(十五級)

Rank: 3Rank: 3

積分
121
沙發
xuxu5076999 發表於 2006-7-19 17:08 | 只看該作者
廣告
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-4 07:37

快速回復 返回頂部 返回列表