曾經有同學問我:「做一個好的科學家需要有什麼樣的素質?」 這是一個不好回答的問題。讓我總結,大概有以下幾點:(1)酷愛研究,(2)勤奮好學,(3)思想深刻,(4)想象豐富,(5)功底紮實,(6)為人謙和。 我接觸過許多世界一流的科學家,他們幾乎無一例外。下面我就以自己經歷過的、聽過的,或讀過的幾個小故事為證,分享給大家,願與大家共勉。
「數學太有趣了」——伊藤清
伊藤清(Kiyoshi Ito)是當代最偉大的數學家之一。他將微積分方法擴展到隨機過程,建立了伊藤微積分。該方法被廣泛應用到隨機微分方程、金融數學等領域。我在日本京都大學讀本科生時,正值伊藤先生從京大退休。去聆聽了他的「最終講義」。伊藤先生報告的結束語讓我至今記憶猶新。他說:「我做數學,是因為數學太有趣了。」話音一落,全場響起了經久不息的掌聲。
讓孩子們喜歡數學——里奧·布雷曼
里奧·布雷曼(Leo Breiman)是傑出的統計學家,曾發明CART與Bagging演演算法。布雷曼認為現在的數學教育大多是失敗的。重要的是要讓孩子們喜歡數學,因為數學是非常有趣的。他曾親自去小學五年級教數學。布雷曼生前回憶那段經歷時說:「我們一起做了各種遊戲。他們在遊戲中學習了解析幾何、代數以及其他各種複雜的東西。」 [2]
魔術師出身的數學家——佩爾西·戴康尼斯
佩爾西·戴康尼斯(Persi Diaconis)是著名的統計學家。他14歲開始當魔術師,18歲時買了一本概率書,發現根本讀不懂,於是24歲時開始在夜校學習數學。後來他在哈佛大學拿到數學博士,成為斯坦福大學教授,還當上了美國科學院院士。戴康尼斯的一個著名研究成果是他證明洗撲克牌七次才能洗乾淨,不愧是魔術師出身的數學家。聽過戴康尼斯的關於排序學習的講演。印象深的是他很投入,講演中會時不時地閉上眼睛,完全進入自己的世界。
童心未泯,充滿好奇心——拉凱什·阿格拉瓦
拉凱什·阿格拉瓦(Rakesh Agrawal)提出了許多數據挖掘的重要概念與方法,例如關聯規則挖掘演演算法。他說:「我做研究選題時一定考慮會不會對十年以後產生影響。」有一次陪他去北京一家餐廳吃飯。剛進門,就見他放慢了腳步,像小孩一樣好奇地探著頭,湊到旁邊的玻璃櫃前。原來那裡擺著許多穿著民族服裝的玩偶。拉凱什在那兒端詳了半天,用帶著印度口音的英語說:「It is nice (這很漂亮)」,臉上露出了開心的笑容。像許多科學家一樣,拉凱什也是一個精力旺盛,充滿好奇心的人。
每晚睡前讀一篇論文——邁克爾·喬丹
邁克爾·喬丹(Michael I. Jordan)是機器學習領域最有影響的學者之一,貝葉斯學習的代表人物。喬丹培養出了許多優秀的學生,他和學生們做的許多工作都是里程碑性的。喬丹並非出身名校,但是靠自己的聰明才智與刻苦努力,成為麻省理工學院(MIT)、伯克利的教授,2011年還當選為美國科學院院士。他多年來養成了一個習慣——晚上就寢前一定要讀一篇論文。
一切發現都在情理之中——羅伯特·夏皮爾
羅伯特·夏皮爾(Robert Schapire)因為發明了著名的機器學習演演算法AdaBoost與Yoav Freund一起獲得了計算理論界最高獎歌德爾獎。我曾問羅伯特:「你們當初是怎麼想到AdaBoost的?」他的回答非常簡單:「因為我們之前證明了可以把弱分類器提升為強分類器,所以後來就想到了AdaBoost。」好像一切都在情理之中。他的表情也像平時一樣從容淡定。一流科學家思想都達到了極高境界,很多發明發現都是他們通過自然推理,而非靈光一現,產生出來的。
Idea如泉涌,當今的愛因斯坦——愛德華·威滕
有人說愛德華·威滕(Edward Witten)是有史以來最偉大的理論物理學家,還有人說他是當今的愛因斯坦。威滕建立和發展了諸多物理學理論,特別是超弦理論(Superstring Theory)。他曾撰寫了兩百多篇論文,在物理學中論文引用H指數排名第一。他獲得過多個大獎,包括數學的菲爾茲獎。威滕思維敏捷,經常會思若泉涌,想出很多idea。正因如此,他也從不吝惜自己的idea,只將最好的idea付諸於研究。他說:「我年輕的時候,每天早上起來都會有一種感覺,今天會有從來沒有過的好idea。」[2]
深厚的理論功底——彼得·巴特利特
彼得·巴特利特(Peter Bartlett)創立了學習泛化能力的分析手法,是機器學習理論的領軍人物。彼得的機器學習講義思路清晰、證明嚴謹、敘述簡明,讀起來讓人覺得是一種享受。有一次,彼得兒子的學校請他給小學生們講一堂課,內容是微積分!他說花了很大功夫備課,但也可見他理論功底之深。
紳士風度,為人謙和——羅斯·昆蘭
羅斯·昆蘭(Ross Quinlan) 2011年獲得了數據挖掘領域最高榮譽獎KDD創 新獎。十多年前聽過昆蘭先生的報告。即將結束時,一位聽眾冒昧地問:「什麼是方差?」這位相貌酷似林肯的澳大利亞紳士並沒有顯出不耐煩,相反他耐心地解釋 說:「我不是統計學家。方差是......」八十年代末九十年代初,當人們還在用手工的方法構建專家系統時,昆蘭發明了著名決策樹學習演演算法ID3、C4.5,闖出一條數據驅動、統計學習的新路,實在難能可貴。
(本文圖片來源網路,作者為微軟亞洲研究院網際網路搜索與挖掘組高級研究員及主任研究員。)
參考文獻
[1]News at UC Berkeley, http://berkeley.edu/news/media/releases/2005/07/07_breiman.shtml