科學匠人 | 「三清才子」劉鐵岩：用好奇心探求AI邊界

瘋瘋顛顛 · 發表於 2019-2-2 09:48

　　2019-01-31 18:45開發/微軟/技術

　　編者按：2018年12月28日，由網易智能、清華大學數據科學研究院和25家評審機構共同評出的「2018中國AI英雄風雲榜」年度人物榜單揭曉，10位人工智慧領域的從業者獲獎。其中，微軟亞洲研究院副院長劉鐵岩憑藉多項創新研究獲得了本次評選的技術先鋒獎。本文轉載自微信公眾號「網易智能」。

　　

　　「我覺得學者的宿命就是終身學習。」

　　坐在微軟大廈的辦公室中，沒等記者開口，一向健談的劉鐵岩直接進入暢聊狀態。

　　從「三清」學生到三次研究轉型

　　從小在黑龍江長大，劉鐵岩總是對新事物充滿好奇心。1994年，他如願考上了清華大學電子工程系，回憶起當時的情景，劉鐵岩表示，清華大學是理科生夢想的地方，而電子工程系也是當時最理想的院系。

　　就這樣，劉鐵岩在清華大學電子系學習了9年，成為了典型的「三清」學生（本科、碩士、博士均在清華大學就讀）。據劉鐵岩回憶，讀博期間，他做了很多關於多媒體信號處理的研究，但加入微軟亞洲研究院之後的十幾年裡，他的研究涉足信息檢索、機器學習、博弈論到強化學習等多個領域。「我們所處在的行業飛速發展，唯一不變的就是變化，逆水行舟不進則退，只有不斷學習新知識、擁抱變化，才能保持學術青春。」

　　

　　交叉、跨界、轉型是劉鐵岩不斷探索新領域新技術的主題。

　　而作為學者，對新知識的好奇心，是劉鐵岩敢於研究一個又一個新領域的重大驅動力。

　　劉鐵岩的第一次研究轉型在加入微軟亞洲研究院之後。據其回憶，當時多媒體信號處理領域有一個公認的問題就是語義鴻溝。劉鐵岩解釋說，「我們能處理的多媒體信號，比如圖像、視頻，這些本身並不是包含語義的，但是我們希望從中得到的信息，比如圖像分類，人臉識別、物體跟蹤等，都是含有一定的語義信息的。這種底層的簡單信號與高層的有語義的目標之間的差別就是語義鴻溝。」劉鐵岩認為，當時大量的多媒體領域的研究人員都在做特徵工程，用以彌補語義鴻溝，而不是關注演演算法和模型本身，劉鐵岩感覺自己「偏科」了。

　　因為這些問題，劉鐵岩開始關注文本信息處理。2004年，劉鐵岩與卡內基梅隆大學的文本分類領域的資深專家楊頤明教授達成合作，他們共同搭建了當時世界上最大的、近三十萬類的文本分類系統。此後，他還開展了大量的關於文本信息檢索的研究。在信息檢索領域，劉鐵岩最為出名的就是引入機器學習的思想，創建了「排序學習」這一個學術流派。在2006到2009年，劉鐵岩和他的團隊在SIGIR、WWW、ICML、NIPS等頂級學術會議上發表了大量的關於排序學習的論文，事實證明，該研究給信息檢索領域帶來了重大變革。

　　劉鐵岩藉由排序學習的研究對機器學習領域有了非常深刻的認識，而隨著這種認識的進一步深化，也開啟了其第二次研究轉型。

　　「在排序學習領域做了多年之後，我意識到主流的機器學習都會假設數據先於學習過程而存在的，並且不受學習過程的影響，但是這個假設與我們實踐中的很多情況都不一致。比如說我們做的網頁搜索、廣告排序，很多數據都是人為產生的，當你把從這些數據中學到的模型運用到實踐中，是會改變人的行為的。而人的行為變了，數據也就變了。」劉鐵岩說，我們希望數據獨立於模型而存在，但是數據會受到模型影響，這種情況下，我們學到的機器學習模型的效果可能會大打折扣。

　　為了解決這個問題，劉鐵岩和他的團隊開始研究博弈論，因為博弈論會考慮多個智能體行為的相互制約，以及機制對於智能體行為的長效影響。他們將博弈論的思想用在網際網路廣告和雲計算的機制設計上，確定了很多研究成果，也為微軟的相關產品轉化了很多技術。

　　近幾年，劉鐵岩發現博弈論本身也存在一些問題，比如只能分析簡單的過程、主要關心最壞的情況等。而實際中，我們面臨的問題往往非常複雜，而且平均情況比最壞情況更有實際意義。為了解決這些問題，劉鐵岩和團隊又開始了第三次技術轉型，把博弈的思想和基於數據的機器學習方法充分結合，通過深度學習、多智能體強化學習等最新技術手段，來綜合解決問題。

　　劉鐵岩自己總結說，「解決原有學科面臨的挑戰，是刺激我去研究新方向的主要動因。」但他同時表示，主動的學術轉型和盲目追逐熱點有著天壤之別。主動轉型的目的是擴大知識面、開拓學術邊界、增大實踐價值。為此，常常需要從熱點方向上轉出來、去學習和研究一些目前相對小眾的方向。這種轉型是為了使學術實力更強大，為日後做出更了不起的研究打下基礎。

　　

　　「指哪打哪」研究流派與對偶學習

　　如果研究也有風格流派的話，劉鐵岩將自己的研究風格總結為有著強烈直覺，「指哪打哪」的研究流派。他總結為以下兩個方面：

　　第一，研究是要去解決重要問題的，要有一個非常明確的目標。

　　第二，解決問題的技術要有很強的邏輯鏈路作為支撐，要有規劃、有設計，而不是誤打誤撞、盲目嘗試。

　　他不僅自己踐行著這種研究思路，也盡其所能，培養新一代年輕人的研究品味，並不斷的影響和滲透。「我能夠給與年輕研究員最多的不是研究的想法、寫論文的套路，而是培養他們的研究品味，也就是選擇什麼值得做，什麼不值得做，把好鋼用到刀刃上。」比如面對大家都在追的風口，要保持冷靜，聽從自己內心的聲音，不為發論文而發論文，而是要去解真正重要的問題，發明可以推廣、可以形成體系的方法。

　　2017年，劉鐵岩同時獲選IEEE Fellow以及ACM傑出會員，並晉陞微軟亞洲研究院副院長。

　　保持好奇心和不斷探索新領域、勇於轉變研究方向的心態，讓劉鐵岩永遠不會滿足於既有的技術成就，相反，他時刻都在創新與突破的路上。

　　2018年3月，微軟宣布中英機器翻譯系統達到與人工翻譯媲美的水平，是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。支撐這項成果背後的重要技術之一，便是劉鐵岩和他的團隊最新研發的技術——對偶學習。

　　對偶學習的產生是為了要解決現有深度學習方法過度依賴大量有標籤訓練數據的問題。據劉鐵岩表述，人們關心的絕大部分AI任務都是為人服務的，但凡是需要交流的任務，就會有一個輸入和輸出，通常都會存在一個對偶結構。「兩個任務，一個任務的輸入恰好是另一個任務的輸出，反之亦然。」劉鐵岩舉例說，比如機器翻譯，中譯英是一個任務，英譯中是另外一個任務，兩個任務互為輸入和輸出，形成對偶關係。再比如語音識別和語音合成，也是一組對偶任務。

　　

　　也就是說，很多機器學習任務其實天然有結構對偶性，可以形成天然的閉環。一旦有閉環，就有反饋信號，就可以有效的去訓練模型，這樣就算只有很少的標註，也可以訓練，從而解決了過度依賴數據訓練的問題。

　　

瘋瘋顛顛 · 發表於 2019-2-2 09:48

除此之外，劉鐵岩還向網易智能介紹了自己最新的研究。第一個就是Learning to Teach，這個研究基於對現在機器學習框架局限性的反思，希望將機器學習的三個要素：訓練數據、目標函數、模型空間變成可以優化、學習和改變的對象，從而提升訓練效果。

　　

　　第二個是G-space learning，這個研究是為了解決神經網路中由於使用ReLU激活函數帶來的「病態」優化問題，告訴大家神經網路的權重空間存在很多冗餘，在該空間中直接做優化是不好的，應該在更加緊緻的鏈路空間中做優化，這樣可以大幅提高模型的準確率。

　　

　　新的機會

　　在微軟亞洲研究院浸潤了16年，對於研究工作本身，劉鐵岩頗有感受。在他看來，自己之所以能取得如此多的成就並不斷進行著新領域的研究，主要在於微軟亞洲研究院的開放的、積極向上的環境。

　　「研究沒有那麼明確的KPI，因為它本身就是多元的，更多的時候，我們是靠著自己的研究素養來判斷研究的價值。」

　　劉鐵岩認為，作為學者，他們正在迎來一波新的機會。隨著微軟亞洲研究院成立創新匯，劉鐵岩和團隊得以在金融科技、物流等領域與國內龍頭企業進行合作，真正將AI運用到這些領域，推動其數字化、智能化轉型。

　　對於創新匯的項目，劉鐵岩依然保持著強烈的好奇心。在他看來，雖然擁有AI技術的人和擁有領域知識的人來自兩個世界，在合作的時候會經歷一個痛苦的磨合期，但產業大幕只是剛剛拉開，任何的AI落地都不是那麼簡單的，雙方都需要去了解對方。

　　「比如，金融市場是動態的，傳統機器學習領域的基本假設在這個問題上不再成立。我們只有充分了解金融市場的內在規律，才能研究出全新的機器學習模型。我們有強烈的好奇心去學習金融領域的知識，並且為其量身定做出高效的機器學習方法。過去兩年的實踐表明，通過和合作夥伴的深入互動，我們已經開發出了行業領先的智能投資方法。」劉鐵岩說到。

科學匠人 | 「三清才子」 劉鐵岩：用好奇心探求AI邊界

科學匠人 | 「三清才子」劉鐵岩：用好奇心探求AI邊界