最全一手講者報告實錄+BATJ等企業展位，360度帶你重溫AAAI

華盛頓人 · 發表於 2018-2-19 13:56

　　【春節最強AI遊記】最全一手講者報告實錄+BATJ等企業展位，360度帶你重溫AAAI

　　2018-02-19 12:21BAT/阿里巴巴/人類

　　

　　新智元專欄

　　作者：張祥文

　　編輯：小奇

　　【新智元導讀】廈大學子以一篇圖文並茂的遊記，帶你重溫今年的AAAI：詳細介紹數場重磅講者報告、亞馬遜及阿里巴巴等提供工作機會的Job Fair、BATJ等企業展台。

　　

　　最近，廈門大學軟體學院計算機科學與技術專業研究生二年級張祥文，參加了AAAI-18，以圖文並茂的形式為讀者帶來了一篇精彩遊記。

　　會議簡介

　　AAAI-18的舉辦時間從2月2日持續到2月7日，會場在密西西比河畔，大會期間正值新奧爾良狂歡節前夕，慶祝和遊行活動早已開始進行，而AAAI-18的logo也戴上了一頂歡樂的小丑帽。

　　

　　會議官方圖片

　　

　　大屏幕Logo

　　

　　參與者逐年變化趨勢

　　今年是AAAI參與者規模最大的一年，和去年相比提升了36%。

　　

　　論文提交／接受量趨勢

　　論文提交數量也達到有史以來最多的3808篇，相較去年增加47%，論文接收數量達到938篇，增幅同樣逼近47%。

　　

　　按國家和地區區分的論文提交／接受量

　　按照國家和地區來劃分，來自中國的研究者提交的論文數量最多，其次是美國，而來自兩個國家作者的論文接收數量則平分秋色。

　　

　　按研究領域劃分的論文提交／接受量

　　從今年的論文提交數量來看，最熱門的研究領域首先是機器學習方法，其次是計算機視覺和自然語言處理。

　　

　　視覺領域發展迅速

　　其中計算機視覺領域的發展速度最為驚人，和去年相比，論文提交數量增加了257%。

　　講者報告

　　Human-Aware AI

　　

　　第一場邀請演講來自亞利桑那州立大學Subbarao Kambhampati教授的報告，他同時也是AAAI協會主席，演講主題是關於人類感知的AI系統所面臨的挑戰。

　　自從來自Deepmind的AlphaGo與李世乭對弈一戰成名，人工智慧一詞漸漸開始為大眾所知。伴隨著關注，更多的是關於人工智慧利弊的爭議，有人認為它是未來，是新的發展能源，也有人將其崛起視為人類生存發展的威脅。

　　而普通大眾更關心的，則是AI對生產力變革的影響，自己的工作是否會被AI技術所取代。在某些領域，AI會無可避免地快速超過人類，而Rao為我們解釋了AI與人類協作共存的可能性以及挑戰，並稱其為Human-Aware AI。

　　我們希望HAAI能夠以助手的角色，或團隊協作的方式為人類提供幫助，例如協助人類執行搜救任務。HAAI之所以沒有成為主流，主要是因為目前擅長識別和推理等任務的人工智慧，還很難實現對人類情感和社會智能的建模，儘管對於人類而言這是一件再自然不過的事情。

　　以強化學習為例子，一個與環境交互的agent通過執行一系列動作，獲得相應的反饋並感知環境變化，從而制定決策繼續下一個動作。而與人類協作的機器，除了環境之外，還需要和人類進行交互，獲得人類的反饋和心理狀態變化，來影響下一個動作的選擇。

　　無論是人或者機器，他們的方案都會隨著一次次的交互而不斷演進。機器所認為的最優方案並不一定和人相同，有效的人機協作，需要機器對人的目標和意圖進行建模，換句話說，需要識別和預測人類的意圖，以減小人機在各自方案上的差異，從而達成一致目標。

　　同時，在與機器合作的過程中，我們希望機器所展現的行為是可理解的，而不是做出讓人摸不著頭腦的選擇，當不得不做出這種選擇時，機器應該向人類為其行為提供相應的解釋。更多細節可以通過Rao的相關工作了解，他本人便是HAAI方面的研究者。

　　Learning and Reasoning about the World using Language

　　

　　Yejin Choi

　　

　　Learning and Reasoning aboutthe World using Language

　　福克斯新聞曾報道了一個標題為」Cheeseburger Stabbing」的消息。只看標題，我們會猜測，有人刺傷了漢堡嗎？漢堡刺傷了人？還是漢堡互相傷害？或者有人因為一個漢堡而互相傷害？

　　事實上這是一篇男子因為漢堡發生爭執而刺傷母親的報道。但出於不言而喻的常識，我們會很快為前三個提問給出否定的答案，因為人刺漢堡不算新聞，另外漢堡不能刺傷人，更不用說互相傷害了。

　　這是我們根據常識得到的結論，而常識一般而言是不能從字面上推理出來的，因為人們不會聲明那些顯而易見的事實，正如我們不會可以強調，人的體型比鉛筆，椅子或者毛巾更大，這稱為報告偏見(「reporting bias」)。

　　我們可以從視覺上獲取信息來推理出「體積」這樣的事實，但圖像在傳達強度，重量，速度等知識上仍然有著無法逾越的鴻溝。華盛頓大學的Yejin Choi副教授選擇了回到自然語言中，從語言中推理這些圖像無法展示的知識。

　　她向我們展示了她的部分工作，第一個是用少量標註數據從動詞和成對實體中，在體積，重量，強度，剛度和速度5個維度上，用置信傳播演演算法聯合地生成動詞與成對實體所蘊含的相對物理屬性，從無標註文本中提取簡單的物理常識。

　　舉個例子，已知關係（size,X>Y）表示實體X在體積上大於Y，如果這個關係以較高概率出現在A eat B這樣的結構中，那麼可以推理出，當動詞eat出現在上下文中時，隱含意義是其主語在體積上大於謂語。

　　很明顯，這一方法把可抽取的知識範圍限制在了有限個簡單的屬性上。在ICLR2018的另一個工作中，他們提出了Neural Process Networks的新架構來模擬敘事過程中的故事進展變化。

　　比如土豆在cut和wash之前是完整和不幹凈的，在這兩個動作結束后，其狀態就變成分離和乾淨的，這個狀態變遷的結果同樣是隱含的常識。這個模型同樣以動詞和實體為下層建築，隨著故事的進展，追蹤、預測實體受到動作影響而產生的狀態變化，相當於通過模擬動作的因果關係來推理出隱含的知識，即動作對實體屬性造成的改變。

　　這個模型完全基於神經網路，很大程度上緩解了前一個方法存在的稀疏問題，並且可學習到的知識也不再限於給定的5個屬性。

　　How Machines Learn Best from Humans

　　

　　Interactive ML示意圖

　　

　　缺少人類參與的情況下，搜索空間非常巨大

　　

　　Interactive RL示意圖

　　這場邀請報告比較特別，來自喬治亞理工學院的Charles Isbell和布朗大學的Michael Littman兩位教授以辯論的形式討論了人工反饋在增強學習中的價值。一開始的時候，Charles先拋出了一個問題，當我們可以用大量數據實現機器學習的時候，何必還要人類參與到學習過程中呢？互動式機器學習真的行之有效嗎？

　　

　　人類是仲裁者，知道最終的目標是什麼

　　人類作為機器學習效果的裁判，了解什麼是自己真正需要的，以及學習器的最終目標是什麼。如果人類直接通過命令告訴一個機器人應該怎麼做，而人們實際上並不確信自己在做什麼，那麼機器人將花費更大的代價來解決這些命令帶來的負面作用。

　　於是我們思考將人類作為增強學習中反饋信息的來源以實現交互，而不是讓人類直接干預機器的學習過程。世界上沒有兩片相同的葉子，人也一樣。不同的人對同一個動作可能給出不同的反饋，所以人工反饋並不適合直接作為獎勵函數。

　　相反，可以選擇將其作為advantage function的輸入來預測兩個動作之間的差異。這一做法使得反饋信號變成可微的，同時由於人工的有效介入，策略能夠更快地成型，因此可以加速RL模型的學習過程。

　　

　　Probabilistic Machine Learning and AI

　　

　　深度學習的局限

　　報告來自Zoubin Ghahramani，身兼劍橋大學信息工程教授和Uber首席科學家兩個職位。

　　神經網路=非線性函數+基本統計學+基本優化方法，而深度學習只是在神經網路定義的基礎上，增加了架構和演演算法上的創新，大規模的數據和計算資源，以及不可忽視的媒體造勢宣傳。

　　深度學習模型性能強大，但對數據規模要求很高，無論在訓練還是部署上都是計算密集型的，而且不易集成先驗知識，對模型優化演演算法的要求也很嚴苛，最為人所詬病的就是其黑箱特性，模型的推理過程不透明，人們很難確定其結果是否值得信任。

　　

華盛頓人 · 發表於 2018-2-19 13:56

當模型遷移到沒有見過的領域上時，我們希望模型應該「know when they don』t know」，也就是說模型應當對領域外的樣本表現出不確定性，而深度學習的另一個缺點就是對不確定性的表示能力很弱，所以不能很好地適應領域外樣本，並且容易受到對抗樣本的攻擊（有研究表明包含不確定性的模型對對抗樣本的防禦能力更強）。

　　

　　概率對AI很重要

　　機器學習與概率建模密不可分，機器學習演演算法可以視為是概率建模的過程，P(D|theta)是參數theta的似然，P(theta)是參數先驗概率，P(theta|D)是給定數據時參數的后驗概率，這三個部分通過貝葉斯公式串聯起來可以定義機器學習中的學習、預測以及模型選擇問題。

　　概率建模可以引入先驗知識到學習系統中，構建具有做出合理決策能力的系統，確保演演算法在小規模和大規模數據上都能有效。

　　

　　概率建模在Uber的應用

　　在Uber，概率建模被應用於供需預測，城市交通模擬，ETA（Estimated Time of Arrival）估計，定價，財務預估，自動駕駛等等場景。

　　

　　GPDNN，高斯過程和深度神經網路混合模型

　　GPDNN是一個高斯過程與DNN的混合模型，其中高斯過程作用於DNN的頂層，GPDNN可以同時集成GP和DNN的優點，既能表示不確定性，同時也具有優秀的模型性能，而且對對抗樣本的抵禦能力也更好。

　　當訓練好的GPDNN預測對抗樣本和領域外的樣本時，輸出的概率分佈具有很高的熵，證明模型沒有像普通DNN模型一樣過分自信地對這些樣本做出估計。

　　

　　概率編程

　　概率模型的開發過程相對DNN而言更加耗時，並且容易出錯。幸運的是，目前已有不少編程語言或函數庫擴展實現了對概率建模的支持。

　　

　　Zoubin

　　概率建模為構建AI模型提供了一個框架，該模型能夠推導不確定性並從數據中學習，並結合決策理論，從而構成理性決策系統的基礎。

　　Job Fair

　　在AAAI-18上提供工作機會的公司包括Adobe，阿里巴巴，亞馬遜，百度，滴滴出行， IBM，京東，微軟，尼桑，三星，騰訊等。

　　企業展台

　　AAAI-18到場的包括來自國內的阿里，騰訊，百度，滴滴，京東和小i機器人，以及亞馬遜，Uber，Lyft，IBM，索尼，微軟等企業。照片在technical session過程中拍攝，因此照片中的各個企業展台前人流都比較稀少。

　　阿里巴巴

　　

　　阿里在2月5日晚上舉辦了一個招待會，為國內外的研究者提供了一個交流合作的機會。阿里的技術生態由業務平台，以及下層的機器學習/語音/NLP/計算機視覺/圖形，搜索引擎，廣告引擎，計算平台，數據平台，演演算法平台等部分組成。

　　AI技術在阿里的應用場景涵蓋ET大腦，天貓精靈，智能電子商務，Alimebot，風險控制與防禦等。ET大腦分為城市大腦，工業大腦和醫療大腦。ET城市大腦的目標是成為城市樞紐，對整個城市實現所有資源、基礎設施的全局分析和動態調皮，成為一個管理城市的智能平台。

　　城市大腦目前已在杭州有效地用於緩解交通擁堵問題。ET工業大腦的目標是提升工業製造中的產品質量和產量，將AI技術集成到現有的製造生產線上。ET醫療大腦的目標是通過對海量醫療數據的分析和學習，以醫生助手的角色參與到各領域的研發中。

　　百度

　　

　　百度展台的工作人員帶來了一個智能翻譯機，這個翻譯機通過內置WiFi請求翻譯介面，實現實時語音翻譯。百度是最早上線神經機器翻譯的企業，早於谷歌翻譯，但百度仍然同時基於統計機器翻譯和神經機器翻譯技術。

　　這是因為後者存在性能瓶頸，當翻譯介面請求量高時需要對請求降級，轉而使用統計翻譯提供服務，這是對性能和響應速度的一個取捨。

　　百度知識圖譜是目前規模最大的中文知識圖譜，提取自整個網際網路，涵蓋了上億實體和上千億事實。百度知識圖譜被應用於自動問答，可以直接在搜索結果頁頂部呈現和用戶查詢對應的答案。此外還有基於知識圖譜的內容推薦和內容生成等應用場景，用來根據關鍵詞生成百科詞條。

　　騰訊

　　

　　騰訊事業群制度將業務劃分成7個部分，分別是技術工程事業群(TEG)，微信事業群(WXG)，社交網路事業群(SNG)，移動網際網路事業群(MIG)，企業發展事業群(CDG)，互動娛樂事業群(IEG)和網路媒體事業群(OMG)。每個事業群都在提供機器學習、數據分析等方面的實習崗位和工作職位。

　　京東

　　

　　京東同樣表達了對眾多工作崗位的需求，遺憾的是由於京東工程師沒有在場，我們沒有機會了解涉及AI的業務方向的細節。京東正在招聘的研究方向包括機器學習，自然語言處理，計算機視覺，信息檢索，語音識別，數據挖掘和推薦系統等。

　　索尼

　　

　　索尼參展的主要目的是宣傳他們的開源項目nnabla。nnabla包含索尼開發的一個開源軟體框架Neural Network Libraries，主要代碼由C++實現，可以在Windows，Linux，MacOS，HPC集群和嵌入式設備上運行。內置常用函數，語法上比較簡潔，可以看到TensorFlow和PyTorch的影子。框架同時支持靜態和動態計算圖，方便根據不同數據結構高效地構建神經網路模型。

　　除此之外的最大亮點是為Neural Network Libraries定製的Neural Network Console。NN控制台是一個GUI程序，以NeuralNetwork Libraries為基礎通過可視化操作構建、訓練和評估神經網路模型。

　　每個組件代表輸入單元，函數變換或自定義函數，以及輸出單元，可以通過拖拽組件來試錯，即時反映模型設計上可能出現的錯誤。在訓練階段，NN控制台可以隨時展示訓練進展和評估模型效果。

　　NN控制台目前支持Windows和Cloud版本，Windows版本可以在本地設計和訓練模型，Cloud版本目前提供最長10小時的試用時間。總體上來說對用戶很友好，但相比現有的其他框架暫時沒有發現明顯優勢，有興趣的小夥伴可以嘗試一下。