直擊亞馬遜Alexa Prize對話機器人大賽，中國小伙帶領華盛頓大學拿下冠軍

非常時期 · 發表於 2018-3-2 11:53

　　2018-03-02 07:10亞馬遜/機器人/人工智慧

　　

　　【獵雲網（微信號：ilieyun）】3月2日報道（編譯：堆堆）

　　亞馬遜如今正和競爭對手一同深陷「對話式人工智慧」的陣地戰中。為此，公司組織了一場競賽——目標有些古怪，那就是編造一個能進行短對話的機器人。

　　第一個互動者是一位肌肉發達、50歲左右的男性。他走進一間會議室，坐在了一個低矮的藍色扶手椅上，椅子前方是很多的攝像頭以及棚燈。他所在的位置被棚燈照射著，屋內其餘地方都是黑暗的。他盯著一個黑色、冰球狀的物體——亞馬遜的Echo，說道：「Alexa，我們來聊天吧。」

　　「早上好，我的朋友。」一個女性聲音回應道，與此同時Echo上方閃爍著紫光。它又說道：「現在是下午嗎？我不太確定。」

　　「是早上。」男士回答道。

　　「那太好了，早上的話所有人都元氣滿滿……那麼，你今天過得怎麼樣呢？」

　　「很不錯，你呢？」

　　「我還是比較忙，人們一直在跟我聊天……不過，給你說個笑話。這是Reddit上最新的帖子：牙膏只不過是清洗嘴巴的肥皂。」

　　順著大廳向前，在另外一間會議室里，十位亞馬遜員工戴著耳機坐在長桌旁，監控著這些客套話。而在另一間房裡，三位男性則被黑色幕布封鎖在小隔間里。他們同樣戴著耳機，前方也有攝像頭進行拍攝。最後在控制中心裡，拍攝員工在一個大屏幕上監控著所有發生的細節。

　　這場聲勢浩大的行動發生在去年11月份，為期數月的競賽進入了最終的評判階段。全球最頂尖的計算機科學研究生組成了15支隊伍，亞馬遜想要讓他們開發出一個「能夠連貫與人類就熱門話題交流20分鐘時間的社交機器人」。如果有隊伍成功了，那麼這一支隊伍就可以盡享學術榮光，並獲得光明的未來。成功的隊伍還會獲得巨額獎金——亞馬遜將其稱作是Alexa Prize。

　　近幾年來，亞馬遜一直在迫切探索聲音人工智慧。其野心堪比它想要征服零售行業的慾望。公司已經安排了5000多人來研發Alexa平台。從2015年起，據稱亞馬遜已經賣出了2000多萬台Echo。亞馬遜相信未來有一天，人工智慧可以做到的事情遠不止於控制燈光和播放音樂。它們還會開車、確診病症，滲透到我們生活的方方面面。聲音將成為主要的交互界面，而對話——實用、具備信息量、友善且有趣的對話——將成為最終的產品。

　　但早期的成功還有野心卻將亞馬遜推落懸崖，落入了一個廣大但卻充滿威脅的山谷。如今，Alexa和所有的聲音助手一樣，時常無法理解用戶的聲音。人們快速接受並大範圍使用該平台，這也促使消費者產生了對於高效語音助手的需求。在設置鬧鐘以及完成一次性指令方面，Alexa表現不錯，但是語言是一個互動社交模式。「人們希望Alexa能夠像朋友一樣和他們進行交流。」負責Alexa人工智慧研究團隊的Ashwin Ram說道。參與人類對話已經成為了人工智慧行業最棘手的一大難題之一，而亞馬遜卻一頭栽入其中。

　　Alexa Prize還算不上是第一個試圖從聊天機器人那裡建立人機融洽關係的競賽。過去三十年來，每一年都會有少量計算機科學家和愛好者聚集在一起，試圖角逐羅布納獎（Loebner Prize）。參賽者需要讓裁判相信聊天機器人其實就是人類。這些年來，這一獎項引發了部分爭議——一些人工智慧研究學者稱其是在做秀——而與此同時這還引起了大家對於機器與人類之間存在何種差別的深思。但是Alexa Prize卻有一些不同。首先，獎項的目的並非是要愚弄大家相信Alexa是真人。其次，這場競賽的規模——其背後花費的人力、財力和計算力——是巨大的。2017年的幾個月內，美國境內的每一個人都會對他們的亞馬遜聲音設備說「Alexa，我們來聊天吧」，這些設備能夠與隨機選擇的測試機器人進行對話。之後，他們會受邀對此進行一到五星的評分。這些機器人會被數百萬互動者進行評分，這就使得Alexa Prize競賽成為了全世界最大的一次聊天機器人對決（從數量級來看）。

　　

　　圖為Alexa Prize大獎賽裁定時亞馬遜的控制室

　　對話式人工智慧的探索使得亞馬遜、蘋果、Facebook、谷歌以及微軟開始同台競爭兩大重要資源。第一個資源是有限的：計算機科學領域頂尖的博士（這部分人由於稀缺性，他們的薪資高達六位數）。第二個資源是無限的，但卻很難獲得：對話本身的樣本——人們會收集數十億段對話，並將其數字化處理，用於訓練人工智慧。在此背景下，Alexa Prize就是亞馬遜的一記妙招。這項比賽不但能夠搜索到全球最頂尖的人才，還能夠以對其有利的價格挑選人才。此外，它還為亞馬遜提供了收集對話數據的機會，這是其他任何一家科技公司都不曾擁有的珍貴資源。

　　當亞馬遜在2016年9月29日首次宣布這項比賽時，22個國家超過100支隊伍提交了申請。基於技術優勢和獨創性，公司挑選出了15位競爭者。除了進入總決賽的三支隊伍以外，其餘12支隊伍都會獲得10萬美元的獎金，公司也會為其提供後續支持。

　　和大學生籃球聯賽一樣，參賽隊伍既有「系出名人」、奪冠呼聲最高的選手，也有出色的競爭者和勇氣十足但相對弱勢的參賽人員。蒙特利爾大學的隊伍擁有深度學習開創者Yoshua Bengio擔任指導教師，這一點自然而然就讓他們成為了種子選手。中段隊伍來自於一些知名院校，如華盛頓大學、普林斯頓大學以及蘇格蘭首屈一指的研究型大學赫瑞·瓦特大學。之後就是一些弱勢參賽者了，比如說布拉格的捷克科技大學。

　　在捷克科技大學的團隊中，其中一名留著整齊山羊鬍的成員叫作Petr Marek。在這次比賽之前的暑假，他花了一些時間去開發被他稱之為是「愚蠢」的聊天機器人平台。與此同時，他還要作為童子軍帶隊者穿越波西米亞的森林。當他聽說了Alexa Prize時，Marek很擔心團隊所在學校不符合要求。他想：「不管了，至少可以嘗試一下，但我們和那些頂尖大學相比，贏的幾率不大。」在獲悉團隊進入比賽之後，他們決定給機器人命名為Alquist。這個名字起源於20世紀初捷克首次使用「機器人」一詞的戲劇。在劇中，機器人佔領了地球，而Alquist成為了地球上最後一名人類。

　　15支隊伍都面臨著一個對比賽有著決定性意義的問題：社交機器人的大腦中，究竟哪一部分需要手動編製，哪一部分又應當採用機器學習呢？手動編製是相對傳統的方式，這指的是工程師會編寫大量規則組合來指導人工智慧進行理解和回應。而相比之下，數據趨向型的機器學習就是讓計算機通過大量的數據學習對話。

　　所有的隊伍都知道機器學習是一個更好的方式，因為它能解決分類問題，即神經網路會在繁雜的數據中找到統一的特徵。舉個例子，語音識別對於機器學習來說就是一個很簡單的事情。但是對語言作出反饋，這一點機器學習還有很遠的路要走。這也是為什麼即便是在Alexa和Siri的數字大腦中，傳統的手動編製方式也依然會被考慮的原因。因此，比賽中的每一支隊伍都很難抉擇——這和科技圈差不多——你很難在兩種方式之間找到平衡。

　　手動編製已經過時了，機器學習正處於白熱化階段。Marek和他的團隊成員知道所有強大的院校都會極度偏向後者，因此他們認為自己也應當如此。為了幫助Alquist自動回應Alexa用戶，團隊利用了從Reddit用戶那裡獲得的300萬條消息反饋組合，用來對神經網路進行訓練。讓他們失望的是，最後的結果「非常糟糕」。Alquist會在用戶從未說過的話題和參考內容之間隨意跳轉。它會發表一個觀點，之後又否認。「和這樣的人工智慧進行對話，這既無意義，也同樣無趣。這太荒唐了。」 Marek在團隊博客上寫道。

　　之後，團隊又嘗試了手動編製，這讓團隊可以更好地控制機器人。不過Marek表示了擔心。該系統非常依賴用戶的善意，成功與否取決於用戶是否用簡單的句子進行對話並且跟隨機器人的引導。如果碰到不合作的用戶——比如說通常不太耐心的人——這款社交機器人就很容易失敗。

　　獲勝的三支隊伍中，還有一支隊伍表現穩定，那就是華盛頓大學。這支隊伍選擇了一個較為折中的方式，它在系統中結合了基於規則的編程以及機器學習。該系統的優勢似乎源於28歲團隊負責人郝方的性格。他來自於中國南部山城宜春市。他活潑好動，性格開朗，團隊希望這款社交機器人也能同樣如此。那他們該如何創造出可以讓人們樂在其中的對話呢？

　　為此，華盛頓大學團隊調整了系統，過濾掉那些令用戶感覺糟糕的內容。郝方表示，該系統應該尋求「更有趣、令人振奮、對話式」的內容，而這些內容通常來自於 subreddits板塊，比如說 Today I Learned、Showerthoughts 和 Uplifting News。這些語料可以讓社交機器人迅速生成一些活潑的內容。

　　該小組還手動製作了大量的反饋話術，比如說「你似乎是想談談新聞」、「很高興你喜歡它」，「對不起，我沒明白」一類的話。健談的同時還要注重人們的情緒，所以華盛頓大學團隊對 2000 個對話樣本的情緒特徵進行了手動標記，並用它們來教會社交機器人識別人類的回應——高興、厭惡、愉快、好奇——並做出相應的反饋。

　　比賽最後，UW團隊贏得了冠軍，登上了舞台。Prasad交給了他們一個巨大的支票——50萬美元。Prasad之後也宣布了亞軍和季軍，分別是捷克科技大學以及赫瑞·瓦特大學，它們分別獲得了10萬美元以及5萬美元的獎金。

　　那麼亞馬遜、這些團隊以及人工智慧圈能從這場手動編製以及機器學習的辯論中得到什麼結論呢？冠軍UW在這兩者之間是不偏不倚，而偏向手動編製的捷克隊伍最終收穫了亞軍。最積極使用機器學習的是第三名赫瑞·瓦特大學。即便比賽結果無法明確解答這一問題，但一個混合技術系統的勝利向Ram以及其他人工智慧專家已經說明了答案。Ram表示我們正在開始嘗試去探索如何以最好的方式將兩種技術結合在一起。

　　所有的參賽選手都認為更多的對話數據才能最好得推動機器學習的發展。而這一點也成為了亞馬遜自己的「戰利品」。通過這次比賽，用戶和社交機器人進行了數百萬次互動，總計超過10萬個小時的聊天內容。這一切都成為了公司的官方財產。如此一來，這場競賽的另一大勝者是顯而易見的：那就是亞馬遜。

　　本文來自獵雲網