倍可親

回復: 1
列印 上一主題 下一主題

左手百度右手富士康,這家公司要為你定製虛擬女友

[複製鏈接]

4364

主題

9732

帖子

1萬

積分

七級貝殼核心

Rank: 5Rank: 5

積分
17462
跳轉到指定樓層
樓主
非常時期 發表於 2017-10-18 06:56 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  2017-10-17 21:36百度/富士康/手機

  智東西 文 | 寓揚

  還記得老羅(羅永浩)在2016年的鎚子發布會中特別感謝而又誤讀成「獨角獸」的公司嗎?沒錯,這家公司正是三角獸。也或許正應了老羅的話,隨著語音交互的爆發,這家專註語義理解的人工智慧創業公司也順風而上,迅猛發展。

  

  這家公司也有著異常豪華的團隊陣容,其CEO和CTO都是技術大拿,浸淫行業多年,在最著名的兩款語音助手微軟小冰和百度度秘中都起到重要的作用。他們還將NLP(自然語言處理)應用在手機中,從而讓手機更加智能化;還能打造帶有性格和風格的虛擬助手,可以試想未來為你定製虛擬女友都不是事!

  近期,智東西與三角獸創始人&CEO王卓然展開對話,看看這位扎身機器學習領域十幾年的技術老兵有著怎樣的創業故事?他眼中的語音交互行業又是如何?

  一、兩位技術老兵的相遇

  初到三角獸的會議室,幾張懶人沙發、顏色明亮而形狀不一的桌椅呈現在眼前,給人一種清新明快、自由隨性的感覺。通過與王卓然的溝通,可以明顯感受到他清晰的思路、侃侃而談,談到盡興出,再配上一聲帶有東北味的「哈呵哈」,顯得十分有趣。

  

  (三角獸創始人&CEO王卓然)

  他推了推眼鏡回憶到,本科在哈爾濱工業大學讀通信工程時,機緣巧合結實了計算機的圈子,大二便跟計算機學院的一個教授做自然語言處理相關的研究。

  畢業后在2005年去英國UCL(University College London,倫敦大學學院)讀博士,主攻的方向便是機器學習。博士期間他做了一個關於人機對話工作的兼職,便對這個方向產生了濃厚的興趣,2009年畢業后就去了世界上為數不多的人機對話研究團隊。

  而當時世界研究人機對話這個領域的學者並不多,那時不僅國內這這塊空白,國外的研究團隊也很少,大約英國有幾家,美國有幾家,歐洲零零散散的有幾家機構。王卓然笑稱:「當時每年開人機對話的會議,全世界也就那麼一兩百人」。

  之後他就去了當時具有悠久人機對話研究的愛丁堡的赫瑞瓦特大學,在那裡做了三年多的人機對話研究。再之後他去了在英國劍橋的東芝歐洲研究院,擔任人機對話組的技術負責人,帶領團隊做人機對話方面的研究。

  從赫瑞瓦特大學到東芝研究院這一階段,他研究的是人機對話中的跨領域遷移和泛化,具體來講就是怎麼把一個找餐館的對話系統遷移應用到找電影、買東西等相關的交互場景。

  而到了2015年初,百度啟動了度秘項目,便邀請王卓然加入,做度秘中控的技術負責人。所謂的中控,是度秘下面有很多的服務,如找餐館、找電影、閑聊、問答等等,一個指令來了之後,系統要決策由下面那個服務去滿足,然後將信息呈現給用戶。這種中控決策有點像搜索引擎的排序,但是需要考慮上下文信息、服務的相關性等更多因素,從而對整體服務進行排序和決策。

  在度秘項目中,他遇到了人生中的一個重要人物亓超,就是三角獸現在的CTO,另一個技術老兵。亓超參與了第一代的微軟小冰的打造,後來就被挖到了百度,又參與了度秘的研發,那時候還叫小度機器人,以閑聊為主。

  但是在度秘項目上做了不到一年,由於一些內部原因,度秘中途轉了幾次型,跟他和亓超的想法不太一致。再加上他們對自然語言處理這個領域有很長的認知和積累,認為會是下一代的技術方向,於是二者選擇在2016年初離開百度,出來創業。

  二、這家與「三」結緣的創業公司

  為什麼選擇在2016年初這樣一個時間節點創業呢?深處這個行業中的王卓然敏感的察覺到,在自然語言處理技術的成熟度上開始可以商業化了,而行業又有非常大的需求,因此就選擇創業這件事兒。結果沒過多久谷歌、微軟、亞馬遜等公司都開始陸續發布語音交互平台及產品,語音交互這個行業就火了。

  

  (左起:創始人CTO亓超、創始人董事長COO馬宇馳、創始人CEO王卓然)

  由於王卓然和亓超都是技術出身,當時就邀請了在商務方面很有經驗的馬宇馳負責商務和市場。「正是有三位創始人,所以就叫三角獸」,王卓然戲稱到。而這家公司與「三」的緣分遠不止如此,還融了三輪資,有三塊核心技術以及三大核心業務,真是巧了。

  亓超從碩士階段就從事自然語言處理的研究,在這個行業也做了十多年。先後在佳能、騰訊、阿里、微軟、百度等都有任職,其中最出名的就是參與了微軟小冰和度秘閑聊機器人的打造,應用的技術就是開放域聊天。

  馬宇馳則是王卓然的高中同班同學,傳媒大學畢業后,一直在商務、市場、公關行業做了很多年,在奧美、安利中國等都做過公關總監、市場總監職位。他也是個連續創業者,後來加入三角獸負責商務業務。

  在王卓然看來這是一個非常互補的創始人團隊,「他和亓超儘管都是技術出身,但是在技術上也是互補的,亓超做開放域聊天,他做垂直領域對話,再加上馬宇馳的商務能力,三角獸在技術和商務能力上就完美了」,他笑稱到。

  這三人就構成了三角獸的三隻「角」,創業一年之內(截止到今年1月份)拿下3輪融資,分別為天使輪1000萬人民幣,Pre-A輪2000萬人民幣,A輪5000萬人民幣。

  三角獸的下一輪融資也在進行中,下一輪融資的主要目的,一方面是布局市場、渠道,另一方面則是儲備更多的現金流。「現在AI行業很火,趁風口多拿些錢準備過冬」,王卓然嘿嘿一笑。儘管當下語音交互火熱,AI企業收到追捧,但是風總有停下來的時候,誰也說不準下一階段AI行業會不會遇冷,做足冗餘還是很重要的。

  目前三角獸團隊已經發展到90多人的規模,而在今年一月份才只有二三十人,其中北京有70多人,瀋陽還有一個10多人的駐場開發團隊。北京的團隊中,演演算法工程師佔了絕大部分,達到50多人,且技術人員多來自微軟,差不多佔到一半左右,其他的人員則來自百度、IBM、騰訊、樂視等公司,可謂豪華的技術團隊。

  

  三角獸簽約和客戶現在也已有20多家,以上市公司、各行業巨頭、品牌代表為主,比如百度、阿里巴巴、騰訊、小米、中國移動、鎚子、華為等等,這也從側面反映了三角獸在人機對話、語義理解這個領域中的實力。

  三、三大核心技術構建壁壘

  針對人機對話這個廣泛的話題,它涉及五大方面技術,包括問答、推薦、開放域聊天、垂直領域多輪對話、多領域對話。相對而言問答和推薦是比較傳統的技術,比較成熟,行業在這方面做的都不錯,技術壁壘並不高。而開放域聊天、垂直領域多輪對話、多領域對話則屬於人機對話研究的前沿領域,技術門檻較高,構成了三角獸的「壁壘性技術」。

  

  其一開放域聊天。所謂的開放域聊天就是閑聊,沒有目的的聊天,我們常見到的產品有微軟小冰和百度度秘。作為一種情感陪伴或者對話中的一種潤滑,它可以讓系統顯得更智能,這塊也是CTO亓超的核心研究領域。「之前的微軟小冰和度秘都是亓超做出來的,在三角獸就是亓超第三次做了,相比前兩款產品,三角獸的系統做了更好的上下文覆蓋,還做了情緒識別,並且準確率已經達到99%是目前業內最高的」,王卓然如是說。

  圍繞著開放域聊天,三角獸做了兩個版本的Chatbot(聊天機器人),一個是標準版,適用於成人;一個是兒童版,專門為兒童打造,目前已經上線相關平台成為一個付費Skill(技能)。

  做兒童聊天還是很有挑戰的,因為這塊的語料是很難獲取的,如果使用網際網路中的語料(成人的語料)又是很「不安全」的,難免出現一些不良信息。三角獸則採用一種獨特的方式,從兒童故事書、兒童字幕中抓取數據。但這個數據不是對話數據依然沒法用的,三角獸便用這些數據訓練一個模型,用它來過濾成人語料,並採用基於RNN(循環神經網路)的生成模型(而非檢索式),來確保對話內容對兒童「綠色健康」。「這塊產品去年就落地了,也是業界最早這麼做的」,王卓然談到。

  此外,在開放域聊天的應用中,三角獸開可以對Chatbot進行風格和性格的定製。這塊則是三角獸的獨家技術,能夠讓虛擬人物聊天的時候體現它自己的性格。

  第二塊技術是垂直領域的多輪對話,它是任務驅動的,如找餐館、找電影等,代表產品如智能音箱。三角獸在這個領域中有3塊具體核心技術:第一項是垂直領域對話的泛化和遷移,就是把一個領域訓練到的模型遷移到另一個領域,這塊也是王卓然專攻的一項技術。另一項是模糊語義理解,用戶提供的信息可能存在丟字拉字的情況,甚至錯字的情況,機器同樣能夠識別,如《羋月傳》火熱時,即使用戶說成「半月傳」,機器也可以準確理解,找到電視劇。

  還有一項是去結構化、輕結構化表示的技術。原來垂直領域的對話,依賴結構化的知識表示,比如電影有導演、演員、年份等這些結構化信息,可以用來找電影。但是如果你要找一個「男主角長得帥的電影」,這個信息沒法用結構化表示。「針對這種情況,我們把對電影的描述和評論用深度學習做了向量化的表示,去匹配用戶指令語義的相近程度,從而更好的滿足用戶回去內容的需求」,他指出。

  第三塊技術則是多領域的對話技術。比如,我訂了餐館,可能要導航去這裡,中途可能會問交通情況以及周邊相關信息等,這時就是多個領域融合在一起的對話,這就涉及到中控的工作。而王卓然曾以訪問學者的身份參與了百度語音助手時代的中控,後來又在度秘做了度秘的中控,在多領域對話管理這塊有著豐富的經驗。

  綜上,開放域聊天、垂直領域多輪對話、多領域對話管理就是三角獸的三大核心技術,王卓然稱之為「三大壁壘性技術」。

  四、服務三大核心業務

  技術固然重要,但對於企業而言更重要的是把技術落地,服務於行業。三角獸也將其技術積極落地,目前其三個主要業務分別是:企業服務、IoT(偏智能家居)和泛娛樂業務。

  其中,企業服務是三角獸市場收入最多的一塊,目前已經做好兩套標準解決方案。一套是智能客服,是問答、垂直領域多倫對話技術的落地,主要服務於電信行業、金融行業等大行業的大客戶,為其定製專門的業務流系統,如中國移動、廣發證券以及其他幾個基金項目。

  

  另一套方案是針對媒體的Chatbot,可以在媒體的公眾號、App中上線,用戶可以通過聊天的方式獲取新聞,可以幫助媒體將相關歷史新聞推送給用戶,從而增加文章的閱讀量以及用戶粘性,如新世界。

  IoT這塊儘管現在很火,但是整體不起量,目前不是三角獸的主要收入來源,但三角獸還是很看好這個行業的前景,因此也做了很多產品儲備。目前針對IoT中不同硬體主要提供Skill(技能)輸出,如閑聊、新聞笑話等。三角獸銷量最多的就是閑聊的Skill,包括標準版聊天和兒童版聊天,在Rokid、小米音箱、百度DuerOS中都有上線。

  還記得前一段富士康揚言要做面向IoT設備的語音交互平台嗎?三角獸也是其中的一個合作夥伴,並且是深度合作,富士康將整個後台的交互都交給三角獸來做,這等於在做一整套類似於亞馬遜Alexa的完整的語義系統。並且王卓然透露,第一代的產品將會在今年年底或者明年年初推出。

  第三塊業務則是泛娛樂。科技公司要做泛娛樂?沒錯你沒看錯,這正是三角獸開放域聊天中角色性格和風格定製技術的落地,主要面向動漫、二次元、遊戲、AR/VR等,圍繞IP打造更多元的產品。如可以打造一個虛擬角色,讓它7×24小時的和粉絲互動,並且聊天中體現人設的預設風格,比如一個二次元的萌妹子就要有萌妹子的說話方式,而不能用大叔的說話方式。

  

  這塊聊天的難度還是很大的,目前市面上也很少有賦予Chatbot風格和性格的產品。王卓然談到,這塊技術的第一次落地並不是二次元IP,而是一家機器人IP,Jibo是一個美國機器人團隊,他們在中國做本土化時,希望給他們的機器人定製一個美國男孩的性格特徵。「目前三角獸也在和一些二次元IP談合作,後續我們也會看到一些二次元角色的落地」,他透露到。

  關於這三塊業務,他也談到,企業服務是最大的營收來源,僅智能客服業務就佔到了企業營收的80%左右。而IoT業務因為市場沒有起量,收入較少,合作業以標準服務輸出為主,包括收取年費、流量分成或者按台收費(量大的情況下)等三種盈利模式。比如小米電視流量比較大,就採用了按流量分成的方式。而泛娛樂方面目前還沒有盈利,但前景非常大,三角獸也會繼續跟進。

 
格外小心

4364

主題

9732

帖子

1萬

積分

七級貝殼核心

Rank: 5Rank: 5

積分
17462
沙發
 樓主| 非常時期 發表於 2017-10-18 06:57 | 只看該作者
 五、將自然語言處理賦能手機

  最近隨著蘋果和華為的推動,AI晶元成為一個熱議的話題。手機的競爭正從之前的網路營銷、網路銷售變成更技術化的比拼,在後網際網路手機的時代,人工智慧正成為核心競爭點之一。

  9月初華為率先發布世界第一款AI晶元——麒麟970,緊隨其後的蘋果發布會中,蘋果也推出了自家研發的AI晶元A11。通過二者展示可以看出,計算機視覺、自然語言處理、AR等成為AI在手機中的應用方向。

  微信中一個典型的場景是,朋友喊你去某個地方吃飯,你需要複製這一段話,然後整體複製到地圖中, 並且刪減地址以外的文字,才能搜到地圖中的位置。打車場景同樣如此,這使手機中的操作顯得異常麻煩。因此,手機中的真正的智能交互才剛剛開始。三角獸一直以來也在和手機廠商合作,將自然語言處理基礎應用到手機中, 從而賦予手機更多智能。

  代表性的產品便是老羅的鎚子手機。還記得老羅在2016年鎚子的新品發布會上興奮展示的Bigbang 和 Onestep,就是三角獸提供的技術。Bigbang功能能夠讓一大段文字瞬間「炸開」,你可以隨意選擇你想要的文字,而這個炸開並不是隨意的炸,是以自然語言處理為基礎的。Onestep則實現跨場景跨App之間的聯動,讓需要多步的操作一步到位,從而大大提升效率。

  就在前不久老羅揚言要打造新一代語音交互系統,相信三角獸的技術也會在鎚子手機的新系統中得到體現。儘管他沒有透露更多的信息,但他介紹了三角獸自然語言處理技術在手機中的潛在應用場景。

  一個是當微信收到消息時,用戶可能沒有時間或者懶得打字回復,三角獸可以提供聊天回復的自動生成,自動提示回復內容。還可以通過對文本中的情緒分析,進行表情生成。再一個就是App之間的一步喚起,類似鎚子手機中的Onestep,打通App之間的信息交互,從而讓用戶的操作更加便捷。

  而這些背後都是三角獸的自然語言理解、聊天回復自動生成、情緒分析技術。王卓然談到,這幾個技術都有對應的產品,比如一鍵喚起,有一套完整的解決方案,目前和幾個手機廠商在合作中。

  六、國內人機對話才剛剛開始

  語義理解在語音交互中是最難的一塊,但限定場景和邊界,就可以讓人機交互的效果得到顯著提升,即所謂的專有模型,那麼由專有模型轉換到通用模型的技術進展到哪種程度,其適用性又如何?

  王卓然談到,對話管理有兩塊核心技術,第一塊是基於上下文語義理解的部分,理解用戶的意圖是需要限定場景的,需要針對某一領域去搜集數據進行優化,從而真正把握用戶的意圖,但它的模型是可以通用的,不同的領域都是分類、標註、尋找相關實體的一個過程,這個邏輯關係是可以泛化的。第二塊是對話策略,對話不僅要機器去理解,還要機器去處理一個複雜的決策過程,這個決策過程不論是找餐館、找電影還是找音樂,都可以理解成一個能夠抽象的「找」的過程,抽象的邏輯在各個領域之間是通用的,這部分可以去做跨領域的遷移。

  關於人機對話跨領域的遷移和泛化,王卓然在東芝歐洲研究院時就做過,是可以應用的,因此在這方面有比較早的積累。但是國內在人機對話方面起步較晚,真正專註做這個方向的也比較少。目前國內還處在人機對話的第一步——垂直領域對話,還沒有進展到對話的遷移和泛化地步。

  而針對虛擬角色性格和風格的定製的難點是什麼?為什麼三角獸可以做到呢?王卓然坦言,性格是很難量化描述的,語料來源也需要做很大的處理,使訓練模型的語料能夠體現虛擬人物的性格。但它並不是一個黑科技,而是一個基於常年積累的複雜的工程化的事情,需要對通用的回復做改寫、做句子的自動變形、插入口頭語、語序調整等等,如果對開放域聊天的每一個環節知識積累不夠的話是做不了的。儘管如此,每一個虛擬角色都需要定製化,因此三角獸會更傾向於跟一些大IP進行合作。

  此外,大大小小的會議上我們總談語義理解是語音交互的核心瓶頸,那麼這個瓶頸到底是什麼呢?在王卓然看來,並不是每個場景的數據都好搜集,比如找電影這個領域的數據就好搜集,但是像兒童場景的數據就不好搜集。

  所以這塊瓶頸的突破在於,首先要有場景下的落地,才能搜集垂直領域用戶的真實數據,用來優化模型,從而將領域相關的語義變成機器能夠處理的語義,這是一個相互迭代的過程。

  自然語言處理是一個知識積累和數據壁壘的過程,核心首先是把技術應用到更多產品上,從而拿到更多領域的數據,通過數據壁壘來提高技術壁壘,從而再鞏固商業壁壘。而人機對話這幾年剛剛興起,進入日常生活,它需要一個積累的過程,就跟搜索引擎剛出來時,大家不做網頁你也搜不到東西,是一樣的道理。

  七、看好手機、客服、泛娛樂應用場景

  在自然語言處理的應用場景中,王卓然更看好手機、智能客服、泛娛樂幾個應用場景。

  

  毫無疑問手機是一個十分龐大是市場,也是最為剛需的場景,AI晶元的出現則代表了手機真正智能化的趨勢,上文已有詳細論述。

  而智能客服則是當下的「現金牛」行業,對大企業客戶來說也是一種剛需,從而優化其業務處理,同時減少人力成本,許多做語義理解的公司都涉及該項業務。此外,王卓然還看好泛娛樂場景,儘管這是一個偏傳統的行業,但毫無疑問每一個優質IP都具有巨大的價值,並且凝聚著大量粉絲,而這背後代表了豐厚的利潤。

  但當談到智能音箱和IoT行業時,王卓然表現出了猶豫,他坦言「不是不看好,而是看不清」。在智能家居這個行業,他畢竟不是家居的製造商,在行業沒有很大發展的情況下,他也只能觀望,謹慎布局,畢竟作為一家創業公司,首先要考慮的是活下來。

  至於智能音箱,他認為亞馬遜Echo的成功有幾個條件是在一起的,亞馬遜本身就是一個平台,它收購了一系列公司,從硬體設計、語音識別、語義理解等整個鏈條都是自己做的;從體驗上看,亞馬遜把各項指標都做到了極致;由於自身是巨頭公司、平台,又把價格控制在合理的範圍內;並且國外還有客廳文化,是有應用場景的;這幾方面加在一起導致了Echo的成功。

  但是國內這幾方面都需要論證,「智能音箱是一個新品類,能不能爆發,都是不確定的」。此外,他也談到了小米AI音箱:「小米音箱至少有一個好處,價格控制的足夠低,從設計到用戶體驗到價格都是不錯的」。

  針對近期不少公司推出語音交互平台,其中也不乏創業公司。王卓然則認為創業公司做平台可能會不太樂觀,首先你要有平台的優勢才能說是平台。儘管創業公司也可以做平台,但是做了平台誰來用?怎麼獲取更多客戶?怎麼直面巨頭的競爭?不管你的產品做的多麼好,在很多渠道、內容資源上,創業公司都是不佔優勢的。

  然而三角獸恰恰也在布局平台,王卓然話語一轉道:「既然做IoT市場,做平台是早晚的事,那麼什麼時間最合適呢?就是有一個大平台跟我們合作的時候」。這也解釋了三角獸為何要和富士康一起做平台,有一個大平台的存在,確實可以大大降低投資風險,最差也是當項目做。

  結語:技術落地是關鍵

  行文至此,我已然對三角獸團隊有了更深入的了解。外表看這是一家風光無限的明星創企,有著深厚背景的創始人團隊,以及來自微軟、百度的眾多優質人才。

  然而這背後則是他們對自身技術落地的探索和嘗試,只有落地才有數據,才能迭代技術,也只有落地才有商業模式,才能盈利。技術從來都不是高高在上,只有融入尋常生活才能煥發生機。而作為一家創業團隊,生存又是第一位的。

  透過這家公司,我們也看到國內的人機對話還處於早期,才剛剛起步,需要更多的人才和團隊將技術應用更多的場景,搜集數據,迭代技術。正如王卓然所言「先把技術落地到產品上」。

格外小心
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-6-19 11:28

快速回復 返回頂部 返回列表