倍可親

回復: 1
列印 上一主題 下一主題

傅盛:希望做出有用的機器人 不希望只是一個噱頭

[複製鏈接]

1萬

主題

2萬

帖子

3萬

積分

貝殼精神領袖

Rank: 6Rank: 6

積分
35927
跳轉到指定樓層
樓主
華盛頓人 發表於 2018-8-19 07:00 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
      [size=4]2018年08月18日 10:58 新浪科技

  新浪科技訊 8月18日消息,2018世界機器人大會擬於8月15日至19日在北京亦創國際會展中心舉行。大會以「共創智慧新動能 共享開放新時代」為主題,由「論壇」、「博覽會」、「大賽」、「地面無人系統展示活動」四大版塊構成。 本屆大賽匯聚了來自美國、俄羅斯、德國、日本、以色列等全球近20個國家和地區的1萬餘支賽隊和數百名頂尖專家,共計超過5萬多名參賽選手同台競技。


  獵豹移動科技有限公司首席執行官傅盛在論壇上發表了題為「真有用——推進中國服務機器人的產業崛起」的演講。


  以下為演講全文:


  什麼是下一個更大的機會?任何一個企業都是時代孕育生長出來的,所謂的創新無非就是在一個社會快速變化的時候抓住那個社會領域之間產生的縫隙,然後把需求發掘出來而已。個人並不認為我們有機會去做所謂的創新,更多的是做發現,發現這個社會需求的變化,然後在恰當的時候去做一件恰當的事情,讓它自然地生長出來。


  獵豹移動在美國有幾千萬的用戶,並很早就在矽谷設立了辦公室,我自己也在矽谷生活過一段時間。我在中美兩國來回跑,相對中國來說,目前美國的網際網路服務實在是太落後了,要在那裡上網買個東西一定不可能像北京這樣幾個小時就能送達。我們當時是想清楚了這個問題,四年前的時候我發現中國整個移動網際網路的應用已經領先於美國了,當時在國內競爭太激烈,對手特彆強大的時候,我們選擇了國際化,並且在全球做了一個小型APP,專門清理手機上的垃圾和病毒,叫做「獵豹清理大師」,兩年內在全球擁有了好幾億的用戶,到今天為止,「獵豹清理大師」都有上億的用戶。今天就是這樣,應用的研發和服務方面中國是全面領先美國的,大家可能都看過這樣的例子,老外來到中國就不想離開,因為在中國拿著一個手機就能滿街跑,很多國家都是完全做不到的,甚至落後的日本很多地方還是只能接受現金支付,每次去我都很頭疼。


  回頭來看,中國之所以有今天這樣的服務,實際上就是網際網路技術的極大發展。我們也經常去日本和台灣,有的時候我覺得這就是上一個時代的社會。在日本曾感受到,一個領域過於發達,就會限制下一個領域的崛起,中國正是由於工業化進程到了一半的時候有了網際網路化,使得我們整個服務業大幅度升級。但這一波的升級也到了一個轉折點,整個服務產業也會進入到瓶頸期。


  為什麼這樣說呢?我有一個好朋友叫沈鵬,他是美團外賣的負責人和創始人,離開美團創辦了一家叫做水滴籌的網際網路保險公司,我說你為什麼要做網際網路保險?他說你不知道,以前指揮上萬個外賣員工的時候每天都會有外賣小哥遇到車禍和各種各樣的意外,我們就在群里給他籌款,後來我想如果出去的話一定要做一家能夠幫助這些服務人員提高生活待遇和基本保障的公司,所以就萌發了從做外賣去做網際網路保險。


  今天的增長瓶頸在哪裡?大家都可以看到,社會當中有很多人口紅利。如果你是一家小店,你很容易做匠人精神,把服務做得很好,但十家店、一百家店、一千家店的時候沒有誰能夠保證這種服務還能夠高水平地一致,需要大量的培訓、人員的交替,這樣才能做到。重複性的勞動當中要保持長時間的高水準也是很難的,大家可能不知道,我們的展台上有一個機器人咖啡師,能夠模擬WRC高級咖啡師的手型來做咖啡,整個咖啡界如果一個咖啡師每天做超過三十杯的咖啡質量就開始變得不穩定,因為會疲勞,晃的手型就不會有那麼高的水準,但機器人可以保證高水準。每個人都是由簡入奢易,由奢入簡難,享受了高水平的服務之後想要退回來是很難的,我們對服務就會越來越挑剔,但用人成本越來越高。這是屬於企業的難題,如何能夠保證越來越好的服務,卻又用越來越低的成本?


  三年前我在矽谷看到一些小團隊做的AI功能,覺得非常的詫異。昨天是我從360離職十周年紀念日,離職的時候我做了一款圖片軟體,但發現美圖有做了圖片軟體,後來有一天他們推出了「大眼睛功能」,作為產品經理我們都很懵,我們都是把照片做得越來越真實,他們怎麼做得越來越不真實?因為當時沒有這樣的AI技術,要求用戶點擊滑鼠,想要多大就多點擊幾下,為什麼不能找到用戶眼睛自己把照片放大?我們就研究了很多人臉識別技術,那個時候就有英特爾CV的技術庫,只有百分之六七十的概率找到眼睛,無論如何提高不上去,後來我們只好放棄了。兩三年前我們發現很多小團隊做的產品能夠把人臉識別得非常好,後來慢慢地知道有個東西叫做AI技術。機器人界有一個詞叫做Perception(即感知),機器第一次有了接近於人的感知能力,無論是語音識別還是視覺識別都可以在某個領域、某個應用場景接近於人,甚至在某些點上超越人。


  這是一個非常巨大的歷史契機,如果沒有AI,攝像頭做的所有照片在計算機裡面都是簡單的0和1的字元串,只有AI出現以後才知道這是一個人臉、這是一句話,使得服務機器人產業才有了新的機遇。當我想清楚這個問題以後,我在想所謂的機器人產業到底是一個什麼產業?AI出現之前,我們講的所有機器人絕大部分都是自動化的機械化工具,很難有自主的感知能力,所以更多的是執行很多程序,幫助其賦予一些預定的工作,很難和這個環境發生真實的、實際的、自主的交互,基本上AI出現之前我們談的機器人,尤其是工業化的機器人,更多的是自動化的機器,更多的是千百次地重複一個被高度定製的行為。只有當AI出現以後,我們才有可能使得這個自動化的機器從工業產線走出來,奔向我們的生活場景。生活場景是比工業產線大十倍甚至百倍的場景,這樣才能在一個半開放狀態下和你實現互動,主動地感知提供服務,這是一輪非常關鍵的歷史契機。

  工業製造方面,我們沒有機會和領先企業競爭,但由於AI的出現,使得機器人變成了一個非常跨界的技術,只有機器製造空氣動力學是不夠的,只有AI技術也是不夠的,除此之外還需要有網際網路的應用。今天的服務機器人可以看成手機當中一個又一個的APP,我並不認為今天會出現一個可以跟著你到處完成所有任務的機器人,就算拿著手機也不能完成所有的服務,需要下載一個又一個專用的APP。通過這種垂直維度思考可以發現,網際網路的思路重新考慮機器人,可以找到很多垂直場景的應用,就像有著實體的APP一樣,只在這個場景下提供服務,我們就有機會把用戶體驗和機械製造、人工智慧結合起來,做成一個又一個垂直場景的機器人。


  這是我自己的機器人公式,就是「AI+軟體+應用+服務=機器人」。今天在某個維度特別突出的未必能夠做出一款真正滿足用戶需求的機器人,我們在講技術創新和黑科技,其實所謂的技術創新和黑科技的本質都是可以給用戶提供服務。因為我自己並不算是真正科班出身的技術人員,2002年進入網際網路的時候我就莫名其妙地得到了一個職位叫做產品經理,今天想起來,那個職位在當時應該說是網際網路第一批產品經理的職位。我們並不懂產品經理應該幹什麼,但我們當時在想用戶到底需要什麼,如何把這些技術包裝成用戶需要的樣式。當時遇到的最大問題是做軟體的同事能夠寫出很好的程序,但用戶不會用,可能就是界面不會點擊,覺得這個簡單的文字讀不懂,後來我們才發現原來用戶需求才是最關鍵的。


  後來我自己做安全軟體,在只有幾個人的情況下對抗幾百人的傳統殺毒公司。我們用了所謂的非常底層的一些技術,但快速滿足了安全需求,使得我們做的安全軟體在短短兩年內就在中國擁有超過50%的覆蓋率。此後,我又做了一款叫做「獵豹清理大師」工具在美國提供下載,雖然是看上去非常簡易的應用,只是把手機當中的垃圾文件清理掉讓空間變得更大,在全球廣受好評。今天的機器人也是這樣,一定要為用戶提供他們真正需要的服務,把所謂的後面的黑科技變成可以非常簡單使用的服務,而不只是一個技術參數。我自己和獵豹共同投資了一家叫做獵戶星空的公司,專門負責打造全鏈條技術,然後再由獵豹移動過去十年歷史當中積累的用戶體驗結合起來,打造真正有用的機器人。


  這裡要著重介紹一下獵戶星空這家公司,因為經過思考我發現,獵豹移動在全球做出幾億月度活躍的時候,安卓手機已經是非常成熟的生態系,只需要在上面做一個應用就可以讓全世界的用戶使用。但今天機器人不是這樣,AI+硬體+用戶體驗,其實這裡的每個環節都是很早期的。我們講深度學習大家聽得都很熱,要是用手機來看,整個深度學習AI領域還是處在非常早期。這個時候很難在市面上找到一個符合需求的技術方案,所以當時我們下定決心,根據自己的需要去定製所有的這些技術環節,使得其組合起來能夠變成在用戶層面非常好用的產品,我們花了很大的力氣打造語音識別、視覺識別、自主導航、機械臂技術。


  當然,這是這個時代給我們最大的機遇。很多人問你是做移動應用APP的,你怎麼能做深度學習?好像深度學習只有大公司才能做,我說恰恰相反,深度學習給我提供了一個彎道超車的機會。以前很多感知學的不同專業差別是非常大的,人臉識別、翻譯和語音識別,每個領域都需要專門的專家,但AI出現以後使得跨行的各個領域變成了集中的底層,神經網路模型都能夠在語音識別、人臉識別、圖像識別方面達到同樣的效果。這就使得我們有機會用一個通用型的技術模型解決各個領域的感知問題,我們也看到了這樣的機會,所以定義了機器人的眼耳口鼻手腦,每個環節分別打磨這樣的技術。打磨的過程當中,我們又想避免自己成為研髮型公司,所以在每個領域都去推出相應的產品,讓用戶檢驗我們的技術是不是真的好用。


  這是我們的人臉識別演演算法,之前拿過單模型的冠軍,但僅僅如此是不夠的。我們在美國也拿過一些世界挑戰的冠軍,這些都只能表明模型的能力,還是要在很多地方落地。這是網際網路公司的優勢,我們在全球有幾億月度活躍用戶,美國也有最大的第三方直播平台,每天有幾十萬的用戶開直播,直播當中其實都是人臉的數據,這就使得我們這樣的人臉識別效果能夠很快地提升。今天在獵豹所有的辦公區都是刷臉,幾千名員工每天上下班購物,包括會議室的預定,就連我要求特別嚴格的公司會議都是刷臉,不來的都可以罰款。


  我們還做了語音合成技術。其實語音合成不是技術突破難度的產品,而是去尊重用戶體驗的產品,我們用了大量拼接的技術一句一句地聽,然後反覆調試。


  由此開發了一整套的語音為基礎的OS,大家可能不知道,今天美地的音箱、喜馬拉雅的音箱、我們自己的小豹音箱,包括小米音箱大部分都使用了我們獵戶的語音識別能力,而且已經有超過千萬的用戶每天使用我們的產品。我們認為所謂的語音識別的核心並不是所謂的多麼了不起的黑科技,而是交互界面。喬布斯說過,每次交互界面變革都是產業革命的機會,所以從鍵盤到滑鼠到觸摸屏到語音交互,其實是一代又一代的交互革命,我非常看好智能音箱和諮詢服務機器人,再也不用用戶在沒有見過的屏幕上面觸摸了,而是用最自然的方式表達。目的不是為了和機器聊天,而是通過語音獲取想要的內容和服務,我們也接入了大量內容。


  我們還做了室內導航的技術,如果一個機器人不能主動移動,其實就很難真正談得上是一個機器人,和Pad沒有什麼本質的區別。我們在這裡下了很大的功夫,最重要的核心不是能夠移動,而是用很低廉的成本移動。我們用了激光+視覺的導航,激光的感測器成本大概只有幾百元人民幣,用了大量的演演算法優化使得激光和視覺能夠配合,使得在室內的空間能夠自主移動和避障。


  這是多模態的導航技術,僅有一個點是很難的,包括今天的視覺,我們解決不了所謂非常大的逆光的問題、玻璃的問題,其實就是用多個感測器進行相互的融合。我們加強做了機器人麥克風的陣列,因為一定要在嘈雜的環境當中非常精準地聽用戶的反饋。大家可以去展台上看一看我們的機器人,這個方面我們完全做到了高噪音下基本可用,不能說是100%保證每句話都可以聽懂,但基本上對用戶來說已經可用了。


  我們用了多家的晶元技術為我們整個機器人提供足夠的算力,「3.21」的時候在水立方發布了五款機器人,很多人問為什麼要發布這麼多款?為什麼不只做一款?就是因為這個行業處在很早期,我們很難像智能手機一樣通過一次大屏的革命就保證能夠跑不同的APP,並且在不同應用當中滿足需求,這是化整為零的策略,不同的垂直場景提供不同的服務,讓產品和用戶一起成長。用戶的反饋越來越多的時候,慢慢地就可以抓住真正用戶的需求是什麼,能夠知道不同的用戶需求當中能夠抽象出什麼相同的東西,讓它變成一個統一的產品。今天機器人行業還很難推出一款類似iPhone的產品,一個產品的形式就可以滿足用戶對行動電話和智能電話的需求。


  我們每個人在講機器人、講人工智慧、講語音識別的時候都會看到它出錯的場景,因為今天感測器和各種攝像頭、麥克風還不能達到人眼和人耳的水平,今天所謂的人工智慧就算出來,其實並不能像人這樣動態地理解各種定義場景的時候,很多時候的確容易出錯。人工智慧最大的好處就是能夠保證一個標準以上就不會再掉下來,可以保證不斷地重複。為了能夠達到這一點,我們用了大量的感測器和晶元的組合,保證我們定義好的場景能夠實現高標準的交互和服務。


  現在獵豹移動已經開始用這台機器人取代了我們的前台,當然,我們的前台離職率也很高,相信這是大部分公司都面臨的問題,總是需要一個比較能夠代表公司形象的前台,坐在前面的時候基本上都在找工作或者做網紅,一旦看到機會就會離開。每個客人在來的時候都想介紹一下獵豹移動的產品和歷史,過去做不到,今天能做到了,每個人開會來找我的時候機器人都會介紹一下中文的歷史,整個接待水準可以做到一致化。「豹小秘」也在鳥巢附近的博物館上崗了,用戶願意的話掃下二維碼,可以給用戶去講每一幅畫。


  
時代小人物. 但也有自己的思想,情感. 和道德.

1萬

主題

2萬

帖子

3萬

積分

貝殼精神領袖

Rank: 6Rank: 6

積分
35927
沙發
 樓主| 華盛頓人 發表於 2018-8-19 07:00 | 只看該作者
本帖最後由 華盛頓人 於 2018-8-19 07:02 編輯

除了信息諮詢服務之外,我們也在思考有沒有機會讓機械臂從產線走到生活場景?因為這是一個巨大的,能夠提供重複勞動的場景。以前走不出來的核心原因是什麼?是因為太貴了,我們都知道一隻機械臂動輒幾十萬、十幾萬、大幾萬的價格,讓其很難進入生活場景,但為什麼它會很貴?就是因為AI出現之前所有的機械臂動作都是要高度定製和快速,所以那個時候我們對機械臂最高的要求是它的精度,因為一旦到不了那個位置就擰不了那個螺絲,也會導致整條生產線停下來。今天由於有了AI,即便是誤差稍微大一點,我們可以在最後讓它重新做校正。




  這是我們做的事情,機械臂上加了攝像頭,使得其在最後的時候校正自己的行為。舉個例子,老太太的手哆哆嗦嗦,但還是可以穿針引線,因為有了視覺的識別,AI和機械臂結合起來我們就有可能用廉價的方案製造更多的機械臂,使得它的成本能夠降下來。由於有了視覺,部署環境不需要那麼苛刻,我們做的一款咖啡機,知道那個杯子掉下來沒有,如果沒掉下來會加大力度,這就解決了工業生產線非常複雜的部署問題。我們非常有信心把這款機械臂的價格非常親民化,使其大量被應用,完成那些重複的勞動工作。




  這是我們做的「豹咖啡」,就在我們的展台,請了WRC高級金牌咖啡師去試校搖咖啡的動作,現在已經做到了不需要編程,只需要一個人來做動作,機械臂就會完全根據這個軌跡來做。我們做了一整套關於學習運動軌跡和用很多子動作拖拽就可以完成機械臂運動的軟體,有了軟體和AI,使得整個機械臂的運轉變得更加容易。希望讓每個小賣部都能夠提供五星級酒店的服務,這在以前是非常難的,五星級酒店之所以是五星級酒店就是因為它的服務高標準一致化。一旦我們的產品在一個非常簡單的垂直場景接待來客,介紹產品,能夠實現用戶滿意度的話就可以大量複製,我們真的可以讓每個小賣部就像五星級酒店服務一樣不厭其煩、永遠熱情、保持微笑,有問必答,也希望讓每個鄉村品嘗到金牌大師的咖啡。這在以前是非常難的,今天大家去一些地方的連鎖咖啡機構,最大的難題就是招到好的咖啡師,因為需要培訓,還要面臨高昂的人力成本,而機器人只會越來越便宜、越來越普及,越來越讓大家在追求夢想的同時享受越來越好的服務。




  我們希望做出真有用的機器人,不希望機器人是一個噱頭,或者是一個黑科技,應該切切實實走在我們身邊為我們提供服務,從一個小點開始變成和我們共同生長、共同生活的人類的好夥伴和伴侶,我們也希望獵豹移動有機會和大家一起幫助中國整個產業服務升級。
時代小人物. 但也有自己的思想,情感. 和道德.
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2024-4-27 04:08

快速回復 返回頂部 返回列表