倍可親

回復: 2
列印 上一主題 下一主題

馬化騰對話李彥宏:百度在人工智慧走得更前,騰訊還是落後

[複製鏈接]
跳轉到指定樓層
樓主
硨磲大爺 發表於 2017-4-4 23:55 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  

  李彥宏說人工智慧永遠不可能做到跟人腦一樣。

  文 | 盧曉明

  

  今天的IT領袖峰會上,馬化騰和李彥宏兩位工程師出身的IT領袖又碰面啦。這次的主題是:「在人工智慧時代,我們是怎麼挖微軟研究院的人?」

  這當然是一個玩笑,這次對話的主題是《人工智慧:中國機遇與挑戰》,對話四方包括百度CEO李彥宏、騰訊CEO馬化騰、微軟公司全球執行副總裁、微軟人工智慧及微軟研究事業部負責人沈向洋,還有神州數碼控股董事局主席郭為。

  不過,隨著幾大巨頭的人工智慧布局逐漸深入,確實他們對人才的需求也越來越多,向來被業界稱為「國內科技圈的黃埔軍校」的微軟研究院,繼續擔任人才的輸送中心。在現場,三位來自微軟、百度和騰訊的高管,也就此事調侃起來。

  馬化騰還說,騰訊在西雅圖建了一個研究院,因為微軟的很多研究人員不願意離開西雅圖。沈向洋也說,微軟人工智慧事業部有七千多人,但還在不斷招人,因為百度和騰訊一直在挖他們的人。

  

  為何布局人工智慧?

  小馬哥也是越來越重視人工智慧了,最近騰訊的圍棋AI「絕藝」,也因為贏得了日本的圍棋大賽爆紅,而且跟阿爾法狗的負責人黃博士不同,騰訊做「絕藝」的團隊,沒有一個人懂圍棋。

  所以主持人也問起了小馬哥,騰訊為什麼重視人工智慧?

  馬化騰非常謙虛地說,其實百度在人工智慧走得更前,騰訊還是落後。不過他認為,不僅是騰訊,其實在內部,大家都在結合自己的業務去AI的研究和應用,比如騰訊在微信中大量的人臉圖片識別,媒體廣告的精準匹配。

  一年前,Google阿爾法狗的論文出來的時候,騰訊的團隊也開始去探索,後來Deepmind的論文出來之後,也有很多公司用了深度學習。他說,「絕藝」的成長,不同的在於,它一直得到了很多國家級棋手的支持和陪練,也得到了很多國家級專家的支持。「雖然今天絕藝確實獲得了一點小成功,我們不能太欣喜,畢竟是站在別人的肩膀上的,如果這個論文沒出來我們也做不出來。」

  他還認為人工智慧的可怕之處在於,它可以利用後台的雲計算,自己不斷地快速學習,現在阿爾法狗可能對圍棋的理解已經超越了人類那麼多人,就像開車一樣,你可能不需要教他怎麼開車,只需要做一個模擬器,讓他自己在無數次的撞車中得到反饋,自己學習,我認為這個是值得我們思考的。

  同時主持人也問李彥宏,為什麼會那麼早開始布局人工智慧?

  按李彥宏的說法,這就跟百度做搜索很有關係了。他說,百度從基因上來說,就是在做搜索,其實本質上就是一個機器區揣測人的想法的事情。他回憶,大概是在2011年,那時陸奇還在微軟,他告訴李彥宏,微軟的深度學習部門已經發展到可以應用的階段了。

  百度自己也發現,深度學習在圖像檢索里效果很不錯,他開始在思考,這究竟是一個僅僅在圖片搜索這個垂直領域,還是一個趨勢。他覺得它是代表一種趨勢的,對很多其他計算機科學要解決的問題都是非常有用的,因為隨著網際網路這麼多年發展,數據越來越多,越來越豐富,計算資源越來越便宜,越來越強大。他也知道,人工智慧發展五十年前,一直沒有人看好,其實當年他在美國讀書的時候,很喜歡人工智慧這門課,但是教授告訴他,學這個找不到工作。不過,後來他們慢慢發現,原來以為沒有用的東西,後來有用了。

  因此,他說自己食言了。本來他認為,作為一個商業公司,百度不應該去做研究院,應該去跟產品和應用部門緊緊結合。可是人工智慧不一樣,它需要長遠的布局,所以百度開始組建研究院,吸引和招募人才。

  

  

  人工智慧是模仿人腦或者仿生,還是擁有全新的思維方式?

  不過說到人工智慧的發展,還記得就在這場高端對話之前,馬雲才提出了一個觀點,認為不應該講Artificial Intelligence,應該是Machine Intelligence,現在的人工智慧,都是在模仿人腦如何工作,但實際連人類自己,對人腦的了解和開發都不超過3%。機器應該擁有自己的獨特的思維方式,而不是永遠模仿人類怎麼工作,只有這樣兩者結合起來工作,才會發揮更大的作用。

  於是,主持人也觀察到,比如機翼、雷達也好,這些都是一些仿生的設計,甚至是現在深度學習的神經網路。

  就此,他問了幾位IT領袖一個問題,他們認為人工智慧是模仿人腦或者仿生,還是要擁有全新的思維方式?

  小馬哥說,我們當然是希望有一些新的東西,但現階段,還是應該務實點,現階段還是通過仿生的階段。在某一些垂直的領域嘗試,要做一個通用的AI非常難,包括圍棋也是選一個非常窄的領域,甚至一旦規則變了,幾乎就要重新訓練,之前的訓練全白費了。

  李彥宏則並不同意,現在的深度學習是在仿生,因為「其實我們也不知道人腦是怎麼工作的,怎麼去模仿呢?神經網路只是為了讓大眾更明白研究人員在做什麼的一個比喻。」不過,他確實認為,深度學習只是在很初步的階段,我們要達到人腦的程度,還要很久很久。他還解釋,其實這個很久的意思,我認為是永遠不可能的,甚至像之前以為一位演講嘉賓朱民說的,將人工智慧分成三個階段,弱人工智慧到強人工智慧,再到超級人工智慧,第二個我都覺得不行,永遠不可能。

  沈向洋很贊同李彥宏的觀點,他認為,目前腦科學的發展還很初級,限制了人工智慧的發展。計算機馮·諾依曼的結構,跟人腦的結構本來就完全不一樣。他相信,隨著人工智慧發展,未來會有越來越多學計算機的人去做研究腦科學。

  最後,我們都知道,人工智慧之所以在今天快速發展,有三個基礎:海量數據、強大運算能力和深度學習的發展。

  在中國,掌握著最大數據量的,莫過於BAT了,百度做不少開放平台。主持人突然就順勢小馬哥,你們騰訊有那麼多社交數據,有沒有可能把數據分享出來,讓創業公司用?

  馬化騰依然回答得非常實在。他說,「這個問題我們在內部也有激烈的爭論」,場景對於研究確實很重要,很多研究都需要實際運轉數據的支持,不過,不是有一堆數據就能用,數據還需要清洗和標籤化,才能讓AI去學。這是一個非常龐大的工作量,甚至還是需要人去用很笨的方法打標籤。運算能力對人工智慧也很重要,需要用雲的資源,所以騰訊也在做雲。

  更緊缺的,就是人才了,他說,一年前騰訊也很缺人才,如今逐漸招募了不少。為了招賢納士,騰訊還在西雅圖也設立了一個實驗室,「因為很多微軟的人都不願意離開西雅圖,因為我們就在旁邊設了一個研究院」。

  設立了研究院之後,騰訊內部也在問各個業務線,數據能不能給研究院做研究用。但是,其實業務部門本身,也希望能招人去處理和挖掘利用自己的數據,而不是全部分享給別人。因此,即便單論公司內部,也會有這個問題。

  第二個則是用戶隱私問題,因為騰訊的社交數據涉及大量用戶隱私,如何脫敏是個很關鍵的問題。要清洗到什麼地步才能用,還要看看。最後他總結,數據的標籤化和清洗,業內也有很多人也都在努力,很多公司拿著一堆裸數據,也不知道怎麼辦,所以我們必須先把數據整理過才能用,他說這還是一個很長的過程。

  附全程對話實錄:

  吳鷹:先從馬化騰開始。剛才朱民演講中特別舉了你們這個團隊的例子,13個人真的是沒有一個人是會下圍棋的,騰訊有一個700多人、成立了大概一年多的人工智慧團隊,專門研究人工智慧,他們在很短時間內聚集了很厲害的一些專家。

  能不能跟我們大家分享一下騰訊為什麼在人工智慧上這麼重視,還有你對人工智慧的看法和行業的看法?

  馬化騰:其實李彥宏是人工智慧走得更前了,對騰訊來說,我們還是落後不少,只是去年剛開始成立的部門。

  當然在我們所有BG內部結合它的業務形態都有在落地,像我們微信裡面,超過上百億條消息,包括我們圖片、特別是做社交網路,裡面有人臉數據圖片絕對是天文數字,每天高達上十億張有人臉照片。

  這方面的技術研究在各個BG有相當長時間研究,包括後台數據分析、廣告匹配都用了人工智慧技術,只是大家感受不到。因為他在後端。我們在前端也希望做出一些產品,剛好一年前Alpha Go它的paper出來,通過人機對戰讓全世界對人工智慧認知到了一個新的高潮,我們團隊本著練兵的心態也做了嘗試。

  谷歌收購了deepmind團隊發表的論文,原來做計算機圍棋的團隊都紛紛採用深度學習方法來融入原有的似乎已經走進瓶頸的計算機圍棋軟體開發中,大家不約而同在這一年中起步。

  我們內部團隊有三個團隊也在做,只是分在不同部門。這個部門剛好是它能夠突破這個瓶頸,也動用了公司相當的大的後端的計算機資源,更大的特點是它和Alpha Go不同的是我們的決議AI的成長,全程得到了國家級圍棋世界冠軍從一開始的陪練,然後找出它為什麼不同。我們十幾位研發人員不懂圍棋的,一開始連黑先下還是白先下的規則都不懂,我們從計算機原理、工程實現以及結合中國包括很多的專家來去訓練。

  我們覺得這算是小小的成功吧,但是也不能過於欣喜,畢竟是站在前人肩膀上,因為你沒有發布這個paper,我們也不可能做出來,但是也不能說這是毫無疑義的事情。



沙發
 樓主| 硨磲大爺 發表於 2017-4-4 23:55 | 只看該作者
  這裡面給我們最大的思考是,過去我們對AI很多是從一些規則、從簡單的訓練得出來的能夠改善我們計算處理的這樣一種能力,最終我們發現其實還有一個更恐怖、更深層的意義在於他能夠在計算機的後台能夠用雲計算、大數據方式能夠高速的自學習,能夠自己跟自己對奕。

  所以AlphaGo出來后,它的下一代master,經歷了數十億盤自我對弈,已經超越過去所有人類交戰的盤數,然後它自己尋找規律,找到的已經遠遠超過人類過去在圍棋領域認知的範圍,是極大的擴展,這是給我們一個很大的啟示。

  在很多的領域——圍棋以外的領域,不管是醫療(剛才講的病理的檢測),以後的金融,現實中的每個行業,如果能用計算機後台做出一個模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動駕駛怎麼開車,就模擬一個現實環境,給它一個規則,讓它駕駛,它去撞,有各種反饋,自然會琢磨出一套理論和經驗,這是給我們帶來巨大思考。在很多領域如果能做出模擬器,定義出很多參數,自己學習,他能找到規律可能遠超我們現在想象的。這是我們最大的啟示。

  吳鷹:謝謝Pony。沈向洋先生作為微軟人工智慧事業部的負責人,你講講為什麼人工智慧這幾年能有突破性發展,能不能預測一下最可能在哪些領域具有顛覆性的應用出現?

  沈向洋:謝謝吳鷹。我每次聽完馬雲講話以後都沒有話可以講,馬雲基本上把大家想講的都已經講完了。

  我從研究生開始學習人工智慧,也有20、30年時間了。現在看到人工智慧如火如荼,非常激動。因為我們90年代中畢業的時候出來的時候工作都找不到,現在大家恨不得見到一個懂人工智慧都投錢。

  人工智慧經歷了多少個冬天,之所以今天有這樣的發展機會,主要還是因為三個方面原因,第一件事情,是因為網際網路的出現,網際網路+物聯網提供了更多的數據。第二件事,強大的運算能力。摩爾定律到現在,大家覺得應該會死掉,但是還沒有死掉,還有更多新的計算方法。第三,過去五六年深度學習突然突破,包括騰訊研發領域充分運用到深度學習,令到大家突然看到很多不能解的問題現在可以解掉。

  從人工智慧基本和研究方向來講,還是兩個不同非常不一樣的階段。一個是人類感知這件事情上,我們講人工智慧,原來對人工智慧的定義就是跟人類智能相比較。人類的智能體現在哪?主要是兩方面,一個是感知方面、一個是認知方面。感知方面,剛才我提到這幾個原因,所以在接下來5-10年進展會非常快。具體表現在計算機語音和計算機視覺發展,我覺得AI會超過人。很多人會同意我這個說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智慧的認知方面,包括自然語言,包括知識的獲取、包括你對一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。

  您剛才提到現在人工智慧給大家創造了一些什麼樣的機會,從微軟公司來講,我們的研判覺得短期之內是有非常非常大的商機,你看到底有那些行業已經相對而言有相當大量的數據,而且同時在這個行業裡面從事人員是不高興的,那你就有商機了。

  如果這樣看的話,到今天來講,幾乎所有的商業應用,從市場銷售到HR部門招聘,到客戶支持這方面,所有的都會被顛覆掉。我是覺得客服是接下來五年最多的AI應用的商機,我這樣講並不是說自動駕車不重要、圍棋下棋不應該做研究。只是具體回答吳鷹的問題,從我們來講最大的商機在哪,就是每一個商業應用都會被顛覆掉。

  吳鷹:大家注意沈博士說每一個商業應用都會被顛覆掉。這是非常震撼的一個結論。

  郭為先生,你是神州數碼的掌舵人,你們在智慧城市方面有很大的布局,很多人會認為你們好像跟人工智慧不一定有那麼大的關係。請你談談你對人工智慧的看法。

  郭為:謝謝吳鷹。剛才沈向洋講到今天人工智慧有一個比較大的突破,實際上就是三點:一個是由於網際網路出現,大數據出現。第二,計算能力高速度。第三,演演算法。

  我們做智慧城市過程中,我們為企業定位過程中也考慮到,計算能力這個事兒我們做不了。第二,演演算法上。昨天研討會上,還有今天,大家認為中國目前還是落後、還是在學習階段。作為一個傳統企業轉型的話,唯一能做的就是數據,就是如何能夠採集到更多數據。

  由於我們以前的積累,我們在很多行業有很多應用,使得我們能夠接觸大量的數據,這些數據如何從傳統的方式上轉移到用網際網路方式,或者今天我們定義用深網數據挖掘,如何在三網環境下採集數據就變成我們的核心競爭力。所以做智慧城市過程中我們是不斷探索這樣的工作,慶幸的是由於我們跟北大合作,使得我們在深網挖掘上有很大的變化,我們發明了相關技術,使得快速生成API,為智慧城市打造了一個基於大數據操作系統,如何能夠快速形成一個城市數據,然後進行分析、應用,這就是做智慧城市的實踐,正是因為這樣一個實踐,我們花了6、7年時間,某種程度上也是碰得頭破血流。

  我也很同意馬雲的觀點,我們既不能把人工智慧太深化,但是也要看到他確實還是能夠幫助我們做成一些事情。比如在一些特定領域裡,在醫療看片子、制定醫療方案可以做的很好。比如在農業,由於土地確權,我們掌握了20億畝土地的信息,土地上有什麼數據,我們幫助進行分析,提升我們農業收入,包括進入扶貧領域。這些應用是做智慧城市過程中一個非常好的方面。

  總的來講,既要發揮神州數碼在傳統IT領域的應用上的特徵,另外就是擁抱網際網路,擁抱大數據,如何在這個領域裡面有一些技術性的突破,使得我們自己的企業能夠在這個領域做一些事情,這就是我們今天做智慧城市要做的工作。

  吳鷹:百度在人工智慧布局很早,而且深度學習上比美國很多大公司還要領先,這種評價並不過分,而且你在兩年前全國政協大會上提出中國大腦這個建議。對中國也是非常重要。從百度角度你能不能談談關於人工智慧發展你們的看法。當年你們為什麼那麼早做這些布局?

  李彥宏:我其實也思考過這個問題。從百度的基因來說,我們從一開始成立到現在最主要是做搜索。搜索本質上是機器試圖理解人想要的東西。

  我們一開始用各種各樣計算機方法試圖理解人的意圖,我在想一個問題,深度學習在圖像檢索裡頭的效果不錯,是一個偶然還是它代表一種趨勢。分析完之後,覺得它是代表一種趨勢的,它不僅僅對於圖像搜索有用,它對很多其他計算機科學要解決的問題都是非常有用的。原因就是,隨著網際網路這麼多年發展,數據越來越多,越來越豐富,計算資源越來越便宜,越來越強大。

  所以人工智慧剛才說有60年歷史,前50年,為什麼大家不看好,為什麼大家覺得人工智慧沒有用,我在美國讀書的時候,我就很喜歡人工智慧這門課,但是學完之後,教授告訴我說其實沒用,人工智慧沒有一個真正有商業價值的應用,你將來靠這個是找不著工作的。

  到現在最近幾年,原來認為沒用東西變成有用,是因為市場環境變了,條件變了,原來認為不可能的事情現在變成可能了。分析了環境因素之後,覺得人工智慧是代表未來的。所以我們在2013年1月份對外宣布成立深度學習研究院,這個可能是全球工業界第一個用深度學習來命名的這麼一個研究院。

  而且這等於我自己食言了,我2013年以前不斷跟外界說我們是一個商業公司,我們不應該成立研究院,不應該搞純的研究機構,這些機構要想轉化成產品,進入市場被市場所認可的話,應該跟那些產品部門、跟那些業務部門緊緊結合在一起,而不是單獨成立一個研究院,但是深度學習這一波起來之後,我覺得是完全不一樣的東西,他需要在理論上、在演演算法上,在很多方面有長遠的布局和突破,所以從那個時候開始大規模投入去吸引人才,去推進演演算法,其實不光是演演算法,在剛才朱民講的時候也講到各種各樣晶元結構層、CPU到GPU等等,都要審視演演算法的需求。

  所以現在看起來人工智慧比2013年我們決定進入的時候一個更要大的產業。前一陣我對外講了,網際網路其實現在只是一道開胃菜,真正的主菜是人工智慧,所以人工智慧不是網際網路的一部分,不是網際網路第三個階段,它是堪比工業革命一個新的技術革命。

  吳鷹:開胃菜已經更大了,網際網路是人工智慧的開胃菜,媒體可能會引用這個論斷,但是主菜得多大的市場。我覺得你跟沈向洋說的顛覆所有的商業模式,這個影響是非常大的。沈向洋,微軟人工智慧事業部有多少人?

  沈向洋:一共有7000多個工程師和科學家,我們還在繼續招人,並且Pony和Robin經常來挖我們的人,Jack也挖。

  吳鷹:沈博士就直接進入火藥味比較濃的階段的,微軟如果進入中國,已經進入了,人工智慧市場的話,BAT,你最想幹掉馬雲、馬化騰還是李彥宏?

  沈向洋:藉助剛才馬雲講的,彎道超車十超九翻,要換道超車才有希望,在任何競爭的過程中總是要找到自己的出發點。

  既然你給我這樣一個機會的話,我就提一下,微軟在中國最近這幾年推出的最了不起的人工智慧叫微軟小冰,我不知道在座的有沒有用微軟小冰,可能在座的不是我們面對的用戶群,我這樣講你不要生氣,我們的用戶群是18-24歲相對的年輕用戶群,大家有時間和智能聊天機器人,這也是為什麼我們選擇跟Pony這邊的QQ合作,也是針對這樣相對年輕的用戶群。

  之所以我提這樣的人工智慧產品和一般的智能助理還不太一樣。人類進化多少萬年下來以後,每天講很多的話,你可能不知道,其實男人在一天大概講幾千句話,女士一天可能講超過一萬句話。大多數的話並不是說講一句話一定要完成一件什麼工作,我老師講大多數人一天講的話很多都是廢話,但是這個講話很重要,講話是人工智慧裡面最重要的一件事情,在很大程度上你的EQ是體現在你怎麼去講這個話。我們推小冰的過程中學到了很多東西,我們現在主推的方向,研究和產品的方向就是所謂的對話式人工智慧。

  吳鷹:我沒用過小冰,但你好像還是沒有直接回答我的問題,你最想先幹掉誰?

  沈向洋:你剛才問了什麼問題?

  吳鷹:高手。

  我也想借馬雲剛才講的問一個仿生問題,飛機剛出來之前,大家想的思路是看鳥在空中飛很羨慕,剛開始做飛機就想做一個像鳥一樣的。

  我就想問台上的四位嘉賓,不用專業知識,就是直覺,在人工智慧上有突破的事,模仿人腦的,你們覺得仿人腦的方式會有所突破,還是完全不一樣的想法?

  郭為你就先說,說錯了也不要儘管,反正你也不是人工智慧專家。

  郭為:是功能性的突破,還是仿生的東西,就拿AlphaGo來講它下一盤圍棋所消耗的能量,有人告訴我需要2噸煤,但是一個圍棋手可能就是兩碗米飯。

  我們在考慮一個功能的時候,需要考慮多大的資源消耗,這對於人類進步是很重要的。你可以實現這個功能,實驗室可以做得出來,但是無法實現工業化,就是要考慮成本,考慮到資源的消耗。

  人工智慧之所以用功能性替代就是考慮這些因素,就是完全模仿本身也非常困難。我也非常同意馬雲的說法,人的大腦功能,我們自己認知只有3%,最終就是用功能,而功能的替代能量消耗要比人本身,人還是太神奇了,這個我覺得很難達到人的程度。

  我最近看一本書《人的宗教》,就講人是由三個東西構成,一個是你的生命,一個是你的心智,第三個是你的心靈或精神。我們反過來講精神的東西,我無法想象機器能夠代替精神的東西,最多也就是體力上能夠替代,智慧上不能,在某些方面的替代,完全替代人不可能,某些替代就是功能上的替代,所以突破就在功能上的替代,然後提高一定的效率,這是我對人工智慧的看法。

  所以我為什麼同意馬雲的觀點,實際上機器怎麼樣能夠做得更好。我看遠古的博物館,人類發明一個針,這和今天人工智慧的發明對人的衝擊是一樣的,當時人縫不了衣服,沒有針怎麼縫衣服,發明針是多麼神奇的事,能夠把衣服縫起來,今天做人工智慧也和當年發明針沒有根本的區別,人在進步的過程中不斷發明新的工具,而新的工具最終還是為人類服務的。

  吳鷹:Pony覺得是用模仿人的方式,還是全新的?

  馬化騰:我們當然期待有一個本質的,發現飛機的螺旋槳也好,還是流體動力學,還是鳥的翼,或者是馬跑,現階段還是通過仿生的階段,在某一些垂直的領域,你現在要做到一個通用的AI非常難,包括圍棋也是選一個非常窄的領域,然後給它學習,通過各種參數來訓練。

  剛才郭為提到的用AlphaGo下一盤棋要消耗多少能源。這個垂直領域訓練數據是需要消耗很大的能量,但在實際用的時候其實不需要消耗太大的能量。我們絕藝訓練出來的單機成本跟職業棋手差不多,但是要訓練出這個模型來要很長時間,稍微改一改規則就全部要進行重複訓練,改進一點之前的積累都不算,要從頭積累一遍,消耗的能量很大,而且時間很長,這是很窄的一個技能模擬。

  下一步到通用的,再下一步是不是有更本質性的,發現它背後的原理,智能可以超越人的碳基的智慧,是不是有其他更多的基礎元素可以形成更高級的生命智慧呢?這可能是超越人類現在所發現的知識,這也是有可能的。甚至有人還突發奇想說我們現在認識的宇宙就是高智能的生命,用他的量子計算機模擬出來的環境,我們一切都是模擬出來的,也有可能。大家發揮腦洞大開的想象力吧。

  吳鷹:腦洞大開,一切皆有可能,Robin怎麼看?

  李彥宏:其實我不太認可人工智慧現在做的是仿生學,現在我們講人工智慧像是人腦神經元的工作原理,但是人腦具體怎麼工作的,剛才馬雲講的我們只了解3%,我們並不知道人腦是怎麼工作的,你不知道它怎麼工作怎麼仿它?我們只知道這一點點,這一點點計算機的演演算法有一點類似之處。

  我同意現在的人工智慧,尤其是機器學習、深度學習的演演算法還確實處在非常初級的階段,還有很多提升的空間,現在做得還非常不夠。什麼時候能夠挑戰真正人的認知能力,我覺得還有很長很長的時間。

  我說話比較保守,我說很長是說這一天永遠不可能來到。第一階段是弱人工智慧,第二階段是強人工智慧,第三階段是超人工智慧,我認為到強人工智慧這個階段就達到不了,不僅僅是你永遠搞不清楚人腦是怎麼工作的,你即使用電腦的方法模擬人腦,要想完全達到人腦的水平,我覺得也做不到,永遠做不到這件事情。

  吳鷹:我們IT領袖峰會就是觀點。我也不用問沈向洋了,因為確實是人腦到底怎麼工作的,不知道。但是這個答案非常簡單,因為有一個上帝。所以很多科學家到最後就信上帝了,變成找到一個答案了。沈向洋,你還有補充?

  沈向洋:我蠻贊成李彥宏剛才講的,人工智慧這件事情發展,今天最大問題是對人腦不了解。

  腦科學今天還是非常初步的科學,你每次要講科學的話,首先要一定要有數據,要能夠做試驗,而且做重複的試驗,今天就沒有辦法真正監測到真正做試驗說因為加入了這樣的輸入到人腦,出現什麼樣的輸出。

  接下來N年應該有更多的人投身基礎科學研究腦科學這件事情。看今天計算機體系結構,馮諾伊曼結構,跟人腦結構完全是兩碼事。可能也像張教授說飛機的模仿並不是真正像鳥一樣,我覺得肯定是這樣的情況。

回復 支持 反對

使用道具 舉報

3
 樓主| 硨磲大爺 發表於 2017-4-4 23:55 | 只看該作者
  接下來很多方面肯定叫弱人工智慧也好,這些很多的人的智能方面我們能夠想象得出來,今天人能夠做的事情在不遠將來,絕大多數事情,人工智慧都可以達到。

  我舉一個小的例子,比如今天大家講你今天可以做視覺識別了,物體識別了,你今天可以做語音識別了,那今天人還有什麼事情很了不起,大家覺得通過學習的方法,我們可以達到一個什麼樣的高度。很重要一件事情是機器閱讀,閱讀的能力。我要考高考、考SAT,閱讀一篇文章后,你問一個問題,我可以答一個問題。

  像這樣的問題接下來5-10年可能是人工智慧很大突破的地方,一旦有突破后,搜索也好、社交網路也好、其他商業應用也好,有很多這樣的機會。

  今天大家覺得激動人心的地方是因為以前是完全符號式、公式去做,今天是神經網這樣一種解法。它的區別在於以前符號式做法,你覺得用符號式做法解了一個問題,是可以解釋的,而今天這種神經網解法,包括Pony做的圍棋機器人,他很難去解釋為什麼下這一步。

  所以,接下來有一個需要研究的問題,從符號式到神經式怎麼樣回過頭再到符號式,就是研究行業很熱門的方向,叫做可以解釋的人工智慧。

  吳鷹:咱們講了這麼多人工智慧的話題,講一點跟在座嘉賓更接近一點的,我本來想問李彥宏怕不怕微軟,想不想把它幹掉,但是沒有什麼意義,他們都有很智慧的回答,肯定會迴避開。

  但是我注意到百度你們的深度學習有一個開放平台,咱們小公司在這方面沒有投入,沒有技術積累,想要用也是可以用,是免費開源平台。這個是挺有意義。

  你們當年決定這麼做的時候,你們不覺得這樣開放後會培養你的競爭對手嗎?

  李彥宏:我覺得人工智慧是一個非常大的產業,而且是會持續很長時間。像我們現在的判斷未來20-50年都會是一個快速發展的人工智慧時期。

  在這種時代大潮下,顯然不是一個公司能夠把所有的事情都做下來的。相反的,如果說我們先進入了這個領域,能夠提供一些平台給一些尤其是沒有這麼多計算資源、沒有這麼多做長遠研發能力的機構去做他們擅長的,他們對於很多垂直領域可能比我們的了解就會更加深刻,讓他們去做的話,他會推動整個人工智慧技術的發展。

  所以從這個意義上講,我們把我們的平台開放出來,對大家有益,對我們也有益,我們可以在平台上看到大家在幹什麼事情,哪些方向發展會更快一些,哪些領域更適用於現在已經解決的技術。我剛才講人工智慧永遠不可能超過人類的能力,但是當他逐步逼近人類能力的時候,其實已經是可以一個一個行業去顛覆掉。

  比如說人臉識別這種應用,我們今天如果你去機場的話,要過好幾道安檢,又要把身份證拿出來,比對一下,其實人臉識別這個問題解決后,將來到機場就應該大搖大擺就過去了,他那個攝像頭可以識別,不需要一道一道檢查的。我們在家裡自己開一個Party,不可能每個人進來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現在比較笨的辦法一個人一個人對他的身份。

  現在這個問題基本上解決了。比如百度大廈,我們那個閘機就是刷臉可以進,到哪兒直接過就可以了。這還是人臉識別一個東西。語音的識別、自然語言的理解等等,都是可以。

  未來人和物的交流方式,人和工具交流方式,不是人學習工具怎麼使用。人和動物的區別就是人發明了工具,但是人發明了工具之後,是發明人寫一個用戶手冊告訴你這個東西怎麼用,電視怎麼用、冰箱怎麼用,這些東西,電腦手機怎麼用,我們要學慣用鍵盤,小時候都要學打字。

  未來應該是機器、工具學習人的意圖,以後人再也不需要學習工具怎麼用了,我要這個工具幹什麼,他就能夠明白,這就是我希望用人工智慧方法解決理解人的自然語言,以後人和機的對話、人和物的對話就變成一種自然語言的對話,這是未來幾十年可能代表人工智慧發展最大的方向。

  吳鷹:確實這樣的話,從剛會說話的小孩兒1歲多到很老的老人都可以簡單使用計算機了,這個確實沒有什麼太難的。像我母親,她就是老學不會手機怎麼用。我就想給她用iPad,最近要給拿弄一個。

  我想問一問馬化騰,微信,再加上QQ,這是世界最大的社交網路,裡頭有大量的數據。剛才前面發言人都重複講了,大數據是人工智慧非常重要的方面。從中國來講,在演演算法上現在還落後於美國,剛才李彥宏也講了完全超過人類是不可能的。

  大數據這麼重要的話,微信在很多方面已經超過社交了,現在是生活很重要的一部分,剛才說你去公園買一個2塊錢小孩玩具,微信支付都可以做。

  你們有沒有可能把數據分享出來,讓創業公司大家來用?

  馬化騰:這個問題在內部我們也有激烈討論。

  首先看人工智慧我們關注那幾塊,第一個是場景。場景就是你想把這個技術應用在什麼場景下,你是不是有高頻的跟用戶接觸,這是一個落地的很重要的地方。所以我們看到很多研究院也好,包括我們內部研發團隊。如果沒有場景落地,沒有平台支持,基本上就是空中樓閣,研究一半很難往下走。

  第二個是大數據。大數據也是從平台、業務部門有大量實際運轉數據才能產生出來。但是這裡面很多大數據是垃圾數據,因為沒有標籤,每人做規劃定義,用多好的演演算法也學不出來,學出來也是走火入魔,沒有用的。數據清洗、標籤化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗乾淨,再讓AI學習。這裡面是一個混合結合的過程。

  第三,計算能力。也就是你有雲的資源,拿幾十萬核的計算能力,CPU、GPU,我們還是有這個能力的。而且在雲裡面本身就可以很好的調用,這是我們第三個優勢。

  第四個,一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們在微軟、在西雅圖還設置了一個實驗室。因為很多微軟的人不願意離開西雅圖,所以我們就在旁邊設,沒有辦法,人才就是這樣。幾個方面結合起來才有辦法真正在某一個領域看到它的成效。

  我們現在觀察到很多的AI所謂的大拿們,他們更關注怎麼落地,能不能把畢生研究成果能夠體現出來,所以在我們內部在吸引人才的時候,往往也會說你們微信、手機QQ裡面的平台數據能不能給他們用。

  但是事實上大家都知道,BG、部門裡面的平台他們也很希望近水樓台先得月,數據就在我身邊流動,我為什麼不能招人先研究一把,為什麼給你呢?我們現在還處在內部怎麼把數據分享出來這個階段。

  當然這裡面還有一個用戶很關注的個人隱私:別把我的數據都賣了,到時候大家都知道。這裡面還有一個很複雜的信息安全個人隱私脫敏,你是不知道無法根據數據倒推到哪一個人做了什麼事情,我們要把這些處理乾淨才能往下一步談。

  這裡面數據清理到什麼標籤,才能給其他部門、包括外部合作夥伴怎麼用。同時有很多數據來自合作夥伴,業界其他公司,他們也遇到這樣的問題那者一堆裸數據不怎麼用,這樣業界還要有一個標準,互惠互利交換,這是一個大方向,還有很長的路要走。

  吳鷹:大數據清理之後,有針對性的,對業界別人是一個價值,別人也是一個補充。我相信人工智慧是一個全社會的協調最後發展的過程。剛才朱民講有那麼多問題,所以政府也要介入來做。

  其實還不光是中國,是一個世界範圍內大家協同做一些事情。微軟如果大家願意跟你們合作,你們是不是感興趣這個事情?

  沈向洋:你剛才問Pony這個問題問的非常好,作為大公司來講,特別是成功大公司來講,我們對社會有一個責任,對行業有一個責任。當我們行業做的很成功,第一件事情就是開研究院。現在Pony也開研究院,唯一做的不對的就是開到微軟門口去了。

  我也想分享一下在微軟的工作經驗,你說叫這些公司把數據拿出來,讓初創公司或者其他公司去用,我覺得不見得很現實、不見得很容易,Pony剛才解釋的很好。但是我想鼓勵大家,很多的數據如果我們願意花時間、花精力做一點處理,就像Pony剛才講的,然後讓研究人員去用,完全是可以做到的。

  我們微軟出了兩個數據集,一個是計算機視覺標準方面的集,這樣可以做數據分割、物體分割。最近做了另外一個數據集是在自然語言,希望有一批新的做問題問答。這樣推動研究領域,大家在標準集下,不斷把標準集數據越做越多。我們做的方法是用搜索引擎數據,非常小心處理過,包括很多隱私的問題等等。拿出一些數據讓大家做研究是非常實際的,完全可以做到。

  吳鷹:Pony大家很支持你的觀點,將來我們也期待像BAT這樣的大公司,不但是說數據拿出來分享,剛才Pony還主動提到包括運算能力分享都有可能來做,這樣對創業公司、中小公司,包括政府、研究機構特別是大學,非常重要。

  其實利潤這個事兒對企業在某些方面是制約企業發展的,他一定要完成這個利潤,他是一個上市公司要做到這些。這就相對的眼光短一點。

  但是你轉型在智慧城市上鍥而不捨做了6-7年的積累,我剛開始一直打擊他,你跟政府做很多事賺不到錢,你跟政府收多收少都不合適,你們跟人工智慧有關的發展上有沒有一個規劃,還是希望跟這些公司合作在人工智慧方面的發展?

  郭為:今年發生了一個比較大的併購案,就是因特爾收購了 Mobileye,Mobileye是以色列的一家公司,做汽車駕駛輔助的,Mobileye在1000萬輛傳統的汽車上裝載了數據採集的東西,每天收集的數據量差不多相當於現在3000億個個人生成的數據量,由於有這些數據將會支撐因特爾未來在超算上,在大數據領域的發展。

  神州數碼整個大的體系就是想利用我們在傳統行業的優勢去挖掘,剛才講深網數據,少春是再ERP的公司,ERP的數據是不可以在網際網路上直接進行傳輸的,它是深度應用的數據。

  今天BAT很大的優勢就是在網際網路上已經完全壟斷了數據。客觀講只要他們不犯錯誤的話,別人是沒有機會的。當然企業犯錯誤是必然的,只是說在哪些方面不犯錯誤,對未來的看法一旦哪個地方出現空位的時候,其他新的公司就出來了,比如Mobileye十幾年在數據上的積累,一下子就被大家認可了他在輔助駕駛上的能力。

  我們在農業、醫療、製造業,我們給工商總局做廣告登記的服務,那也就是全中國所有的商標註冊登記,我們掌握了全中國所有的商標註冊的公司,你的企業究竟哪個商標用得最多,哪個商標價值最大,我們完全可以通過數據分析的辦法來做,這裡面蘊藏了大量的商業價值。

  這些東西怎麼做?我覺得就是要和現在成功的,或者說在人工智慧上走在前面的公司去做,發揮我們的優勢深網數據挖掘,然後脫敏,打上標籤,然後和別人合作把這個東西做好。這個就是我們要做的。今天我去跟BAT在網際網路競爭,那我是找死,那是完全不可能的事情,那真是活膩了。

  李彥宏:合作的空間是巨大的。

  郭為:但是數據是可以一起合作的。

  沈向洋:還是跟微軟合作比較好。

  吳鷹:好,有點味道了,李彥宏和Harry都在向你遞橄欖枝,你要聽話聽音,你做苦逼活那麼多年了,很多數據在後面做了很多苦活。今天在台上的嘉賓,雖然Harry一直沒有回答我的問題最想幹掉誰,但還是非常精彩的答案,我們開了一個非常好的頭。
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-15 15:05

快速回復 返回頂部 返回列表