阿里CTO張建鋒:不是任何一朵雲都撐得住雙11

京港台:2019-11-12 11:07| 來源:觀察者網 | 評論( 1 )  | 我來說幾句

阿里CTO張建鋒:不是任何一朵雲都撐得住雙11

來源:倍可親(backchina.com)

  「不是任何一朵雲都能撐住這個流量。如果說中國有兩朵雲,一朵是阿里雲,一朵是其他雲。」11月11日晚,阿里巴巴集團CTO張建鋒表示,「阿里雲不一樣,10年前我們從第一行代碼寫起,構建了中國唯一自研的雲操作系統飛天。」

  2019天貓雙11再次刷新世界紀錄,訂單創新峰值達到54.4萬筆/秒,單日數據處理量達到970PB。今年阿里巴巴核心繫統100%上雲,撐住了雙11的世界級流量洪峰。

  「阿里巴巴是一架高速飛行中的飛機,我們成功在此過程中換上了全新的引擎。」張建鋒說,用公共雲來承載這樣一個萬億規模的核心繫統,阿里雲是第一個做到的,「很多雲廠商自己的業務系統,不在自己的雲上,今後阿里全部系統都在阿里雲上。」

  據了解,阿里巴巴是全球首家將核心繫統100%運行在公共雲上的大型網際網路公司。同為雲計算巨頭的亞馬遜、微軟、Google,都尚未邁出這一步。

  

  ——附錄:張建鋒演講核心觀點

  從去年開始,我們決定把整個阿里巴巴核心繫統全部上雲,上雲還要加一個定語,是上「阿里雲」,並不是上任何一朵雲都能撐得住這個流量。在中國,我們經常說中國有兩朵雲,一朵叫做「阿里雲」,還有一朵叫做「其它雲」。

  為什麼講阿里雲跟其它雲不一樣?因為在中國只有阿里雲是完全從頭研發的一朵雲,從頭是從每一行代碼,從十年前開始寫,今年是阿里雲的第10年,所以我們的雲有一個特別的名字,叫做「飛天操作系統」,當初王堅博士創辦阿里雲的時候,對我們這個雲下面的調度系統,整個雲的基礎平台,取名叫做「飛天操作系統」。

  我們的雲完全是中國自研的一朵雲,其它很多雲從開源軟體改造過來的,這是非常大的不一樣。

  第二個,今年雙11,阿里仍然是一家在高速飛行中的飛機,我們成功的在這個過程中換上了全新的引擎。以前大家把非核心負載放在雲上,現在阿里巴巴最核心的系統放在了雲上。現在我們的雲把原來專用的技術變成公共雲,大家都可以來享受普惠服務。我們有最好的系統,你們也可以在上面跟我們一樣使用。

  阿里雲承載阿里巴巴自己100%的核心繫統,這個是我們全球第一個做到的。很多雲廠商自己也有業務系統,但是自己的系統不在自己的雲上。我們以後所有阿里系統全部都在阿里雲的飛天操作系統上面。

  大家一定會想,這是一個簡單的替換還是技術上非常大的一個進步、非常大的挑戰?我簡單說一下,我們有幾個方面做得非常好,它不是簡單的替換,上雲之後性能有了一個非常大的提高。

  今天大家可能有感覺,我們前十分鐘,基本上消費者沒有感受到任何抖動,大家購物非常順暢。

  第一、我們在核心虛擬機系統上,自研神龍架構,用自研的伺服器來做虛擬化。一般的伺服器隨著壓力增長,最終負載能力會慢慢下降,它不是線性的。我們神龍伺服器壓力越大,輸出也是非常線性的,這是非常難做到的。

  第二、我們自研了雲原生的資料庫。今年有兩個資料庫,一個是自研的OceanBase,大家知道我們在TPC-C測試裡面拿下了全球第一。第二是PolarDB,也廣泛用在這次雙11上,沒有任何問題,我們每秒峰值也是遠遠超越於原來Oracle這樣傳統的資料庫。

  第三、我們的計算與存儲做了分離,現在阿里巴巴存儲是有一個地方專門存數據。數據都是從遠端存取的,所以存儲可以很方便的擴容,因為它有一個專門的池。原來做不到。因為原來遠端存儲,訪問網路速度就跟不上。

  第四、之所以現在能夠做到在遠端存儲,能夠比本地讀寫磁碟更快,是因為我們做了RDMA網路,這是全球第一個大規模做RDMA網路的公司。

  我們這四個方面都做了核心突破。

  今天,飛天操作系統能夠在10萬台級別以上的伺服器裡面做調度,今天雙11有非常多的應用,但是它並不是說每一個時間點,所有應用負載都是一樣的。我們在零點把大部分計算機資源分配給交易等應用,過了一點之後,我們把數據分配給數據處理系統。數據處理今年創了一個新高,2017年當天處理了300PB的數據,2018年處理了600PB的數據,今年要處理970P左右的數據。

  大家可能沒有概念,一個P到底有多少數據,我上次跟央視的人交流,央視拍了這麼多年電視新聞節目,幾十年下來他了大概80P的數據。雙11一天,我們要處理970P的數據,非常大的量,沒有一個先進的系統是撐不住的。

  第二個是非常實時,大家看到了,今天在秒殺,在會場全部都是個性化、千人千面的,這裡的數據不僅是大,而且是要做到非常實時。到目前為止,我們菜鳥物流系統已經產生了超過10億筆的物流單,這個數據還在很快的上漲,這些都需要依靠阿里雲背後大量的計算能力。

  我們今年的數據,除了批處理之外,還有流處理,就是實時處理所有數據,就像你們看到的交易數據,每分鐘、每秒鐘都在變,它並不是從資料庫裡面統計出來的,它是每生成一筆訂單,系統自動一層層把數據彙集上來。我們這個系統每秒能處理25億筆記錄,這是流式的系統。

  我們這麼多伺服器,要把它全部管理起來,除了飛天系統之外,還要管理所有的消息流轉,所以我們自己開發了一個叫做MQ的消息系統,這也是全球目前最大的一個消息系統。

  今天,從飛天系統、大數據處理平台到智能化應用,這些技術疊加起來打造了一個新的分散式的基於雲的平台,才使得阿里整個經濟體所有核心應用都能夠跑在上面。

  最後,我們今年發布了自研的晶元含光800。明年雙11,阿里大量人工智慧應用都會跑在自研晶元上面。

  今天從飛天雲操作系統到神龍伺服器、資料庫、交換機、交換機操作系統、RDMA網路,全部是阿里自研的。我們今天已經積累了非常豐富、非常強的能力,從硬體、資料庫、雲計算操作系統,到上面的核心應用平台,四位一體,這是這次雙11跟往年最大不一樣的地方。

推薦:美國打折網(21usDeal.com)    >>

        更多科技前沿 文章    >>

【鄭重聲明】倍可親刊載此文不代表同意其說法或描述,僅為提供更多信息,也不構成任何投資或其他建議。轉載需經倍可親同意並註明出處。本網站有部分文章是由網友自由上傳,對於此類文章本站僅提供交流平台,不為其版權負責;部分內容經社區和論壇轉載,原作者未知,如果您發現本網站上有侵犯您的知識產權的文章,請及時與我們聯絡,我們會及時刪除或更新作者。

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2020-4-10 02:42

返回頂部