六年全部白乾,馬斯克砍掉自研晶元到底為啥?

京港台:2025-8-15 11:39| 來源:差評XPIN | 評論( 2 )  | 我來說幾句

六年全部白乾,馬斯克砍掉自研晶元到底為啥?

來源:倍可親(backchina.com)

  俗話說得好,欲練神功,必先自宮。

  為了應付接下來的車企混戰,馬斯克提刀就往自己身上砍?

  就在幾天前,彭博社報道了一則消息,說特斯拉突然叫停了研發六年的晶元項目 Dojo ,這是連命根子都不要了啊。

  

  不僅工作全部白乾,而且整個研發團隊也直接作鳥獸散。

  項目負責人彼得·班農原地辭職,還有約 20 名工程師也早已提桶跑路,投奔一家名為 DensityAI 的初創公司去了。

  巧的是,這家公司的老闆正是在 2021 年首次發布 Dojo 晶元的前特斯拉總監,加內什·文卡塔拉馬南。

  

  可以說,特斯拉裁員裁出了一家公司。。。

  而於此同時,留在特斯拉的,就只剩一地雞毛。

  甚至有消息說,連 Dojo 的專利都不在特斯拉自己手上,以後想再繼續干也沒有機會了

  

  呃,這確實有點出人意料。

  畢竟 Dojo 這玩意兒剛出來的時候,大家都還寄予了厚望。

  眾所周知,特斯拉智駕的特點是純視覺演演算法,這個方案雖然上限很高,但下限也很低,關鍵就看演演算法的能力,而因為端到端架構,你要迭代演演算法,靠的就只有沒日沒夜的訓練。

  

  特斯拉開啟 Dojo 項目的初衷,就是奔著訓練來的,如果它做成了,就能讓特斯拉 FSD 直接封神。

  要知道,過去給智駕做訓練的 GPU ,並不是為深度學習訓練而設計的,而這個 Dojo 通過分散式 2D 架構,解決了高帶寬和低延遲的問題,並且通過存算一體的設計,讓訓練的能效也更高。

  這麼一來,相比市場上主流的英偉達A100 , Dojo 在相同成本下的性能可以達到它的 4 倍。這對特斯拉來說,不僅能更好的訓練智駕,還能打破英偉達在晶元上的壟斷,讓特斯拉成為真正的人工智慧企業。

  所以對於這個 Dojo ,老馬認為它是 「 實現完全自動駕駛的關鍵 」 ,摩根士丹利也預測, Dojo 將會給特斯拉帶來 5000 億美元的市值增長。

  但結果呢?上個月還說 Dojo 2 量產倒計時,現在說沒就沒,就有點搞人心態了啊。

  

  很多人會覺得,是不是特斯拉開始走下坡路了?為了省錢,連自己最關鍵的晶元業務也要裁?

  脖子哥認為,確實有一部分原因,如今的特斯拉,真不比當年。

  咱們打開財報咱們就知道,今年 Q1 和 Q2 季度,特斯拉最關鍵的營收指標開始下滑,同比分別減少了 9.23% 和 11.78 % 。

  

  而在這背後的銷量數據就更是雪崩, 7 月份,特斯拉全球齊跌,在英國同比暴跌 60% ,德國則下滑 55.1% ,甚至在基本盤的中國也達不到過去的熱度。

  但是吧,特斯拉還遠遠沒到山窮水盡的地步。前幾天,它還花了 43 億美元買LG的磷酸鐵鋰電池,甚至還用 165 億美元定了三星的晶元單子。

  區區十幾億的 Dojo ,特斯拉完全還是投的起的。

  那要問背後原因是啥,老馬其實自個兒就發帖說了,這麼做主要是因為「 沒有必要分散資源同時開發兩種不同 AI 晶元 」

  

  沒錯,目前特斯拉確實是有兩條晶元研發路線。一條是它的 HW 系列(Hardware,真不是華為),用在特斯拉的汽車上,另一條就是這個 Dojo ,是用在智駕訓練上。

  過去這是完全不同的兩條平行線,但這次的 AI6(HW 6.0)明顯有點超預期了,顯著提升了算力和帶寬,不僅能做 FSD 的終端晶元,也可以用於智駕訓練,Dojo 存在的必要性就被打上了問號。

  按老馬的性格,肯定不會把錢和精力浪費在毫無意義的地方。

  當然,還有一個原因就是,Dojo 的研發進度確實不盡如人意。目前 Dojo 2 還沒量產,而 Dojo 1 也因為性能缺陷,成本奇高,基本沒啥市場競爭力。

  所以和更成熟的 HW 晶元相比,老馬毫無疑問砍掉了根本看不到前景的 Dojo 。

  

  不過呢,你要說 Dojo 從一開始就是一個錯誤嗎?我真覺得未必。

  馬斯克其實看得很透徹,他曾公開表態 「 我認為 Dojo 的前景渺茫。但值得一試,因為回報可能非常高。」

  說白了,有點賭狗的意思。

  但這場豪賭並不是沒道理的,咱們得結合當時情境,從頭開始說起。

  最早,特斯拉只有 HW 晶元,而且 1.0 版本用的還是 Mobileye 的全套產品。

  

  但問題是,當時的 Mobileye 只是一個黑盒,不允許特斯拉參與修改演演算法,也不能共享數據,甚至功能也偏向保守,和特斯拉的理念實在合不來。

  最終由於 2016 年發生的 Model S 智駕事故,讓特斯拉下定決心分手,結局不歡而散。

  我估計是因為這次和 Mobileye 的失敗合作,讓老馬就看清了一件事:和別人合作永遠做不了自己想做的事,自研才是唯一的出路。

  所以在此之後,特斯拉先是自研智駕,晶元用英偉達過渡了幾年以後,到 2019 年,HW3.0 就開始走自研路線了。

  

  之後的 HW4.0、HW5.0 ,也就是現在說的 AI4、AI5,其實也都是特斯拉做的框架設計、神經網路優化和系統集成,只是利用了三星和台積電的工藝進行生產。

  總之在智駕晶元上,老馬踢掉了老黃,很快嘗到了自研晶元的甜頭。

  隨後老馬很快又把矛頭轉向智駕訓練。不過,因為 HW 的分離式內存架構更適合推理,而非訓練,老馬必須另起爐灶。

  於是在 2019 年,馬斯克在特斯拉自動駕駛日上,提出用 Dojo 來訓練自動駕駛。隨後,在 2021 年的 AI DAY 上,特斯拉就實現了 Dojo 超算的核心——7nm 的 D1 晶元(還是這個老哥)。

  這裡大夥兒可能比較迷糊,馬斯克把 Dojo 稱為超級計算機,那和這個 D1 晶元有啥關係呢?

  咱們可以這麼來理解,其實 Dojo 就是一個體系森嚴的算力盒子,從低到高分為內核、晶元、瓦片、模組、機櫃和 ExaPOD。

  

  一塊 D1 晶元,其實是由 354 個核心(CPU)組成,而 25 個 D1 晶元,則組成一個瓦片,6 個瓦片就是一個模組,2 個模組是 1 個機櫃, 10 個機櫃是 1 個 ExaPOD 訓練集群,最終算力能達到 1.1 EFLOP 。

  總之呢,從 D1 晶元到最後的訓練集群,其實並沒有那麼簡單。

  2021 年特斯拉只是展示了 D1 晶元和瓦片,而後一年,才安裝了首個機櫃,當時的目標,是在 2023 年建成七台 ExaPOD 。

  然而很快,到 2023 年馬斯克才發現,Dojo 並沒有那麼十全十美,反而有可能將訓練成本提高十倍以上,成功的可能性並不高。

  但此時,老馬的賭性佔據了上風,開始左腦互搏右腦了。。。

  隨後特斯拉不僅繼續砸重金去做 Dojo ,動輒好幾億美元,而且還接連提出了 Dojo 1.5、Dojo 2 和 Dojo 3 ,要真正實現 Dojo ,幾乎是個無底洞。

  然而結果呢,老馬斥巨資打造的 Dojo 超算,性能也只和英偉達 H100 系統相當,於是只能把希望寄托在了 Dojo 2 上。

  相比 Dojo 1,第二代 Dojo 採用了台積電最新的InFO-SoW 晶圓級封裝技術,尺寸更小,損耗更低,效率也更高。

  

  不過嘛,結局依然不理想。

  雖然 Dojo 2 的 D2 晶元算力,從之前的 362 TFLOPS 提升到了 3.62 PFLOPS,是 D1 的 10 倍,但因為過於強調視覺訓練,實際在通用 AI 場景中,依然打不過英偉達的 H200 GPU 集群。

  並且,晶元雖然由台積電代工,但良品率並不高,初期只有 37% ,在成本上沒有任何優勢。

  說白了,Dojo 2 還遠不夠成熟,想要打敗英偉達,還有很多的細節需要打磨。但時間不等人,如今的 AI6 徹底擊穿了 Dojo 的未來,難道還要指望 Dojo 3 ?

  這錢還不如留著應對一下關稅。老馬當機立斷放棄 Dojo ,再次想起了老黃這個備胎。。。

  而後他解釋到,如今的 AI5 和 AI6 ,從某種意義上,就是 Dojo 3 。

  

  但是吧,這個 AI6 至少要到 2027 年量產,用的是三星的 2nm(SF2)製程技術,良品率奇低,只有40%-50%,差不多做兩片,扔一片。

  雖然特斯拉給了三星 165 億美元的巨款,但三星依然是賠錢在給特斯拉供貨,所以這塊餅究竟能做成什麼樣子,現在咱們也只能看看罷了。

  總而言之,Dojo 這事兒就是馬斯克的一場豪賭,只不過賭輸了而已。

  為了不深陷泥潭,馬斯克選擇投降輸一半,把全部精力投到更有希望的 「 神功 」 上去。

  但是話又說回來,Dojo 這事對車企來說,真算不上什麼反例。

  因為自研,本來就是條困難但必須走的路。

        更多科技前沿 文章    >>

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-16 06:49

返回頂部