DeepSeek一句話,滬指重回3800....
來源:倍可親(backchina.com)
唯物的中國晶元產業深度觀察
8月21日,深度求索(DeepSeek)公司在官方微信公眾號發文,發布DeepSeek-V3.1模型。官方賬號在置頂評論表示:「UE8M0 FP8是針對即將發布的下一代國產晶元設計。」
先甭管「UE8M0 FP8」是什麼,「下一代國產晶元」這句話,直接把8月22日的上證綜合指數送上3800點,創下2015年8月20日以來新高。科創板晶元全數上漲,晶元指數上升10.05%。海光信息、寒武紀兩家市值超千億的晶元巨頭雙雙漲停。
今天(8月25日)早盤,A股三大指數集體高開,滬指續創十年新高。
8月22日,美媒引述消息人士報道,「後門事件」爆發后,英偉達已經告知一些零部件供應商暫停生產「中國特供」H20晶元。
同一天,半導體領域的不斷突破為中國股市帶來了久違的信心,國產人工智慧軟體和硬體正加速形成「閉環」,走在局部突破加國產替代的高速路上。
這一切,又要說回到DeepSeek和「UE8M0 FP8」的「演演算法換算力」上。
股市大漲
股市苦低迷久矣。歷經10年,上證指數由晶元企業領跑,終於漲至2015年8月中旬的最高水平。
2015年8月,央行下調人民幣匯率,引發金融波動。2017年後特朗普拋出「貿易戰」,新冠疫情持續三年,曾經突破5000點的上證綜合指數,一度跌至2500點以下,此後也一直明顯落後於歐美和日本股市。
中國新興科技企業深度求索崛起,兩番攪動股市。
今年1月,堪與Open AI最新模型媲美的DeepSeek-R1發布,引發英偉達、博通、微軟以及光刻機製造商阿斯麥的股價全線下跌,刺激中國科技公司中芯國際、小米、比亞迪、騰訊、阿里巴巴、網易和京東股價持續上漲。
1月28日,受DeepSeek-R1發布影響,美國科技股暴跌
8月22日,深度求索宣布更新的V3.1模型具有「針對下一代國產晶元」的優化方式,極大利好中國算力晶元企業,股市隨之出現晶元股領漲、科技股普漲的局面。
與10年前市值(綜合A股、港股和美股)排名前十的中國企業相比,網際網路公司和電動汽車公司存在感大增,騰訊、阿里巴巴和比亞迪均榜上有名,中國台灣的台積電更是憑藉先進位程製造技術盤踞榜首。
新興產業的壯大,離不開國家戰略的指引。在2015年至2023年中國上市企業中,高性能機床、機器人領域和半導體領域的企業,收到的國家補貼占營業收入的比例超過2%。
深度求索兩度引爆中國股市,不僅意味著經濟發展動力的隱形轉移,更折射出中國企業「戮力同心」的團結自主意志。
Deepseek
也就是說,在先進的科技領域,特別是半導體及人工智慧領域,中國的創業企業正起到「領頭羊」的作用,其他供應鏈公司和科技企業百花齊放,用先進生產力帶動中國經濟發展。
同時,有著大模型世界領先地位的深度求索,不以押注英偉達「地表最強」GPU為目標,反而以「演演算法換算力」,回身等待正發力奔跑的國產算力晶元商,體現的是高遠的眼光和理智的情懷。
演演算法換算力
引發晶元股狂歡的「UE8M0 FP8」,到底是什麼?
「UE8M0 FP8」是一種計算機存儲和處理數據的數字格式,核心作用是用更少的存儲空間和計算資源,高效處理AI模型訓練或推理這類對數據精度有要求但又不用特別精確的任務。
它的作用是壓縮數據。FP8指的是8位浮點數,這是它的核心技術類型。簡單而言,就是用8個「0」或「1」來表示一個數字,比傳統的16位、32位格式節省「空間」。
8位浮點數比傳統的16位、32位格式節省「空間」
UE8M0是FP8格式下的一個具體的細分規格,重點解決「表示範圍」和「精度」的平衡——既不會因為追求節省空間而讓數字錶示範圍太窄(比如裝不下太大或太小的數),也可以保證AI計算需要的基礎精度,避免算出來的結果偏差太大。
其達到的指數級提升至少包含三個方面,一是算力密度倍增,相同晶元面積下,FP8計算單元數量是FP16的兩到三倍。二是功耗砍半,其能耗僅為FP16的四分之一。三是可以裝進手機,存儲開銷降低一半以上,大模型的端側部署成為可能。
總結來說,「UE8M0 FP8」就是為AI場景設計出來的「高效數據格式」,能讓大模型跑得更快,佔用的內存/顯存更少,還不影響核心性能——屬於深度求索的傳統藝能,演演算法換算力。
其實,大部分已經量產的國產算力晶元依然沿用FP16/BF16+INT8的計算通路,尚未集成FP8。
主流浮點精度類型
截至2025年8月,在A股(含已披露招股書、處於上市審核階段)明確「產品已支持FP8計算精度」的 GPU/AI 晶元公司只有兩家:摩爾線程和沐曦,其產品分別對應的是MTT S500和C500系列。
深度求索最新獨創的UE8M0格式,主要是與下一代FP8的國產晶元形成了「中國式協同」。而「下一代晶元」有誰,深度求索沒有說,暫時只能從中國信通院8月初公布的一批「DeepSeek大模型適配廠商」一窺端倪。
在「首批通過DeepSeek適配測試名單」中,包含中國電信的星辰MaaS平台;華為的推理伺服器;寒武紀的AIDC一體機;崑崙芯的P800一體機;海光的DCU加速卡;沐曦的C550一體機及智算集群;中昊芯英的泰則GPTPU人工智慧伺服器;中科加禾的中科加禾模型推理引擎SigInfer V1.0。
這其中最被看好的是寒武紀,因此市場反應十分直觀:8月22日寒武紀漲停,市值超過5000億,單日猛增866億美元,取代中芯國際,位居中國半導體行業第一位。當前,寒武紀股價超過1000元,僅次於貴州茅台。
寒武紀漲停
中國式協同
在中國人工智慧領域,深度求索的布局正在打造「國產大模型+國產晶元+國產軟體系統」的國產化閉環。
不過,閉環只是相對的,中國半導體製造已經擺脫了「簡單複製」階段,但還沒到「反向輸出」的階段,達不到TikTok和Shein「定義全球標準」的程度。
從製程上看,7納米及以下先進位程,EUV光刻機、高階EDA以及ArFi光刻膠依然存在「卡脖子」的現實,只能通過「DUV加多重曝光」實現有限的量產,性能和良率均落後於台積電2至3代。
EUV光刻機
從設計上看,海思、寒武紀和平頭哥的晶元並不比英偉達和高通差,只是在製造環節被鎖定在7納米。
其他領域則都是好消息,比如成熟製程基本自主循環,成熟製程產能大規模擴張,設備和材料小批量試水出海,特別是大基金三期和地方政府基金在本年度預計投資3000億元,力度也是罕見的。
而且,美國主導的出口管制,無論是「小院高牆」的《晶元法案》,還是屢屢加碼的高昂關稅,都加速了中國國產供應鏈自力更生,「被逼出來的創新」正在成為「中國製造」的堅實基礎。
因此,回過頭來看深度求索的「演演算法換算力」尤其可貴。即使GPU算力最強的英偉達,一邊清H20的庫存,一邊要賣給中國更高的版本B30A,深度求索依然選擇適配算力較低的國產晶元,這不是技術問題,而是意志問題:有了頂流DeepSeek的幫助,中國國產晶元不僅能供給國內需求,更將獲得國際話語權。
這也是「中國式協同」的根本意義:一家世界頂級公司還不算,供應鏈上的公司都要做到世界頂級。想想之前微軟和英特爾搞個了「Wintel」也正是同樣的道理。
而對於廣大網友心急火燎的催促「R2模型怎麼還不來」,深度求索官方依然未能給出確切消息。