師承ChatGPT的DeepSeek和國運有啥關係?

京港台:2025-2-17 00:17| 來源:冰川思享號 | 評論( 5 )  | 我來說幾句

師承ChatGPT的DeepSeek和國運有啥關係?

來源:倍可親(backchina.com)

  撰文丨關不羽

  DeepSeek橫空出世,成功破圈。破圈之後,照例就是各自發揮的「六經注我」。其中最值得警惕的,中美雙方都出現了借題發揮的「技術孤立主義」。美方的「脫鉤論」者把DeepSeek視為技術威脅,剽竊、盜用的指責滿天飛;這邊則是把DeepSeek渲染為「中美爭霸」的一擊制勝,自我感覺良好。

  好端端的科技成果,卻成了地緣政治的符號。妖魔化和神化看似針尖對麥芒,其實都是對科技進步事業的褻瀆,是阻撓人類科技進步事業的合謀。

  唯有屏蔽雜音,才能直面真相:DeepSeek到底是什麼?將會造成怎樣的影響?

  01

  DeepSeek師承ChatGPT

  1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。隨即引發了資本市場的震蕩,DeepSeek被形容為「英偉達的最大空頭」,英偉達的股價大幅下跌。「DeepSeek碾壓ChatGPT,吊打英偉達」的神話就此誕生。

  先說DeepSeek和ChatGPT之間的關係。DeepSeek和ChatGPT之間的競爭,是「師徒之戰」。兩者的師承關係源於「蒸餾技術」,這是DeepSeek快速崛起的技術路徑。

  通俗地說,「蒸餾技術」就是用一個較為成熟的「教師模型」訓練「學生模型」,這一過程類似低度酒蒸餾加工為高度酒。具體操作方式是,「學生模型」每分鐘上百萬次高頻提問,從「教師模型」中汲取數據、學習邏輯。然後在人工干預下優化演演算法,最終形成獨特的個性。ChatGPT就是DeepSeek的「教師模型」,或許不是唯一的,肯定是主要的。因此,說ChatGPT是DeepSeek的老師,不過分吧?

  

  圖/AI配圖

  「蒸餾技術」不是近年來的新發明,發明者既不是中國人,也不是美國人,而是英國佬傑弗里·辛頓在2015年提出的,比阿爾法狗一戰成名還早一年。所以,當時「蒸餾技術」只是純理論的屠龍技——壓根就沒有成熟的「教師模型」,沒法蒸餾。直到ChatGPT等成熟大模型相繼投入實際應用,「蒸餾技術」才有了實際應用的空間。因此,「先有ChatGPT,後有DeepSeek」也是無法否認的事實。

  顯然,DeepSeek不是「天上掉下個林妹妹」,而是站在巨人肩膀上的衍生產品。咋咋呼呼地竭力否認、淡化DeepSeek的師承ChatGPT,強拗「獨立原創」的造型,是可笑又可憐的掩耳盜鈴。

  當然,也不能因為DeepSeek是蒸餾技術的產物,就否認其原創性。蒸餾不等於盜竊、抄襲。要是能一抄了之,哪裡輪得到DeeSeek?在蒸餾技術的賽道上,有名有姓的玩家少說也有上百家。DeepSeek能出圈,是有幾把刷子的。「蒸餾」大同小異,人工干預的演演算法優化各顯神通。簡潔高效的演演算法是DeepSeek的成功關鍵,頗有中國特色。

  人工智慧三大要素——演演算法、算力、數據,中國長於演演算法,美國重視算力。這種「偏科」傾向在賽道開啟初期就已經顯現了。昔日商湯為代表的視覺系AI「中國四小龍」,就是以演演算法著稱。ChatGPT崛起,「算力為王」的大力出奇迹成為主流。風水輪流轉,DeeepSeek的勃興,在一定程度上是「演演算法復興」。這種技術風格的轉換,在人類的科技進步史上反覆發生,是一種常態。

  DeepSeek最大的優勢是性價比,演演算法賦能大幅降低了算力成本。省錢永遠是商業競爭的王道,絕大部分個人用戶都沒有很高的專業需求,免費、開源的DeepSeek更有吸引力,這是人工智慧商業化應用的成功。

  但是,這並不意味著因DeepSeek已經青出於藍勝於藍,更談不上「碾壓ChatGPT」。「蒸餾技術」和演演算法優化是做減法,以簡化的方式提高效率。所以,DeepSeek更垂直、更聚焦專業領域,這也意味著犧牲了一部分通用性。比如說,文生圖等視覺系技術就不是DeepSeek的強項,和文心一言比都有差距,遑論ChatGPT。而且,蒸餾技術的技術「天花板」到底有多高,現在也很難判斷。未來能否實現性能全面超越,並沒有清晰的預期。

  這從資本市場的表現也可以看出端倪,DeepSeek上架后,微軟的股價僅僅下跌了2%。表明了市場投資者還處於觀望態度,資本市場用真金白銀的站隊表態,不是各路「嘴強王者」的唾沫星子可比的。

  反而是英偉達的股價「大跌」17%,DeepSeek真是「英偉達終結者」嗎?

  02

  DeepSeek不是「英偉達終結者」

  DeepSeek到底使用了多少英偉達晶元,目前有三個版本分別是五萬、一萬和兩千多,越傳越少。其中「只有了兩千多」的版本最假,DeepSeek創始人梁文鋒本人在採訪中就說過,早在公司成立前的2021年就囤了一萬塊GPU。無論是一萬還是五萬,比起動輒幾十萬晶元的大廠產品,都是數量級的降低。大可不必在傳播過程中人為誇大DeepSeek的「省芯」。

  必須指出的是,DeepSeek的演演算法優化「省芯」,並不會降低人工智慧領域的算力需求降低。演演算法優化和算力需求的關係,有點類似燃油發動機技術節油和燃油消費需求。燃油發動機開發省油技術,並沒有降低汽油消費的總量。因為汽車的燃油成本越低,促進了汽車的普及度,燃油消費的總量不降反增。DeepSeek省芯降低了人工智慧研發應用的資金門檻,會吸引更多的投資者進場。

  人工智慧的研發端將會進一步走向「群狼搏虎」的遍地開花。在應用端,DeepSeek成功實現免費開源模式,大幅推進了人工智慧的普及應用,也會產生巨大的算力需求增長。別小看中小企業、個人用戶本地部署的仨瓜倆棗,聚沙成塔是巨大的潛在需求增長。DeepSeek不是「英偉達終結者」,而是英偉達的財神爺。

  

  圖/NVIDIA官網

  所以,英偉達對DeepSeek的態度非常積極,不僅第一時間登陸NVIDIANIM,還給了權威背書——「DeepSeek-R1是最先進的大語言模型」。

  至於所謂「股價大跌」,英偉達經歷了市值十年增長222倍的超高增長,區區17%的跌幅不痛不癢。這輪迴調,不是DeepSeek對英偉達產生了實質性威脅,而是市場投資者借DeepSeek釋放一波回調勢能。

  當然,算力需求增長,未必是英偉達笑到最後。給英偉達造成競爭壓力的不是DeepSeek,而是其他大廠的算力晶元。英偉達的大客戶谷歌、亞馬遜、微軟競相推出自家算力晶元,算力大戰已經開打。這場「神仙打架」對人工智慧技術的研發、應用無疑是好消息。

  因此,強行把DeepSeek樹立為英偉達的對手,是莫名其妙的「關公戰秦瓊」。這種強行對立,不是拔高,而是矮化——低估了Deepseek對整個人工智慧領域的結構性衝擊。

  03

  DeepSeek是計劃外的中美科技合作產物

  我們應該怎樣評價DeepSeek呢?DeepSeek創始人梁文鋒給出了標準答案,「我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚」。

  

  ▲DeepSeek創始人梁文鋒(圖/視頻截圖)

  DeepSeek的成功完全是計劃外的市場產物。一家註冊資金1000萬的小公司,而不是「國家隊」。起點不高,也沒有「星辰大海」的宏大目標——DeepSeek的初始目標是專攻金融交易。這樣一家「起於草莽」的小民企,打造了一款成功的人工智慧產品。不經意間改變了整個產業。這才是科技產業發展的正常模式。各種奇思妙想在開放的市場中競爭、試錯,實現從量變到質變的升華。

  DeepSeek的成功,沒有「賭國運」、中美爭霸的宏大敘事,只有樸實的市場邏輯和水到渠成的科技路徑。市場需要性價比高的人工智慧技術,企業研發滿足了市場需求。蒸餾技術從純理論的紙上談兵,到成熟大模型開道后真正落地。自然而然,不需要拔苗助長。

  DeepSeek不是閉門造車的產物,而是中美科技合作的成果。美國大廠的「教師模型」和算力技術,中國科技企業的研發力量,缺一不可。市場機制的無形之手,總是撮合出「佳偶天成」。那些彩旗飄飄、儀式感十足的「合作簽約儀式」十之八九只是「儀式」而已。只有市場機制下的合作才保真。

  因此,大可不必刻意強調DeepSeek的原創性、創新性。師承ChatGPT的蒸餾技術、使用英偉達GPU都是無法否認的事實,又何必遮遮掩掩?「微創新」的一小步,也可以是人類科技事業的一大步。瓦特並沒有發明蒸汽機,而是改良了前輩的創作。這並不妨礙瓦特蒸汽機叩開了工業化的大門。

  一款好產品本身,足以說明一切。DeepSeek無疑是一款好產品,至於是否具備「劃時代」的意義,無需「口頭加冕」,時間會說明一切。就算沒有又何妨?只要有良好的市場合作機制,而不是以鄰為壑的自我封閉,劃時代的好產品一定不會缺席。

 

        更多科技前沿 文章    >>

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-6-28 16:21

返回頂部