師承ChatGPT的DeepSeek和國運有啥關係?

京港台：2025-2-17 00:17| 來源：冰川思享號 | 評論( 5 )條 | 我來說幾句

師承ChatGPT的DeepSeek和國運有啥關係?

來源：倍可親(backchina.com)

　　撰文丨關不羽

　　DeepSeek橫空出世，成功破圈。破圈之後，照例就是各自發揮的「六經注我」。其中最值得警惕的，中美雙方都出現了借題發揮的「技術孤立主義」。美方的「脫鉤論」者把DeepSeek視為技術威脅，剽竊、盜用的指責滿天飛；這邊則是把DeepSeek渲染為「中美爭霸」的一擊制勝，自我感覺良好。

　　好端端的科技成果，卻成了地緣政治的符號。妖魔化和神化看似針尖對麥芒，其實都是對科技進步事業的褻瀆，是阻撓人類科技進步事業的合謀。

　　唯有屏蔽雜音，才能直面真相：DeepSeek到底是什麼？將會造成怎樣的影響？

　　DeepSeek師承ChatGPT

　　1月27日，DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜，在美區下載榜上超越了ChatGPT。隨即引發了資本市場的震蕩，DeepSeek被形容為「英偉達的最大空頭」，英偉達的股價大幅下跌。「DeepSeek碾壓ChatGPT，吊打英偉達」的神話就此誕生。

　　先說DeepSeek和ChatGPT之間的關係。DeepSeek和ChatGPT之間的競爭，是「師徒之戰」。兩者的師承關係源於「蒸餾技術」，這是DeepSeek快速崛起的技術路徑。

　　通俗地說，「蒸餾技術」就是用一個較為成熟的「教師模型」訓練「學生模型」，這一過程類似低度酒蒸餾加工為高度酒。具體操作方式是，「學生模型」每分鐘上百萬次高頻提問，從「教師模型」中汲取數據、學習邏輯。然後在人工干預下優化演演算法，最終形成獨特的個性。ChatGPT就是DeepSeek的「教師模型」，或許不是唯一的，肯定是主要的。因此，說ChatGPT是DeepSeek的老師，不過分吧？

　　圖/AI配圖

　　「蒸餾技術」不是近年來的新發明，發明者既不是中國人，也不是美國人，而是英國佬傑弗里·辛頓在2015年提出的，比阿爾法狗一戰成名還早一年。所以，當時「蒸餾技術」只是純理論的屠龍技——壓根就沒有成熟的「教師模型」，沒法蒸餾。直到ChatGPT等成熟大模型相繼投入實際應用，「蒸餾技術」才有了實際應用的空間。因此，「先有ChatGPT，後有DeepSeek」也是無法否認的事實。

　　顯然，DeepSeek不是「天上掉下個林妹妹」，而是站在巨人肩膀上的衍生產品。咋咋呼呼地竭力否認、淡化DeepSeek的師承ChatGPT，強拗「獨立原創」的造型，是可笑又可憐的掩耳盜鈴。

　　當然，也不能因為DeepSeek是蒸餾技術的產物，就否認其原創性。蒸餾不等於盜竊、抄襲。要是能一抄了之，哪裡輪得到DeeSeek？在蒸餾技術的賽道上，有名有姓的玩家少說也有上百家。DeepSeek能出圈，是有幾把刷子的。「蒸餾」大同小異，人工干預的演演算法優化各顯神通。簡潔高效的演演算法是DeepSeek的成功關鍵，頗有中國特色。

　　人工智慧三大要素——演演算法、算力、數據，中國長於演演算法，美國重視算力。這種「偏科」傾向在賽道開啟初期就已經顯現了。昔日商湯為代表的視覺系AI「中國四小龍」，就是以演演算法著稱。ChatGPT崛起，「算力為王」的大力出奇迹成為主流。風水輪流轉，DeeepSeek的勃興，在一定程度上是「演演算法復興」。這種技術風格的轉換，在人類的科技進步史上反覆發生，是一種常態。

　　DeepSeek最大的優勢是性價比，演演算法賦能大幅降低了算力成本。省錢永遠是商業競爭的王道，絕大部分個人用戶都沒有很高的專業需求，免費、開源的DeepSeek更有吸引力，這是人工智慧商業化應用的成功。

　　但是，這並不意味著因DeepSeek已經青出於藍勝於藍，更談不上「碾壓ChatGPT」。「蒸餾技術」和演演算法優化是做減法，以簡化的方式提高效率。所以，DeepSeek更垂直、更聚焦專業領域，這也意味著犧牲了一部分通用性。比如說，文生圖等視覺系技術就不是DeepSeek的強項，和文心一言比都有差距，遑論ChatGPT。而且，蒸餾技術的技術「天花板」到底有多高，現在也很難判斷。未來能否實現性能全面超越，並沒有清晰的預期。

　　這從資本市場的表現也可以看出端倪，DeepSeek上架后，微軟的股價僅僅下跌了2%。表明了市場投資者還處於觀望態度，資本市場用真金白銀的站隊表態，不是各路「嘴強王者」的唾沫星子可比的。

　　反而是英偉達的股價「大跌」17%，DeepSeek真是「英偉達終結者」嗎？

　　DeepSeek不是「英偉達終結者」

　　DeepSeek到底使用了多少英偉達晶元，目前有三個版本分別是五萬、一萬和兩千多，越傳越少。其中「只有了兩千多」的版本最假，DeepSeek創始人梁文鋒本人在採訪中就說過，早在公司成立前的2021年就囤了一萬塊GPU。無論是一萬還是五萬，比起動輒幾十萬晶元的大廠產品，都是數量級的降低。大可不必在傳播過程中人為誇大DeepSeek的「省芯」。

　　必須指出的是，DeepSeek的演演算法優化「省芯」，並不會降低人工智慧領域的算力需求降低。演演算法優化和算力需求的關係，有點類似燃油發動機技術節油和燃油消費需求。燃油發動機開發省油技術，並沒有降低汽油消費的總量。因為汽車的燃油成本越低，促進了汽車的普及度，燃油消費的總量不降反增。DeepSeek省芯降低了人工智慧研發應用的資金門檻，會吸引更多的投資者進場。

　　人工智慧的研發端將會進一步走向「群狼搏虎」的遍地開花。在應用端，DeepSeek成功實現免費開源模式，大幅推進了人工智慧的普及應用，也會產生巨大的算力需求增長。別小看中小企業、個人用戶本地部署的仨瓜倆棗，聚沙成塔是巨大的潛在需求增長。DeepSeek不是「英偉達終結者」，而是英偉達的財神爺。

　　圖/NVIDIA官網

　　所以，英偉達對DeepSeek的態度非常積極，不僅第一時間登陸NVIDIANIM，還給了權威背書——「DeepSeek-R1是最先進的大語言模型」。

　　至於所謂「股價大跌」，英偉達經歷了市值十年增長222倍的超高增長，區區17%的跌幅不痛不癢。這輪迴調，不是DeepSeek對英偉達產生了實質性威脅，而是市場投資者借DeepSeek釋放一波回調勢能。

　　當然，算力需求增長，未必是英偉達笑到最後。給英偉達造成競爭壓力的不是DeepSeek，而是其他大廠的算力晶元。英偉達的大客戶谷歌、亞馬遜、微軟競相推出自家算力晶元，算力大戰已經開打。這場「神仙打架」對人工智慧技術的研發、應用無疑是好消息。

　　因此，強行把DeepSeek樹立為英偉達的對手，是莫名其妙的「關公戰秦瓊」。這種強行對立，不是拔高，而是矮化——低估了Deepseek對整個人工智慧領域的結構性衝擊。

　　DeepSeek是計劃外的中美科技合作產物

　　我們應該怎樣評價DeepSeek呢？DeepSeek創始人梁文鋒給出了標準答案，「我們不是有意成為一條鯰魚，只是不小心成了一條鯰魚」。

　　▲DeepSeek創始人梁文鋒（圖/視頻截圖）

　　DeepSeek的成功完全是計劃外的市場產物。一家註冊資金1000萬的小公司，而不是「國家隊」。起點不高，也沒有「星辰大海」的宏大目標——DeepSeek的初始目標是專攻金融交易。這樣一家「起於草莽」的小民企，打造了一款成功的人工智慧產品。不經意間改變了整個產業。這才是科技產業發展的正常模式。各種奇思妙想在開放的市場中競爭、試錯，實現從量變到質變的升華。

　　DeepSeek的成功，沒有「賭國運」、中美爭霸的宏大敘事，只有樸實的市場邏輯和水到渠成的科技路徑。市場需要性價比高的人工智慧技術，企業研發滿足了市場需求。蒸餾技術從純理論的紙上談兵，到成熟大模型開道后真正落地。自然而然，不需要拔苗助長。

　　DeepSeek不是閉門造車的產物，而是中美科技合作的成果。美國大廠的「教師模型」和算力技術，中國科技企業的研發力量，缺一不可。市場機制的無形之手，總是撮合出「佳偶天成」。那些彩旗飄飄、儀式感十足的「合作簽約儀式」十之八九只是「儀式」而已。只有市場機制下的合作才保真。

　　因此，大可不必刻意強調DeepSeek的原創性、創新性。師承ChatGPT的蒸餾技術、使用英偉達GPU都是無法否認的事實，又何必遮遮掩掩？「微創新」的一小步，也可以是人類科技事業的一大步。瓦特並沒有發明蒸汽機，而是改良了前輩的創作。這並不妨礙瓦特蒸汽機叩開了工業化的大門。

　　一款好產品本身，足以說明一切。DeepSeek無疑是一款好產品，至於是否具備「劃時代」的意義，無需「口頭加冕」，時間會說明一切。就算沒有又何妨？只要有良好的市場合作機制，而不是以鄰為壑的自我封閉，劃時代的好產品一定不會缺席。

已有(5)條評論

原文連結倍可親聲明 DMCA 政策

師承ChatGPT的DeepSeek和國運有啥關係?

師承ChatGPT的DeepSeek和國運有啥關係?

更多科技前沿 文章 >>

更多科技前沿文章 >>