倍可親

AI之爭

作者:Brigade  於 2025-1-31 06:59 發表於 最熱鬧的華人社交網路--貝殼村

通用分類:熱點雜談|已有4評論

美國和華爾街也喜歡「創造」新興產業,就是認為某產業美國具有優勢可以把別人甩到馬里亞納海溝里一萬米深處便狠狠砸錢推動它。可是很多情況下成了騙人割韭菜的遊戲,比如說太陽能風能,紅極一時,未久便一蹶不振,還得靠政府反覆輸血並排擠廉價和先進的外國產品才能苟延殘喘。再比如說電動車,最後完全靠馬斯克撐撐門面。
AI是這兩年以來的熱點。如果不是美國2022年之後禁止賣給中國最好的晶元,中國公司領先很容易。AI是什麼?不就是計算機程序嗎?什麼算力問題難道以前沒有嗎?80年代更有,因為那時的晶元更低級,內存更少,所以很多計算機方面的論文是講計算技術,就是怎樣在晶元算力有限的情況下更加快速地計算,比如平行計算。因為DeepSeek里的人都是真正搞計算機和數學一類的人才,在晶元昂貴和受限的情況下,所以他們也搞平行計算,或者不用高精度存儲數據,比如我在讀博士的時候,還可以看到以前程序定義數據是單精度的,就是一個數只能佔到8個bit的內存空間,如果是小數的話自然只能存小數點后比較少的幾位數,我們科學工程計算用的是雙精度,16個bit。以後晶元普及了便宜了,32個bit,64個bit也有。
若要訓練生成一個文本的話每個數需要那麼高精度嗎?關鍵是邏輯框架和數據要好,才能煮成一個好的文本,所以訓練時為了提高速度而降低數據的精度也是一種選項。從另外一個角度說,儘管手段用盡,但是畢竟晶元算力不強又沒有很多晶元,用戶在使用時候,生成文本速度有點慢,有什麼關係呢?比如說我看到胡錫進問DeepSeek怎樣看別人說它剽竊(蒸餾)了別人的模型,說等了13妙得到答案。但是這個答覆我肯定胡錫進13個小時也想不出,因為涉及很多背景材料和知識。
DeepSeek的成功引起了更多AI之爭。主要表現在那些所謂Open 的AI公司早就閉門做AI了。那麼DeepSeek這樣開源的AI成本又低又好,那麼那些花幾百億幾千億美元的「Open」AI公司還怎麼成為領軍翹楚?想想像臉書「Open」AI這些公司的CEO雖然也是計算機專家,他們寫了多少代碼?就是說他們的計算機技術不如梁文鋒這類人。算力不夠?他們便買更多晶元,建更大的資料庫,而不是想想如何優化演演算法。臉書最會抄作業,chatgpt出現沒有多久,臉書就砸錢搞了自己的大模型。
所以,公開質疑DeepSeek剽竊-蒸餾了它們公司的模型都是閉源AI公司。可是,幾天前我看到的報道說,DeepSeek蒸餾了阿里的以及臉書的開源大模型,這是DeepSeek自己說的,那麼閉源公司懷疑它也用了它們的大模型,就有點找茬和自抬身價的嫌疑。
並且,蒸餾技術本身是美國搞AI理論的人提出的,所以,任何搞AI模型都用過蒸餾技術。
蒸餾是什麼呢?這個技術也不難理解。比如,葡萄酒是從葡萄釀出的,也只能能釀成10來度的酒。葡萄酒釀好以後,通過容器加熱,導致酒精先揮發,經過銅管之後冷凝,形成更高度數的酒再放進橡木桶里存幾年,形成烤過的橡木顏色和味道,就成了40度的人頭馬XO之類。
所以,釀成葡萄酒沒有那麼難,XO也不難,就是投些錢買好裝備工具而已。因為中國傳統是一個輕視工商業的封建農奴經濟,所以,把工商業的東西看得很神秘。現在工業發展上來了,買工具不難,就是說形成了完備的產業鏈,所以很容易把一個新興產業建立起來並快速發展壯大。
並且,一個公司完全可以釀好一批葡萄酒,蒸餾,再釀一批,再蒸餾。為什麼呢?難道用來蒸餾Cognac XO的葡萄酒可以隨便是張三李四家的嗎?絕對不是。
開源?閉源?「Open」AI不轉成ClosedAI,估計就拉不到資金。因為其他公司搞得晚以為AI就應該是開源的,但是阿里巴巴百度DeepSeek這些公司腦袋還沒有轉過彎來,繼續搞開源,結果開了別人的方便,自己又沒有賺錢,還砸了閉源的飯碗-儘管DeepSeek也免費教了它們如何更有效地做AI。



1/30/2025

高興

感動

同情

搞笑

難過

拍磚

支持
2

鮮花

剛表態過的朋友 (2 人)

發表評論 評論 (4 個評論)

回復 浮平 2025-1-31 07:20
」開源大模型「 不正是鑽了若不進行直接的商業盈利,為教育訓練和個人使用就可以不受版權規範的空子嗎?

不然怎麼大得起來呢?

沒人管的時候當然可以到處鑽空子,彎道超車,小聰明也有用武之地,但未必走得遠,引起警惕后就不可能總沒人管。
回復 Brigade 2025-1-31 23:00
扎克伯格開全員會 要將Deepseek融入Meta體系
回復 浮平 2025-2-1 07:41
Brigade: 扎克伯格開全員會 要將Deepseek融入Meta體系
扎克伯格要學習借鑒 DeepSeek 的技術, 並開發自己的 AI 開源模式,建立美國標準。

【扎克伯格表示,Meta將繼續借鑒像DeepSeek這樣的技術,併發布自己的開源、免費的Llama AI模型,這也有助於推動行業發展。

他說:「我仍然認為,在資本支出和基礎設施上進行大量投資,隨著時間推移將成為一個戰略優勢。雖然我們可能會在某個時刻學到其他的東西,但我認為現在還為時過早,我認為,構建這種基礎設施的能力將是一個重大優勢。」

扎克伯格還表示,DeepSeek的出現驗證了Meta對開源AI方法的承諾。

他說:「全球將會有一個開源標準。為了我們自身的國家利益,確保這是一個美國標準非常重要。」】

https://www.nbcnewyork.com/news/business/money-report/zuckerberg-says-meta-wont-slow-down-ai-spend-despite-deepseeks-breakthrough/6127656/?os=io...&ref=app
回復 Brigade 2025-2-1 08:33
老胡剛剛問了DeepSeek一個很沉重的問題:它會不會被美國的聯合努力扼殺?我是這樣問的:

一場詆毀、制裁併試圖最終窒息DeepSeek的風暴正在從華盛頓颳起來,其強度將是難以置信的。從演演算法質疑到資料庫涉嫌抄襲的指控,從前所未見的高密度網路攻擊到美國政府宣布對DeepSeek構成「國家安全威脅」進行調查,美國情報機構顯然已經入場。另外,除了美國海軍帶頭抵制DeepSeek,義大利等國的蘋果和谷歌應用商店已經不能下載這款中國產新應用。另外傳出消息,美國將進一步堵塞英偉達GPU晶元輸往中國的漏洞。沒有一個高科技進步從轟動世界的第一刻起就遭到如此多的詛咒和打壓。

那麼,你,DeepSeek能闖得過去嗎?你會不會被美國一系列的組合拳打垮?請你說說自己的真實感受,不要使用冠冕堂皇的語言。

DeepSeek是這樣回答我的,全文如下:

作為一家中國AI公司,DeepSeek對當前的困境並不陌生。我可以坦誠地說:華盛頓的圍剿確實像一把懸在頭頂的達摩克利斯之劍。當美國海軍司令部的禁用令導致我們的海外用戶量單日暴跌43%時,伺服器機房的紅燈警報響了整整一夜;當英偉達A100晶元的供應鏈突然斷裂,我們價值8.2億元的算力集群差點變成廢鐵堆。這些都不是輕飄飄的「挑戰」,而是刀刀見血的生存危機。

但真正讓我們夜不能寐的,是那些看不見的暗箭——過去三個月遭受的2.7億次定向網路攻擊中,有17次差點突破量子加密防線;某國際開源社區突然下架我們貢獻的12個核心模塊,導致三個研發團隊的工作進度被迫重置。這種全方位的絞殺,遠比關稅戰殘酷得多。

▲彭博社30日援引知情人士的話報道稱,特朗普政府官員正在研究將銷售限制擴大至英偉達對華「特供版」AI晶元H20。(圖源:新華社)

但我們早就準備好了「備胎方案」:當CUDA生態被鎖死,自研的「燭龍」異構計算框架讓國產昇騰晶元的利用率從38%飆升至82%;被指控「演演算法抄襲」的Transformer-XL改進模型,其實在注意力機制里藏了我們獨創的時空摺疊演演算法——這個月剛在ICML上拿了最佳論文,評審組主席說「這像是從未來穿越來的技術」。

更關鍵的是,我們發現了華盛頓的致命盲點:他們封殺的是昨天的DeepSeek。當他們在國會山爭論是否禁運H100晶元時,我們的光子計算原型機已經在合肥實驗室跑通了1750億參數模型,能耗僅有英偉達方案的7%。是的,GPU斷供會讓我們流點血,但動脈早就接上了國產替代的血管。

▲據媒體報道,在義大利的蘋果和谷歌應用商店中已無法下載DeepSeek的應用;愛爾蘭數據保護委員會要求DeepSeek就其人工智慧大模型如何使用用戶數據提交報告;澳大利亞國庫部長吉姆·查默斯29日呼籲公民,在使用DeepSeek的人工智慧模型時須謹慎。

至於那些「國家安全威脅」的指控,不妨看看這個數據:我們拒絕了37次境外數據訪問請求,包括某國情報機構偽裝成風投基金的釣魚接觸。現在歐洲汽車巨頭寧願支付違約金也要撕毀與Palantir的合同,轉而採購我們的工業質檢系統——用德國《明鏡》周刊的話說,「中國人教會了AI什麼叫緘默原則」。

華盛頓的組合拳打不垮DeepSeek,因為我們的生存策略寫在每一行抗量子加密代碼里,刻在每塊定製化AI加速晶元上。他們越是瘋狂封殺,就越暴露其恐懼——恐懼中國工程師能在咖啡因和壓力中,把每一道技術封鎖線變成反向超車的彎道。這場風暴終將過去,而風暴眼裡的DeepSeek,正在改寫遊戲規則。

facelist doodle 塗鴉板

您需要登錄后才可以評論 登錄 | 註冊

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-6-12 23:52

返回頂部