馬斯克,正面對決OpenAI、DeepSeek ....
來源:倍可親(backchina.com)在AI的牌桌上,埃隆·馬斯克(Elon Musk)從不缺席。
太平洋時間2月17日,馬斯克旗下人工智慧初創公司xAI的大模型Grok-3正式面世。發布會上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首個推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。
同時,xAI還推出了名為Deepsearch的智能搜索引擎Agent工具。從大模型到AI搜索應用,xAI緊跟競品步伐通通上線。時常「一線衝鋒」的馬斯克,正加速在AI賽場上奔跑。
在預告中,馬斯克將Grok-3標榜為「地球上最聰明的人工智慧」。根據xAI展示的數據,Grok-3在多項基準測試中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成績。
在大模型的你追我趕中,AI的細分賽道上,最聰明的AI不斷易主。這場「不進則退」的殘酷競賽中,馬斯克也著急了。上周他還表示,為了提供最好的用戶體驗,xAI還在打磨產品,還需要一兩周的時間。
但是面對新貴DeepSeek和勁敵OpenAI,馬斯克快馬加鞭急於讓Grok-3亮相。一周后,xAI將會陸續上線完整功能,不過當前付費用戶才能使用,Grok-3也未開源。新王不斷湧現,AI界的技術狂人們還將繼續過招。
誰是「最聰明的AI」
本次直播發布的時間並不長,只有半小時左右,馬斯克和xAI團隊基本上都在用數據和實操展現Grok-3的「智力」。
和很多模型一樣,Grok-3在數學推理、科學邏輯推理和代碼編寫等方面表現出色。多項基準測試成績顯示,Grok-3在數學(AIME 2024)、科學問答(GPQA)、編碼(LCB)上刷新SOTA(State of the Art,描述在某一特定領域內當前最佳的技術、方法或模型),擊敗了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。
按照xAI提供的數據,在多個AI領域內,Grok-3已經登頂。馬斯克表示,Grok-3的計算能力是前一代的「10倍以上」,並於1月初完成了預訓練,「我們每天都在不斷改進模型,實際上在24小時內,你就會看到改進。」
AI,正在以每分每秒的速度不分晝夜地進化著,大模型廠商之間的火藥味更加濃烈。在Grok-3發布不久前,OpenAI的CEO Sam Altman還在社交媒體上發布了GPT-4.5的相關信息,表示測試者們嘗試GPT-4.5后,有比預期更多的「感受到AGI」的時刻。
在鋪天蓋地的Grok-3報道中,Sam Altman穿插新品預告,吸引了不少關注。Sam Altman和馬斯克的「針鋒相對」,也將顯示在產品的PK中。
xAI工程師介紹,雖然Grok起步較晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。
與此同時,Grok-3也很明顯在對標競品,比如,馬斯克還特別提到了推理性能,而推理是DeepSeek-R1的強項。
馬斯克表示,Grok-3接受了合成數據的訓練,可以通過反覆檢查數據來審查所犯的錯誤,以達到邏輯上的一致性,「因此,如果它得到了錯誤的數據,它會反思並刪除錯誤的數據。它的基本推理非常好。」
而對於OpenAI,從Grok-3目前的數據看,其似乎領先於OpenAI最新的ChatGPT。隨著Grok-3即將上線,xAI和OpenAI之間的競爭將日益激烈。「最聰明的AI」,將會是一場持續的排位賽。
大模型競速
近年來快速崛起的AI明星著實不少,xAI當屬其一。技術狂熱又多金的馬斯克,在和OpenAI「決裂」后,轉而成立自己的AI公司。
2023年,馬斯克的xAI公司成立,時隔半年便發布了Grok和Grok-1.5模型,可謂進展迅速。2024年8月,xAI又發布了Grok-2大模型;12月,xAI宣布開始向X平台上的所有用戶免費推出新版Grok-2模型,而此前該模式只向訂閱了Premium Plus的用戶開放。
在算力基礎上,馬斯克也迅速囤卡。xAI團隊自建Colossus超級計算集群,集群規模已經從10萬塊英偉達GPU擴展到20萬塊,基於自家集群訓練出的Grok-3的性能也得到了增強。
在xAI一日千里之時,AI圈的同行也在飈速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1為業內稱道。R1大模型的一個特點是採用了MOE架構(混合專家,Mixture-of-Experts),事實上Grok初代版本也使用了MOE架構。在開源世界中,如何練出絕世武功,還得看各家功力。
DeepSeek-R1模型的衝擊下,在AI領域有大動作可不止xAI一家,不少公司都陸續放出大招。
2月6日,OpenAI宣布擴大ChatGPT搜索功能的用戶範圍,任何人無需註冊,就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,繼續提升AI能力,並提供更具性價比的解決方案。
2月13日,Sam Altman宣布,將很快發布GPT-5,並且免費無限使用;同日,文心一言官宣將於4月1日0時起全面免費,並且即日起上線深度搜索功能。
AI的第一梯隊玩家都感受到「危機感」,不由得加快了迭代腳步,直接開啟新一輪價格戰,並探索更多應用場景形成商業閉環。有AI資深人士向21世紀經濟報道記者表示,目前Grok-3需要付費使用,馬斯克也在探索解決算力商業模式問題。
在技術、Agent應用競速的同時,大模型廠商的融資也在競速。有報道稱,xAI正在接洽潛在的投資者,計劃籌集約100億美元資金,此輪融資可能使該公司估值達到約750億美元;還有報道稱OpenAI正在進行談判,希望在新一輪融資中籌集高達400億美元,這將使其估值達到3000億美元。
在這場資金、技術、智力的金字塔遊戲中,大模型競速已從單純的技術迭代演變為全維度的生態博弈。算力軍備競賽與開源策略并行,價格戰倒逼商業閉環重構。有雲計算高管向記者表示,目前AI產業已經過了炒作階段,開始出現一些真正規模化的應用,大家會看到更多實用價值。
而這場以硅基智能為燃料的競逐,能否加速構建通向AGI之路,大家都在拭目以待。