馬斯克,正面對決OpenAI、DeepSeek ....

京港台:2025-2-19 09:56| 來源:21世紀經濟報道 | 評論( 1 )  | 我來說幾句

馬斯克,正面對決OpenAI、DeepSeek ....

來源:倍可親(backchina.com)

  在AI的牌桌上,埃隆·馬斯克(Elon Musk)從不缺席。

  太平洋時間2月17日,馬斯克旗下人工智慧初創公司xAI的大模型Grok-3正式面世。發布會上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首個推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。

  同時,xAI還推出了名為Deepsearch的智能搜索引擎Agent工具。從大模型到AI搜索應用,xAI緊跟競品步伐通通上線。時常「一線衝鋒」的馬斯克,正加速在AI賽場上奔跑。

  在預告中,馬斯克將Grok-3標榜為「地球上最聰明的人工智慧」。根據xAI展示的數據,Grok-3在多項基準測試中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成績。

  在大模型的你追我趕中,AI的細分賽道上,最聰明的AI不斷易主。這場「不進則退」的殘酷競賽中,馬斯克也著急了。上周他還表示,為了提供最好的用戶體驗,xAI還在打磨產品,還需要一兩周的時間。

  但是面對新貴DeepSeek和勁敵OpenAI,馬斯克快馬加鞭急於讓Grok-3亮相。一周后,xAI將會陸續上線完整功能,不過當前付費用戶才能使用,Grok-3也未開源。新王不斷湧現,AI界的技術狂人們還將繼續過招。

  誰是「最聰明的AI」

  本次直播發布的時間並不長,只有半小時左右,馬斯克和xAI團隊基本上都在用數據和實操展現Grok-3的「智力」。

  和很多模型一樣,Grok-3在數學推理、科學邏輯推理和代碼編寫等方面表現出色。多項基準測試成績顯示,Grok-3在數學(AIME 2024)、科學問答(GPQA)、編碼(LCB)上刷新SOTA(State of the Art,描述在某一特定領域內當前最佳的技術、方法或模型),擊敗了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。

  按照xAI提供的數據,在多個AI領域內,Grok-3已經登頂。馬斯克表示,Grok-3的計算能力是前一代的「10倍以上」,並於1月初完成了預訓練,「我們每天都在不斷改進模型,實際上在24小時內,你就會看到改進。」

  AI,正在以每分每秒的速度不分晝夜地進化著,大模型廠商之間的火藥味更加濃烈。在Grok-3發布不久前,OpenAI的CEO Sam Altman還在社交媒體上發布了GPT-4.5的相關信息,表示測試者們嘗試GPT-4.5后,有比預期更多的「感受到AGI」的時刻。

  在鋪天蓋地的Grok-3報道中,Sam Altman穿插新品預告,吸引了不少關注。Sam Altman和馬斯克的「針鋒相對」,也將顯示在產品的PK中。

  xAI工程師介紹,雖然Grok起步較晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。

  與此同時,Grok-3也很明顯在對標競品,比如,馬斯克還特別提到了推理性能,而推理是DeepSeek-R1的強項。

  馬斯克表示,Grok-3接受了合成數據的訓練,可以通過反覆檢查數據來審查所犯的錯誤,以達到邏輯上的一致性,「因此,如果它得到了錯誤的數據,它會反思並刪除錯誤的數據。它的基本推理非常好。」

  而對於OpenAI,從Grok-3目前的數據看,其似乎領先於OpenAI最新的ChatGPT。隨著Grok-3即將上線,xAI和OpenAI之間的競爭將日益激烈。「最聰明的AI」,將會是一場持續的排位賽。

  大模型競速

  近年來快速崛起的AI明星著實不少,xAI當屬其一。技術狂熱又多金的馬斯克,在和OpenAI「決裂」后,轉而成立自己的AI公司。

  2023年,馬斯克的xAI公司成立,時隔半年便發布了Grok和Grok-1.5模型,可謂進展迅速。2024年8月,xAI又發布了Grok-2大模型;12月,xAI宣布開始向X平台上的所有用戶免費推出新版Grok-2模型,而此前該模式只向訂閱了Premium Plus的用戶開放。

  在算力基礎上,馬斯克也迅速囤卡。xAI團隊自建Colossus超級計算集群,集群規模已經從10萬塊英偉達GPU擴展到20萬塊,基於自家集群訓練出的Grok-3的性能也得到了增強。

  在xAI一日千里之時,AI圈的同行也在飈速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1為業內稱道。R1大模型的一個特點是採用了MOE架構(混合專家,Mixture-of-Experts),事實上Grok初代版本也使用了MOE架構。在開源世界中,如何練出絕世武功,還得看各家功力。

  DeepSeek-R1模型的衝擊下,在AI領域有大動作可不止xAI一家,不少公司都陸續放出大招。

  2月6日,OpenAI宣布擴大ChatGPT搜索功能的用戶範圍,任何人無需註冊,就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,繼續提升AI能力,並提供更具性價比的解決方案。

  2月13日,Sam Altman宣布,將很快發布GPT-5,並且免費無限使用;同日,文心一言官宣將於4月1日0時起全面免費,並且即日起上線深度搜索功能。

  AI的第一梯隊玩家都感受到「危機感」,不由得加快了迭代腳步,直接開啟新一輪價格戰,並探索更多應用場景形成商業閉環。有AI資深人士向21世紀經濟報道記者表示,目前Grok-3需要付費使用,馬斯克也在探索解決算力商業模式問題。

  在技術、Agent應用競速的同時,大模型廠商的融資也在競速。有報道稱,xAI正在接洽潛在的投資者,計劃籌集約100億美元資金,此輪融資可能使該公司估值達到約750億美元;還有報道稱OpenAI正在進行談判,希望在新一輪融資中籌集高達400億美元,這將使其估值達到3000億美元。

  在這場資金、技術、智力的金字塔遊戲中,大模型競速已從單純的技術迭代演變為全維度的生態博弈。算力軍備競賽與開源策略并行,價格戰倒逼商業閉環重構。有雲計算高管向記者表示,目前AI產業已經過了炒作階段,開始出現一些真正規模化的應用,大家會看到更多實用價值。

  而這場以硅基智能為燃料的競逐,能否加速構建通向AGI之路,大家都在拭目以待。

        更多科技前沿 文章    >>

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-10-18 05:50

返回頂部