奧特曼重磅官宣ChatGPT四大更新 8億人狂歡

京港台:2025-10-8 03:24| 來源:新智元 | 評論( 2 )  | 我來說幾句

奧特曼重磅官宣ChatGPT四大更新 8億人狂歡

來源:倍可親(backchina.com)

  OpenAI 2025開發者日上,全場座無虛席。奧特曼重磅官宣四大更新:首發Apps SDK要把ChatGPT打造為「操作系統終極入口」,一鍵拖拽構建智能體AgentKit,無代碼Codex開發,以及Sora 2等三大API登場。OpenAI的野心,徹底藏不住了。

  OpenAI 2025開發者日,奧特曼的精彩演講引爆全場!

  現場,50分鐘發布會,奧特曼重磅官宣了四項重大更新:

  Apps SDK:與外部應用無縫集成,OpenAI最大野心——把ChatGPT打造成未來的操作系統;

  AgentKit:無需編碼,拖放搭建智能體。人人都可快速開發智能體,還能評估智能體能力;

  Codex全面可用:不寫一行代碼,打造爆款APP;

  API更新:三大API更新,Sora 2 API同步上線。

  最最重磅的,還是Apps SDK,所有人皆可在ChatGPT中構建原生應用,其意義堪比2023年首發的GPTs。

  這預示著,ChatGPT又將成為一個新時代的「APP Store」!

  

  

  正如爆料所言,AgentBuilder讓智能體構建變得像搭積木一樣簡單直觀。現場,僅用8分鐘拖拽,便一鍵完成了完整Agent的搭建。

  

  自從2023年11月首屆開發日以來,短短兩年,OpenAI開發者規模已經從200萬增長到400萬,翻了1倍!

  ChatGPT周活也從1億暴增超8億,翻了8倍!

  現在,OpenAI API每分鐘都有近60億token產生,相比此前的3億token,翻了20倍!

  這些里程碑的數字不僅代表增長,更意味著AI正在成為新的技術基礎設施。

  OpenAI未來的野心,全部藏在了這場發布會的四大核心發布中。

  ChatGPT,下一代「操作系統」

  首先,奧特曼帶來首個重磅發布叫做——Apps SDK。

  意味著你可以在ChatGPT直接調用其他APP。藉助Apps SDK,ChatGPT可以集成各種應用。

  這個功能完全反映了OpenAI的野心!

  奧特曼想把ChatGPT打造成未來的操作系統。

  現在我們的應用都是運行在MacOS、Windows、Linux等操作系統上。

  未來,ChatGPT將成為更上級的「操作系統」,即使是專業APP,都可以直接「運行」在ChatGPT里。

  ChatGPT的目標是成為「操作系統級」的入口,而不僅僅是一個「應用」!

  OpenAI的應用CEO Fidji Simo盛讚這個功能將「無法想象」,非常期待開發者打造的應用。

  

  奧特曼想把ChatGPT變成每個人的「默認界面」,就像曾經Windows桌面是每個人的「默認界面」一樣。

  

  目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。

  OpenAI的軟體工程師Alexi現場展示了如何在ChatGPT直接調用這些外部應用。

  比如只需要輸入「Coursera」,ChatGPT就能自動識別並調用Coursera的功能。

  

  可以直接在ChatGPT中要求「Canva」製作海報,而不需要額外跳轉。

  

  類似的,可以直接在ChatGPT中使用Zillow查詢周邊房價,並使用Zillow的UI來直接呈現。

  

  奧特曼承諾,更多應用即將上線。

  

  一鍵拖拽,8分鐘搭一個Agent

  第二個全新的功能就是此前劇透的可視化智能體構建平台。

  

  新功能名為AgentKit,是面向開發者和企業的一整套構建、部署和優化智能體的工具。

  AgentKit包含三個工具:

  Agent Builder:可視化畫布

  Connector Registry:管理數據和工具如何連接

  ChatKit: 嵌入定製聊天界面的工具包

  

  Agent Builder是一個全新的可視化拖拽平台,AI智能體的構建流程就像搭積木一樣簡單!

  

  ChatKit可以生成各種各樣的聊天工具,提供獨一無二的Chat體驗。

  

  此外,OpenAI這次還提供了評估智能體能力的Eval指標。

  

  通過四個方面,數據集、跟蹤評分、自動化提示和第三方模型支持,來評估新建智能體的能力。

  

  關於如何定義Agents,什麼是智能體的定義,奧特曼在這次大會也給出了一個答案:

  「能夠為你工作的系統」都可以稱為智能體,Agents!

  

  奧特曼現場展示了Albertsons如何構建智能體來分析銷量。

  

  比如,可以直接讓ChatGPT出一個提高冰激淋銷量的方案。

  

  OpenAI平台體驗部門的Christina Huang現場直播展示了,如何只用8分鐘就構建一個完整的智能體!

  

  使用Agent Builder無需寫任何一行代碼,全程只需要拖拽和參數配置。

  

  現在Agent Builder功能已經在OpenAI Platform網站上線。

  

  簡單體驗了下,構建過程非常的絲滑。

  

  進入開發者平台,點擊左側的「Agent Builder」即可使用。

  

  構建后,點擊右上角Evaluate即可開始對新建智能體的評估。

  不寫一行代碼,打造爆款APP

  除了ChatGPT原生應用和智能體,AI在軟體開發上,已帶來顛覆性的變革。

  誰曾想,如今,OpenAI內部每周70%的PR都由Codex完成。

  就比如,在Codex加持下,拖放搭建智能體工具從0開發僅用6周完成。

  奧特曼稱,我們正進入一個全新時代,任何有想法的人,都能為自己、家人、社區構建一款應用。

  在此,他舉了幾個鮮活的、發生在每個人身邊的案例——

  一位89歲退休日本老人,用ChatGPT自學編程為老年用戶開發了11款iPhone應用;西班牙的一位老人和流媒體成員,藉助ChatGPT、Sora等,幫人們重拾記憶;

  在ASU醫學院,基於ChatGPT搭建的虛擬患者應用,幫助學習模擬練習如何和患者溝通;還有在法國凡爾賽宮,官方基於Realtime API打造的一款APP,讓遊客與藝術品和雕塑進行實時對話。

  重點來了,今天起OpenAI Codex結束預覽,正式進入通用可用階段。

  自今年初首次發布,到GPT-5 Codex的迭代后,Codex的每日消息量增長10倍,自發布處理了超40萬億token。

  這一次,新增功能包括:Slack集成、Codex SDK、企業控制。

  目前,思科在內部部署Codex后,代碼審查速度提升50%,項目平均周期從數周縮短至數天。

  現場,OpenAI開發者負責人Romain Huet帶來了「舞檯燈光控制器」的實時互動演示。

  設計原型非常簡單,一個控制面板——左側是攝像頭畫面,右側排列操作按鈕。

  全程無需手寫一行代碼,Codex快速生成一個功能齊全的界面。

  「如何在Node.js中控制索尼FR7相機?」

  面對C++ SDK的複雜性,Codex提出了更加優雅的解決方案——基於VISC協議集成控制功能。

  幾分鐘內,Codex不僅生成了Node伺服器代碼,還解析了相機所需的UDP數據包,甚至發現了特定型號相機所需的特殊頭部信息。

  僅僅用按鈕控制相機還不夠,下一步,讓Xbox無線手柄實現相機控制。

  通過Codex IDE擴展發送指令,Codex便會迅速制定計劃、分析文件,自動識別Xbox的輸入邏輯,並將搖桿映射為控制的最佳方式。

  運行伺服器,現場攝像頭畫面屏幕閃現,台下所有人揮手打招呼。

  

  

  更令人興奮的是,它還集成了語音交互功能。

  通過Codex的Realtime API和智能體語音,可以將自然語言引入這款應用。

  只需說一句,「將燈光聚焦到觀眾席」,Codex便通過MCP伺服器控制會場燈光系統,瞬間點亮觀眾席。

  

  最後,Romain還用Codex SDK拍了一張全體照片,實現了一個「電影式結尾」——演職員表,將現場所有參會者的名字動態呈現。

  這一切,全部通過語音指令完成。

  

  Codex GA(General Availability)開放,標誌著軟體工程未來全新可能。

  奧特曼現場表示,「它將最複雜的編碼難題簡化為自然語言指令,唯一的限制就是你的想象力」。

  三大API,Sora 2也上線了

  最後,奧特曼帶來了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2。

  開發者們可以搶先一步,享用最強GPT-5 Pro智能,其在指令遵循方面能力大幅提升,體驗更優。

  

  

  在處理那些高精度、深度推理複雜任務,GPT-5 Pro更拿手,尤其是在金融、法律、醫療保健等眾多行業。

  如今,OpenAI API即可支持GPT-5 Pro的調用。

  它的訓練截止時間是2024年9月30日,400k上下文窗口,最大支持272k token輸出。

  輸入價格:15美元/百萬token,輸出價格:120美元/百萬token。目前支持文本、圖像輸入,僅文本輸出。

  

  最新的API定價,再次刷新了價格天花板。

  GPT-5 Pro輸入價格是GPT-5 15倍,輸出價格是GPT-5 12倍。

  同時,OpenAI還在API中發布了一款語音模型——gpt-realtime-mini。

  這是兩個月前高級語音模型的縮小版,成本降低了70%,但語音質量和性能保持不變。

  

  奧特曼稱,「就我個人而言,我認為語音將成為人們與 AI 交互的主要方式之一。而這次發布正是邁向這一現實的一大步」。

  值得一提的是,幾天前剛剛上線的Sora 2,預覽版的API也正式上線。

  視頻長度、寬高比、解析度,全程可控。

  

  這意味著,任何一款APP直接可以用Sora API,生成出令人驚嘆的視頻。

  可控性,是Sora 2最大的優勢。比如,拍攝iPhone視圖,Sora即可擴展成一個全景電影寬鏡頭。

  首次實現音畫同步,Sora 2直出背景、環境音效。

  甚至,人們還可以將現實世界的片段融入Sora。比如,將自家狗照片上傳,就可以瞬間為它造出「賽博狗友」。

  

  在電商廣告中,Sora 2還可以做概念開發。

  

  一個用戶案例是,OpenAI聯手MATTEL,將創意師的產品創意瞬間變為現實。

  

  演講的最後,奧特曼激動表示,「我們正見證一個前所未有的時代」。

  曾幾何時,開發一款軟體需要數月,甚至數年的周期。

  而今天,有了AI,一個想法可以在幾分鐘內落地成型。

  開發者不再需要一個龐大的團隊,只需一個好的創意,就能超越以往的速度,將靈感變為現實。

  我們的願景,是讓AI真正為每一個人所用。

  而這個願景,離不開你們每一個人的參與。

  

  車上放上它,10萬的車開出50萬質感,老司機都在用!

        更多科技前沿 文章    >>

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-10-13 02:57

返回頂部