倍可親

回復: 0
列印 上一主題 下一主題

OpenAI首席技術官最新透露:Sora預計將在今年發布,計劃加入語音功能,還有這些「乾貨

[複製鏈接]
匿名
跳轉到指定樓層
樓主
匿名  發表於 2024-3-15 11:08 回帖獎勵 |倒序瀏覽 |閱讀模式
穆拉蒂在接受採訪時透露,目前利用Sora生成視頻的成本非常高,團隊正在優化技術,預計將在今年正式發布。<br />
穆拉蒂透露,OpenAI人工智慧文生視頻大模型Sora即將於今年晚些時候正式向公眾發布,OpenAI計劃最終加入音頻功能,以使場景更為真實,同時還將允許用戶編輯Sora生成的視頻內容。除此之外,穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會包含音頻、訓練數據來自哪裡等若干問題。給出的答案有的籠統,有的不乏誠意。Sora如何「化文字為神奇」?請你想象一幕場景:「一條美人魚和她的螃蟹夥伴,正在一起瀏覽智能手機……」作為這場媒體採訪的「福利」,主持人獲得了讓Sora將其提供的多組文本提示,轉化為視頻圖像的機會,而以上的這一幕,便是Sora提供的視頻中的一幀。圖Sora究竟是如何實現這一轉換的呢?穆拉蒂表示,儘管解釋美人魚的進化可能都要比解釋「擴散模型」(diffusion models)的內部運作容易得多,但簡而言之便是:人工智慧模型分析了大量視頻,學會了識別物體和動作。然後,當你給它一個文字提示時,它就會勾勒出整個場景,然後填充每一幀。在被問及OpenAI為Sora使用了哪些訓練數據時,穆拉蒂指出,「我們使用了公開數據和授權數據」。
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-10 16:11

快速回復 返回頂部 返回列表