OpenAI首席技術官最新透露：Sora預計將在今年發布，計劃加入語音功能，還有這些「乾貨

倒序瀏覽 · 發表於 2024-3-15 11:08

穆拉蒂在接受採訪時透露，目前利用Sora生成視頻的成本非常高，團隊正在優化技術，預計將在今年正式發布。<br />
穆拉蒂透露，OpenAI人工智慧文生視頻大模型Sora即將於今年晚些時候正式向公眾發布，OpenAI計劃最終加入音頻功能，以使場景更為真實，同時還將允許用戶編輯Sora生成的視頻內容。除此之外，穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會包含音頻、訓練數據來自哪裡等若干問題。給出的答案有的籠統，有的不乏誠意。Sora如何「化文字為神奇」？請你想象一幕場景：「一條美人魚和她的螃蟹夥伴，正在一起瀏覽智能手機……」作為這場媒體採訪的「福利」，主持人獲得了讓Sora將其提供的多組文本提示，轉化為視頻圖像的機會，而以上的這一幕，便是Sora提供的視頻中的一幀。圖Sora究竟是如何實現這一轉換的呢？穆拉蒂表示，儘管解釋美人魚的進化可能都要比解釋「擴散模型」（diffusion models）的內部運作容易得多，但簡而言之便是：人工智慧模型分析了大量視頻，學會了識別物體和動作。然後，當你給它一個文字提示時，它就會勾勒出整個場景，然後填充每一幀。在被問及OpenAI為Sora使用了哪些訓練數據時，穆拉蒂指出，「我們使用了公開數據和授權數據」。

OpenAI首席技術官最新透露：Sora預計將在今年發布，計劃加入語音功能，還有這些「乾貨

瀏覽過的版塊