當?shù)貢r間周一,OpenAI宣布正式向用戶開放人工智能(AI)視頻生成模型Sora,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻,這距離OpenAI首次公開預覽這款產(chǎn)品已過去了10個月時間。
根據(jù)OpenAI的介紹,Sora將于當天晚些時候向美國及其他市場的ChatGPT付費用戶開放。新版工具Sora Turbo可以生成最長達20秒的視頻,并且可以提供這些視頻的多種變體。
自今年2月首次預告Sora以來,OpenAI便開始與電影制片廠、媒體高管以及經(jīng)紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。
OpenAI聲稱Sora是一項理解和模擬現(xiàn)實的基礎性AI技術,是開發(fā)能夠與物理世界互動模型的重要一步。
然而,Sora在早期測試中顯示出明顯的局限性。據(jù)悉,在一次測試中,Sora存在“多余肢體”的問題,并對物理現(xiàn)象的理解不夠準確。此外,與圖像生成器或聊天機器人相比,Sora生成每個視頻所需的時間和算力明顯更多了。
OpenAI首席執(zhí)行官奧爾特曼表示,初期Sora的使用仍然受限,ChatGPT Plus訂閱用戶可以每月生成50個低分辨率視頻,ChatGPT Pro訂閱用戶可以無限制的“較慢”生成高分辨率視頻,以及500個快速生成的視頻。
除了視頻生成的數(shù)量和速度會有限制之外,Sora在歐洲大部分地區(qū)也無法使用,因為歐洲的科技監(jiān)管更嚴格。
在周一的演示中,OpenAI還展示了Sora的新功能。該公司表示,該工具不僅可以通過文本提示生成視頻,還能夠基于靜態(tài)圖片和已有視頻創(chuàng)建新的內(nèi)容。例如,用戶可以上傳一段視頻剪輯,Sora會生成擴展這個片段的后續(xù)畫面,使視頻變得更長、更完整。
Sora還包含一個名為Storyboard的選項,用戶可以通過它詳細描述希望視頻在不同時間點發(fā)生的內(nèi)容,從而更好地指導一系列片段的生成。此外,Sora還提供了一個功能,讓用戶可以瀏覽其他人創(chuàng)作的視頻集錦。
Sora的發(fā)布是OpenAI為期12天的產(chǎn)品直播活動的一部分,上周已推出了更昂貴的ChatGPT Pro訂閱選項,可無限制訪問OpenAI最強大的AI模型。
雖然Sora是世界上第一個視頻生成模型,但自它問世以來,同類產(chǎn)品已經(jīng)是百花齊放,比如Google的Veo、快手可靈、Runway的Gen-3、字節(jié)跳動PixelDance等。
與此同時,這些可以快速地制作視頻的工具正在顛覆影視行業(yè),人們已經(jīng)開始探索如何將這項技術應用于電影制作。