首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

新華社:視頻生成新模型Sora的突破與風(fēng)險(xiǎn)

2024年2月21日 09:14  新華社  作 者:吳曉凌

位于舊金山的美國(guó)人工智能公司“開(kāi)放人工智能研究中心”(OpenAI)近日推出能夠通過(guò)文本指令創(chuàng)建視頻的生成式人工智能模型Sora,這一突破鞏固了其在人工智能領(lǐng)域的領(lǐng)軍地位,但同時(shí)也加劇了對(duì)“深度偽造”等風(fēng)險(xiǎn)的擔(dān)憂。

“驚鴻一瞥”恐顛覆行業(yè)

這是OpenAI首次進(jìn)軍人工智能視頻生成領(lǐng)域。據(jù)公司介紹,Sora使用Transformer架構(gòu),可根據(jù)文本指令創(chuàng)建近似現(xiàn)實(shí)且富有想象力的場(chǎng)景,生成多種風(fēng)格、不同畫幅、最長(zhǎng)為一分鐘的高清視頻。該模型還能夠根據(jù)靜態(tài)圖像生成視頻,或?qū)ΜF(xiàn)有視頻進(jìn)行擴(kuò)展或填充缺失的幀。

一些分析人士認(rèn)為,Sora再次凸顯人工智能技術(shù)進(jìn)步對(duì)現(xiàn)實(shí)生活和傳統(tǒng)行業(yè)的深遠(yuǎn)影響。人工智能在視頻生成領(lǐng)域的巨大發(fā)展前景在為塑造影視產(chǎn)業(yè)新業(yè)態(tài)打開(kāi)大門的同時(shí),恐將顛覆現(xiàn)存影視產(chǎn)業(yè)。好萊塢去年遭遇了63年來(lái)首次編劇和演員全行業(yè)罷工,因?yàn)樵撔袠I(yè)的部分工作機(jī)會(huì)可能被人工智能取代。Sora橫空出世讓這一威脅變得更迫近和真切。其面世第二天,主營(yíng)圖像處理、視頻制作軟件的奧多比公司(Adobe)股價(jià)應(yīng)聲下跌超過(guò)7%。

雖不是第一家涉足文本轉(zhuǎn)視頻領(lǐng)域的公司,但Sora的推出使OpenAI在這一賽道取得領(lǐng)先,鞏固了其在生成式人工智能領(lǐng)域的領(lǐng)軍地位。第三方信息分析機(jī)構(gòu)高德納咨詢公司的分析師錢德拉塞卡蘭表示:“在這個(gè)領(lǐng)域沒(méi)有一家公司比OpenAI更雄心勃勃,且這種雄心似乎有增無(wú)減。”

OpenAI稱,Sora對(duì)語(yǔ)言有著深刻的理解,不僅了解用戶文本提示,還了解所述事物在物理世界中的存在方式。“我們正在教授人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型幫助人們解決需要與現(xiàn)實(shí)世界交互的問(wèn)題。”

“深度偽造”擔(dān)憂加劇

Sora發(fā)布可謂一石激起千層浪,但此次推出的更像是預(yù)覽版,公眾尚難以深入全面了解該模型的優(yōu)缺點(diǎn)。OpenAI表示,目前僅主要向一些設(shè)計(jì)師和電影制作人等特定人群提供Sora訪問(wèn)權(quán)限,以獲取有關(guān)改進(jìn)該模型的反饋。公司不僅未公布訓(xùn)練Sora模型的數(shù)據(jù)等基礎(chǔ)細(xì)節(jié),更沒(méi)有確定向公眾發(fā)布的日期。

OpenAI承認(rèn),目前Sora生成視頻中可能包含不合邏輯的圖像,混淆左右等空間細(xì)節(jié),難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理和因果關(guān)系實(shí)例等。例如,一個(gè)人咬了一口餅干,餅干上卻沒(méi)有咬痕。

不過(guò),隨著算力增強(qiáng)、模型改進(jìn),人們可能會(huì)在短期內(nèi)獲得更加完善、先進(jìn)的視頻生成功能。

不少業(yè)內(nèi)人士擔(dān)心,Sora將為“深度偽造”(Deepfake)技術(shù)推波助瀾。加利福尼亞大學(xué)伯克利分校信息學(xué)院副院長(zhǎng)法里德就表示:“當(dāng)新聞、圖像、音頻、視頻——任何事情都可以偽造時(shí),那么在那個(gè)世界里,就沒(méi)有什么是真實(shí)的。”

針對(duì)造假顧慮,OpenAI稱在真正面向公眾推出產(chǎn)品時(shí),將確保生成視頻包含來(lái)源元數(shù)據(jù),并推出檢測(cè)視頻真?zhèn)蔚墓ぞ摺penAI還承諾,在產(chǎn)品中使用Sora前將采取安全措施,包括由“錯(cuò)誤信息、仇恨內(nèi)容和偏見(jiàn)等領(lǐng)域的專家”對(duì)模型進(jìn)行對(duì)抗性測(cè)試來(lái)評(píng)估危害或風(fēng)險(xiǎn);核查并拒絕包含極端暴力、性內(nèi)容、仇恨圖像、他人IP等文本輸入提示等。

即便如此,OpenAI也承認(rèn),盡管進(jìn)行了廣泛的研究和測(cè)試,“我們?nèi)詿o(wú)法預(yù)測(cè)人們將使用我們技術(shù)的所有有益方式和濫用我們技術(shù)的所有方式”。

AI狂飆下的監(jiān)管難題

在科技領(lǐng)域顛覆式創(chuàng)新不斷涌現(xiàn)的情況下,如何實(shí)現(xiàn)擁抱技術(shù)進(jìn)步和確保社會(huì)安全的平衡,越來(lái)越受到各界關(guān)注。

OpenAI表示,將與世界各地的政策制定者、教育工作者和藝術(shù)家合作,了解他們的擔(dān)憂,確定Sora的積極使用案例,并認(rèn)為從現(xiàn)實(shí)世界的使用中學(xué)習(xí)是創(chuàng)建和發(fā)布越來(lái)越安全的人工智能系統(tǒng)的關(guān)鍵組成部分。

業(yè)內(nèi)人士指出,在當(dāng)下治理框架、管控措施都未跟上的情況下,僅靠企業(yè)恐無(wú)法提供社會(huì)所需的人工智能安全性和信任度。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部辛國(guó)斌:2023年全國(guó)行政村通5G覆蓋超過(guò)80%
精彩專題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像