Meta 公司發(fā)布人工智能系統(tǒng)：文字生成短視頻

2022-10-02 20:47

打造 Make-A-Video 的研究人員過濾掉了攻擊性的圖片和文字，但對于由數(shù)百萬和數(shù)以百萬計的文字和圖片組成的數(shù)據(jù)集，幾乎不可能完全刪除有偏見和有害的內(nèi)容。Meta 公司的一位發(fā)言人說，目前還沒有向公眾提供這個模型，“作為這項研究的一部分，我們將繼續(xù)探索進一步完善和減少潛在風險的方法”。

10 月 2 日消息，Meta 公司近日發(fā)布了一個人工智能系統(tǒng)，可以根據(jù)文字提示生成短視頻。

IT之家了解到，這個系統(tǒng)名為 Make-A-Video，允許用戶輸入一連串的詞語，比如“一只穿著超級英雄服裝、披著紅色斗篷在天空中飛翔的狗”，然后生成一個五秒鐘的短視頻。

雖然效果相當粗糙，但這個系統(tǒng)顯然要比文字轉(zhuǎn)圖片 AI 系統(tǒng)更高級。

上個月，人工智能實驗室 OpenAI 向所有人提供了其最新的文本轉(zhuǎn)圖像人工智能系統(tǒng) DALL-E，而人工智能初創(chuàng)公司 Stability.AI 則推出了 Stable Diffusion，這是一個開源的文本轉(zhuǎn)圖像系統(tǒng)。

但文本轉(zhuǎn)視頻 AI 系統(tǒng)伴隨著一些更大的挑戰(zhàn)。首先，這些模型需要大量的計算能力。它們比大型文本到圖像的人工智能模型的計算量還要大，后者使用數(shù)百萬張圖像進行訓練，因為僅僅拼湊一個短視頻就需要數(shù)百張圖像。這意味著在可預見的未來，只有大型科技公司才有能力建立這些系統(tǒng)。它們的訓練也比較棘手，因為沒有大規(guī)模的高質(zhì)量視頻與文本配對的數(shù)據(jù)集。

為了解決這個問題，Meta 結(jié)合了三個開源圖像和視頻數(shù)據(jù)集的數(shù)據(jù)來訓練其模型。標準的文本轉(zhuǎn)圖像數(shù)據(jù)集的標記靜態(tài)圖像幫助人工智能學習物體的名稱和它們的樣子。一個視頻數(shù)據(jù)庫幫助它學習這些物體應該如何在世界中移動。這兩種方法的結(jié)合幫助 Make-A-Video 能夠從文本中大規(guī)模地生成視頻。

Meta 公司稱，該技術(shù)可以“為創(chuàng)作者和藝術(shù)家?guī)硇碌臋C會”。但是，隨著技術(shù)的發(fā)展，人們擔心它可能被用作創(chuàng)造和傳播錯誤信息和深度偽造的有力工具，它可能會使人們更難區(qū)分網(wǎng)上的真實和虛假內(nèi)容。

打造 Make-A-Video 的研究人員過濾掉了攻擊性的圖片和文字，但對于由數(shù)百萬和數(shù)以百萬計的文字和圖片組成的數(shù)據(jù)集，幾乎不可能完全刪除有偏見和有害的內(nèi)容。

Meta 公司的一位發(fā)言人說，目前還沒有向公眾提供這個模型，“作為這項研究的一部分，我們將繼續(xù)探索進一步完善和減少潛在風險的方法”。

THE END

責任編輯：李斌

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關(guān)閱讀

展會預告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！海康威視發(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，海康威視發(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務之舟，在市場變革中逆風飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預案中針對特定突發(fā)情況的模擬處置演練…
應用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領行業(yè)再躍遷