瘋了！Meta的AI可以根據(jù)語(yǔ)音指令生成視頻

2022-10-03 15:32

來(lái)自Facebook母公司Meta的一個(gè)機(jī)器學(xué)習(xí)工程師團(tuán)隊(duì)公布了一個(gè)名為Make-A-Video的新系統(tǒng)。顧名思義，這個(gè)人工智能模型允許用戶(hù)鍵入一個(gè)場(chǎng)景的粗略描述，它將生成一個(gè)與他們的文字相匹配的短視頻。這些視頻顯然是人造的，主體模糊，動(dòng)畫(huà)扭曲，但仍然代表了人工智能內(nèi)容生成領(lǐng)域的一個(gè)重大發(fā)展。

近幾個(gè)月來(lái)，人工智能文本-圖像生成器一直是頭條新聞，但研究人員已經(jīng)在向下一個(gè)前沿領(lǐng)域邁進(jìn)。人工智能文本到視頻生成器。

該模型的輸出顯然是人工的，但仍然令人印象深刻

"梅塔在宣布這項(xiàng)工作的博文中說(shuō)："生成性人工智能研究正在推動(dòng)創(chuàng)造性表達(dá)，為人們提供了快速和輕松創(chuàng)造新內(nèi)容的工具。"只需幾個(gè)字或幾行文字，Make-A-Video就能將想象力帶入生活，創(chuàng)造出充滿(mǎn)生動(dòng)色彩和風(fēng)景的獨(dú)一無(wú)二的視頻。"

在Facebook的一篇文章中，Meta首席執(zhí)行官馬克-扎克伯格將這項(xiàng)工作描述為 "驚人的進(jìn)步"，并補(bǔ)充說(shuō)。"生成視頻比生成照片難得多，因?yàn)槌苏_生成每個(gè)像素，系統(tǒng)還必須預(yù)測(cè)它們將如何隨時(shí)間變化。

這些片段不超過(guò)5秒，不包含音頻，但跨越了巨大的提示范圍。判斷該模型性能的最好方法是觀看其輸出。下面的每段視頻都是由Make-A-Video生成的，并標(biāo)明了用于生成視頻的提示。然而，值得注意的是，每個(gè)視頻都是由Meta公司提供給The Verge的，該公司目前不允許任何人訪問(wèn)該模型。這意味著這些片段可能被挑選出來(lái)，以展示該系統(tǒng)的最佳狀態(tài)。

THE END

責(zé)任編輯：李斌

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請(qǐng)聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請(qǐng)諒解！

相關(guān)閱讀

展會(huì)預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，海康威視發(fā)布文搜存儲(chǔ)系列產(chǎn)品
近日，海康威視基于觀瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺(jué)AI SoC芯片A1
誤報(bào)率降低90%以上！?？低暟l(fā)布視覺(jué)大模型周界攝像機(jī)
更準(zhǔn)！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺(jué)AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲(chǔ)系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》（以下簡(jiǎn)稱(chēng)“報(bào)告”），該報(bào)告…
數(shù)字化浪潮下，安防廠商如何滿(mǎn)足行業(yè)客戶(hù)的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來(lái)自市場(chǎng) “不確定性”因素的沖擊，市場(chǎng)…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶(hù)服務(wù)之舟，在市場(chǎng)變革中逆風(fēng)飛揚(yáng)

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì)，在深…

企業(yè)

來(lái)自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護(hù)航夏季達(dá)沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預(yù)案中針對(duì)特定突發(fā)情況的模擬處置演練…
應(yīng)用安全再升級(jí)！ Imperva Application Security平臺(tái)集成新功能
來(lái)自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護(hù)航夏季達(dá)沃斯論壇
熵基科技：用非侵入式腦機(jī)接口，重塑教育、醫(yī)療與養(yǎng)老的未來(lái)
華為開(kāi)發(fā)者大會(huì)2025官宣“鴻蒙智選”小豚當(dāng)家成為首批合作伙伴
深耕垂直物聯(lián)場(chǎng)景，螢石藍(lán)海大模型2.0 升級(jí)引領(lǐng)行業(yè)再躍遷

瘋了！Meta的AI可以根據(jù)語(yǔ)音指令生成視頻

瘋了！Meta的AI可以根據(jù)語(yǔ)音指令生成視頻