近幾個月來,人工智能文本-圖像生成器一直是頭條新聞,但研究人員已經(jīng)在向下一個前沿領(lǐng)域邁進。人工智能文本到視頻生成器。
來自Facebook母公司Meta的一個機器學(xué)習(xí)工程師團隊公布了一個名為Make-A-Video的新系統(tǒng)。顧名思義,這個人工智能模型允許用戶鍵入一個場景的粗略描述,它將生成一個與他們的文字相匹配的短視頻。這些視頻顯然是人造的,主體模糊,動畫扭曲,但仍然代表了人工智能內(nèi)容生成領(lǐng)域的一個重大發(fā)展。
該模型的輸出顯然是人工的,但仍然令人印象深刻
"梅塔在宣布這項工作的博文中說:"生成性人工智能研究正在推動創(chuàng)造性表達,為人們提供了快速和輕松創(chuàng)造新內(nèi)容的工具。"只需幾個字或幾行文字,Make-A-Video就能將想象力帶入生活,創(chuàng)造出充滿生動色彩和風(fēng)景的獨一無二的視頻。"
在Facebook的一篇文章中,Meta首席執(zhí)行官馬克-扎克伯格將這項工作描述為 "驚人的進步",并補充說。"生成視頻比生成照片難得多,因為除了正確生成每個像素,系統(tǒng)還必須預(yù)測它們將如何隨時間變化。
這些片段不超過5秒,不包含音頻,但跨越了巨大的提示范圍。判斷該模型性能的最好方法是觀看其輸出。下面的每段視頻都是由Make-A-Video生成的,并標(biāo)明了用于生成視頻的提示。然而,值得注意的是,每個視頻都是由Meta公司提供給The Verge的,該公司目前不允許任何人訪問該模型。這意味著這些片段可能被挑選出來,以展示該系統(tǒng)的最佳狀態(tài)。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風(fēng)飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…