圖像生成模型 —— 生成式 AI 的常用子集 —— 可以解析并理解書面語言,然后將文字轉(zhuǎn)換為幾乎任何風格的圖像。
Black Forest Labs 的一系列新模型代表了圖像生成領(lǐng)域的前沿技術(shù) —— 現(xiàn)在可在 PC 和工作站上試用 —— 在 GeForce RTX 和 NVIDIA RTX GPU 上的運行速度最快。
流暢的功能
FLUX.1 AI 是由 Black Forest Labs 開發(fā)的文本生成圖像模型套件。這些模型基于 Diffusion Transformer(DiT)體系架構(gòu)而構(gòu)建,以便大參數(shù)量的模型保持高效運行。Flux 模型在擁有 120 億個參數(shù)的模型上進行訓(xùn)練,以生成高質(zhì)量圖像。
DiT 模型屬于高效的計算密集型模型 —— NVIDIA RTX GPU 對于處理這些新模型至關(guān)重要,其中最大規(guī)模的模型如果不進行重大調(diào)整,將無法在非 RTX GPU 上運行。Flux 模型現(xiàn)在支持 NVIDIA TensorRT 軟件開發(fā)套件,該套件可將這些模型的性能提升高達 20%。用戶可以在 ComfyUI 中借助 TensorRT 試用 Flux 和其他模型。
提示:“一張雜志照片:在暴風雪中,一只猴子在溫泉中沐浴,水面上飄著蒸汽。”
此圖片由 FLUX.1 生成。來源:NVIDIA
Flux 的優(yōu)勢
FLUX.1 在生成高質(zhì)量、多樣化的圖像方面表現(xiàn)卓越,其出色的指令遵循性意味著 AI 能夠準確理解并執(zhí)行指令。提示依從性較高,意味著生成的圖像與文本提示描述的元素、風格和情緒高度匹配。提示依從性較低會導(dǎo)致圖像可能部分或完全偏離給定的指令。
FLUX.1 以能夠精確渲染人體解剖結(jié)構(gòu)(包括手部和人臉等具有挑戰(zhàn)性的復(fù)雜特征)而著稱。FLUX.1 還顯著改進了在圖像中生成易讀文本的過程,解決了文本轉(zhuǎn)圖像模型的另一個常見挑戰(zhàn)。這使得 FLUX.1 模型非常適合需要精確文本表示的應(yīng)用,例如宣傳材料和書籍封面。
FLUX.AI 具有三種變體,可為用戶提供最適合其工作流的選擇,而不會犧牲質(zhì)量:
FLUX.1 pro:為企業(yè)用戶提供最高質(zhì)量的模型;可通過應(yīng)用編程接口訪問。
FLUX.1 dev:FLUX.1 pro 的免費精華版本,仍然具有較高質(zhì)量。
FLUX.1 schnell:運行速度最快的模型,非常適合本地開發(fā)和個人使用;具有寬松的 Apache 2.0 許可證。
dev 和 schnell 模型為開源版本,Black Forest Labs 在流行平臺 Hugging Face 上提供對其關(guān)鍵功能的訪問。這一做法得到社區(qū)廣泛認可。
得到社區(qū)廣泛認可
自發(fā)布以來,F(xiàn)lux 模型的 dev 和 schnell 變體已在 Hugging Face 上被下載 200 多萬次。
FLUX.1 的強大功能受到用戶廣泛贊譽,稱其能夠生成具有非凡細節(jié)和逼真度、視覺效果令人驚艷的圖像,并且可以處理復(fù)雜的提示,而無需調(diào)整大量參數(shù)。
提示:“一張細節(jié)豐富的專業(yè)特寫照片:一只變形孟加拉虎身穿白色無袖背心,戴著太陽鏡,脖子上掛著耳機,爪子放在舞臺上的唱盤上,在伊比沙島晚間的戶外電子舞曲音樂會上擔任 DJ;派對氣氛,少量煙霧與焦散光照。”
此圖片由 FLUX.1 生成。來源:NVIDIA
提示:“一張攝影品質(zhì)圖像:雨夜,繁華的城市街道上,一輛黃色出租車停在路邊,前燈亮著,照射在潮濕路面上。一位身著紅色外套的女性撐著一把亮綠色雨傘,看著她的智能手機。左側(cè)有一家咖啡店,霓虹燈標志牌上面顯示著藍色字母‘Café Mocha’??Х鹊暄b著大窗戶,從中可以看到人們在享受飲料。路燈照亮了該區(qū)域,在整個場景上投射出溫暖的光芒,而雨滴在空中產(chǎn)生了霧霾效果。背景中,一座高樓上的大型數(shù)字時鐘顯示時間為下午 8 點 45 分。”
此圖片由 FLUX.1 生成。來源:NVIDIA
此外,F(xiàn)LUX.1 還善于處理各種藝術(shù)風格,并能夠快速高效地生成圖像,因此是完成個人和專業(yè)項目不可或缺的重要工具。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…