跨境電商品牌SHEIN的爆火,把“小單快返”模式帶入大眾視野:商家先小批量生產(chǎn)多種款式的產(chǎn)品投放市場(chǎng),根據(jù)初步銷售數(shù)據(jù)反饋,對(duì)賣得好的產(chǎn)品快速反單,”試”出爆款,減輕庫(kù)存壓力。
該模式衍生出賣家對(duì)大量產(chǎn)品圖的需求。面對(duì)高達(dá)幾千的SKU(存貨單位,可理解為單品種類),給每件衣服都找模特、拍照、修圖將面臨巨大的工作量和時(shí)間成本,這顯然違背了“小單快返”的初心。
一家初創(chuàng)公司ZMO.AI從中看到了商機(jī)。
ZMO將時(shí)下大火的AI生成圖像技術(shù)應(yīng)用在電商場(chǎng)景。賣家只需提交產(chǎn)品圖,并挑選適合的模特,稍加調(diào)整后,就可得到模特穿著自家服飾的展示圖,還可以通過這些圖片為不同人群調(diào)整服裝版型、顏色。
由于商家在上架之前不確定哪款賣得好,可能把上千款衣服全部做產(chǎn)品圖展示。“大力出奇跡。”ZMO創(chuàng)始人張?jiān)姮撔ΨQ。
ZMO成立于2020年,今年5月獲得了800萬美元的A輪融資,由高瓴資本領(lǐng)投,GGV紀(jì)源資本和金沙江創(chuàng)投跟投。公司核心團(tuán)隊(duì)成員來自谷歌、蘋果、Facebook、商湯、Adobe、騰訊等國(guó)內(nèi)外互聯(lián)網(wǎng)企業(yè)。
創(chuàng)始人張?jiān)姮撟鲇布錾?,畢業(yè)后在蘋果做第一代AirPods的系統(tǒng)架構(gòu),后來又到谷歌做AR眼鏡。她給自己的定位是“技術(shù)+產(chǎn)品”。
2020年,疫情催熱了線上消費(fèi)需求,張?jiān)姮撚^察生成算法在Google Shopping上的應(yīng)用時(shí)發(fā)現(xiàn),線上商鋪對(duì)內(nèi)容有需求,在無實(shí)物的情況下,精致的產(chǎn)品圖能夠吸引來消費(fèi)者。這也是ZMO選擇從電商場(chǎng)景切入的原因。
ZMO決定從海外起步,其平臺(tái)名為imgcreator,除去AI生成模特展示圖之外,還有文字生成圖片的AI Image Generator、消除圖片元素的Remover.App、類似文字版Photoshop的AI Image Editor等功能。近期ZMO.AI發(fā)布了中文版,微信小程序“YUAN初”。
積攢人氣靠C端,賺錢靠B端
近一年,文字生成圖像產(chǎn)品百花齊放。Disco Diffusion、Midjourney、Stable Diffusion等如雨后春筍般冒出。谷歌、Meta、微軟等科技公司也推出了Imagen、Parti、Make-A-Scene、NUWA-Infinity等同類產(chǎn)品,但大多尚未向公眾開放。
這其中受關(guān)注較高的當(dāng)屬Stable Diffusion,因其代碼和權(quán)重已公開發(fā)布,可以在大多數(shù)消費(fèi)級(jí)GPU上運(yùn)行。Stable Diffusion由慕尼黑大學(xué)和Runway的研究者共同開發(fā),項(xiàng)目初期還獲得過Stability.Ai的算力支持。后者剛剛籌得1.01億美元融資,公司估值達(dá)10億美元。
和Stable Diffusion不同,Midjourney的特別之處則在于運(yùn)營(yíng)模式。這是一個(gè)AI繪畫聊天機(jī)器人,搭載了聊天工具Discord。用戶在對(duì)話框描述自己想象中的畫面,機(jī)器人就會(huì)發(fā)回一張圖片。人們甚至可以在公共聊天服務(wù)器看到其他人的創(chuàng)作過程,其聊天社區(qū)有數(shù)百萬人,用戶之間的互動(dòng)還能夠催生創(chuàng)作欲和靈感。
張?jiān)姮撎岬剑煌a(chǎn)品使用的技術(shù)有所差別,即便是基于相同的底層框架,搭建模型不同、訓(xùn)練數(shù)據(jù)不同、用戶使用習(xí)慣不同,所產(chǎn)出的圖片也各有千秋,平臺(tái)會(huì)根據(jù)自己的風(fēng)格和場(chǎng)景去調(diào)整算法。以Midjourney為例,它的圖片風(fēng)格偏藝術(shù)繪畫,更夢(mèng)幻。而ZMO本身從電商場(chǎng)景切入,主攻真實(shí)照片高清大圖、3D以及插畫風(fēng)格。
圖片來源:YUAN初
但張?jiān)姮搹?qiáng)調(diào),電商只是ZMO最初探索的領(lǐng)域,是用于數(shù)據(jù)積累的初級(jí)階段。看起來,ZMO的野心是做一個(gè)更廣泛的內(nèi)容創(chuàng)作平臺(tái),包括打造社區(qū)。目前很多ZMO的用戶是“自來水”(免費(fèi)、自發(fā)宣傳某項(xiàng)活動(dòng)的群體),關(guān)注了公司的社交賬號(hào),也會(huì)主動(dòng)分享自己的作品。
盡管在C端(用戶端)受到不少肯定,但現(xiàn)階段ZMO的收入還是更依賴B端客戶(企業(yè)用戶)。
不同于個(gè)人用戶為了滿足探索欲而使用AI生成圖片,B端用戶需要的是實(shí)打?qū)嵉纳a(chǎn)力工具,也更愿意付出真金白銀。目前企業(yè)端用戶主要是出海電商廠家,他們對(duì)內(nèi)容有批量、精細(xì)化的需求。
ZMO對(duì)B端和C端用戶都采用會(huì)員費(fèi)的收費(fèi)方式,只是在B端電商模式下,公司和亞馬遜、Shopify等平臺(tái)會(huì)合作,將網(wǎng)站接入商家后臺(tái)。張?jiān)姮撏嘎叮壳癦MO用戶中有70%是C端用戶,30%是B端用戶,80%-90%的客戶來自海外。B端用戶雖然數(shù)量少,但貢獻(xiàn)收入更多,因其內(nèi)容生產(chǎn)規(guī)模和C端用戶不是一個(gè)量級(jí)。
不過,C端用戶中有一類比較突出的人群,即博主、大V等個(gè)人創(chuàng)作者。他們對(duì)圖片同樣有較高需求,愿意為AI繪畫、AI修圖等功能付費(fèi),有介于B端與C端之間的特質(zhì),屬于潛力客戶。
技術(shù)突破打開潘多拉魔盒
人工智能生成內(nèi)容(AIGC,Artificial Intelligence Generated Content)早已不是新鮮話題,但直到今年,相關(guān)技術(shù)的突破才讓AI繪畫真正爆火起來。
前幾年,這個(gè)領(lǐng)域應(yīng)用比較廣泛的技術(shù)是生成式對(duì)抗網(wǎng)絡(luò)(GAN,Generative Adversarial Network),還有OpenAI發(fā)布的GPT-3(Generative Pre-trained Transformer 3)模型和CLIP模型。
2022年,文字生成圖像產(chǎn)品多點(diǎn)爆發(fā),則是因?yàn)閿U(kuò)散模型(Diffusion model)在AI生成圖像領(lǐng)域發(fā)揮了作用,該模型能夠大大提高生成圖片的質(zhì)量。Stable Diffusion、DALL-E2等產(chǎn)品都運(yùn)用了擴(kuò)散模型。
ZMO算法團(tuán)隊(duì)負(fù)責(zé)人對(duì)界面新聞表示,雖然技術(shù)風(fēng)向偏向Diffusion,但目前大多平臺(tái)還是多個(gè)模型共存及合作,比如ZMO所使用的模型是Diffusion+CLIP/GPT3/Other Language Model+GAN(optional)。他認(rèn)為Diffusion在解決一些技術(shù)落地瓶頸后會(huì)更有潛力,上限更高。
技術(shù)的突破極大降低了AI生成圖像的專業(yè)門檻,創(chuàng)作者只需要輸入文字就可以得到相對(duì)專業(yè)的畫作,幾秒鐘的時(shí)間,可能會(huì)誕生意想不到的圖像,這給人類的想象力帶來無限可能。甚至可以說,AI吸收了各流派藝術(shù)家之所長(zhǎng)后,誕生了自己的藝術(shù)風(fēng)格。
AI作畫對(duì)技術(shù)、資金要求的降低,讓專業(yè)圖像的創(chuàng)作“民主化”,但同時(shí)有關(guān)版權(quán)、倫理之爭(zhēng)也隨之而來。
對(duì)于AI生成畫作的權(quán)屬問題,至今尚無定論,而藝術(shù)屆對(duì)版權(quán)極其敏感。當(dāng)訓(xùn)練AI使用的圖片來自網(wǎng)絡(luò)時(shí),任何人的作品都有可能被吸收、模仿,只能靠平臺(tái)自己劃分界限。
以ZMO為例,張?jiān)姮摳嬖V界面新聞,為了避免爭(zhēng)議,平臺(tái)訓(xùn)練模型所使用的畫家作品皆為已過世畫家。以中國(guó)《著作權(quán)法》來看,作者去世50年后,其作品不再受到著作權(quán)法的保護(hù),任何人都可以自由使用其作品,但作者的署名權(quán)、修改權(quán)和保護(hù)作品完整權(quán)永遠(yuǎn)受到保護(hù),即意味著使用其作品需要標(biāo)注作者。
對(duì)于AI只會(huì)模仿名家畫作、沒有自己風(fēng)格的爭(zhēng)議,張?jiān)姮撜J(rèn)為,人類學(xué)習(xí)繪畫的過程也同樣是模仿,而在使用AI創(chuàng)作的過程中,用戶通過調(diào)整權(quán)重,可以融合各種風(fēng)格的精髓,也是一種再創(chuàng)作,“我更愿意把AI當(dāng)成是一個(gè)人,從模仿到超越。”
但AI畢竟不是人,無法作出價(jià)值判斷,對(duì)創(chuàng)作者的指令照單全收,因此衍生了倫理問題,比如惡搞政治人物、生成種族歧視的圖片,還有早些年的AI換臉風(fēng)波。
《金融時(shí)報(bào)》在一篇對(duì)AIGC的報(bào)道中,引用了英國(guó)藝術(shù)家馬修斯通的一句話,稱人工智能生成圖像“既有民主的一面,也有壓迫的一面”,潘多拉魔盒一旦打開,惡意也有了可乘之機(jī)。
ZMO后臺(tái)就曾經(jīng)出現(xiàn)過執(zhí)著的用戶,輸入無數(shù)次敏感詞,變換各種表達(dá),希望生成被平臺(tái)禁止的圖片。目前行業(yè)內(nèi)還出現(xiàn)了一些做中間商賺差價(jià)的人,靠AI繪畫平臺(tái)制作圖片,然后轉(zhuǎn)手賣給圖片網(wǎng)站,已經(jīng)有國(guó)外圖片網(wǎng)站明確禁止了這種行為。
由于技術(shù)超前,尚無法律案例可以應(yīng)對(duì)這些爭(zhēng)議,各家平臺(tái)主要靠自己制定規(guī)則來約束用戶。在ZMO的數(shù)據(jù)清洗標(biāo)準(zhǔn)中,涉及政治、色情暴力、人身攻擊、種族歧視的內(nèi)容是被禁止的。
但這可能又會(huì)引發(fā)新的問題:平臺(tái)是否妨礙了創(chuàng)作者的自由?用戶可不可以只生成內(nèi)容而不傳播?關(guān)于AIGC,未來尚有無限可能。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》(以下簡(jiǎn)稱“報(bào)告”),該報(bào)告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場(chǎng) “不確定性”因素的沖擊,市場(chǎng)…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場(chǎng)變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì),在深…