本文根據(jù)IDC中國研究總監(jiān)盧言霞的演講內(nèi)容整理,有刪減:
生成式AI開啟市場新篇章
IDC認(rèn)為,ChatGPT、生成式AI都是基于大模型的應(yīng)用之一。在過往研究人工智能的時候,我們認(rèn)為機(jī)器學(xué)習(xí)是最核心的層次,但在當(dāng)前三大人工智能熱點(diǎn)的背景下,未來人工智能的應(yīng)用可能是基于大模型的應(yīng)用,這是IDC對于大模型和生成式AI以及ChatGPT之間簡單的辨析關(guān)系。
大模型在國內(nèi)從2021年開始走向市場,但因?yàn)槁涞?、整體解決方案、成本、技術(shù)成熟度等多方面的原因,并沒有在市場廣泛推廣,只有在最近才走進(jìn)大眾的視野。目前市場對于超大模型的看法,如廠商宣傳中常提到千億級、萬億級參數(shù)為大模型、超大模型,實(shí)際在產(chǎn)業(yè)落地階段,超級預(yù)訓(xùn)練大模型主要具備以下特征:(1)預(yù)訓(xùn)練模型學(xué)習(xí)過海量數(shù)據(jù);(2)用戶端模型二次開發(fā)僅需少量數(shù)據(jù);(3)相比上一代的算法模型有更高的預(yù)測準(zhǔn)確度。
IDC認(rèn)為,目前行業(yè)用戶可能選擇建設(shè)的大模型主要有三個要點(diǎn):一是當(dāng)前的預(yù)訓(xùn)練模型學(xué)習(xí)了多少數(shù)據(jù),在海量數(shù)據(jù)中包含多少實(shí)際應(yīng)用的核心領(lǐng)域、垂直領(lǐng)域的數(shù)據(jù);二是遷移學(xué)習(xí)的效果如何,是不是真的比往年部署的AI應(yīng)用準(zhǔn)確率有所提高;三是部署的整體成本如何,并不是所有大模型參數(shù)都參與訓(xùn)練,單體模型的參數(shù)會全部參與訓(xùn)練,稀疏模型中只有部分參數(shù)參與運(yùn)算。
大模型的價值體現(xiàn)在以下三點(diǎn):一是開發(fā)門檻降低,用戶可以在AI原子能力的基礎(chǔ)上實(shí)現(xiàn)自定義模型,無需關(guān)注模型細(xì)節(jié);二是計(jì)算資源的降低,預(yù)訓(xùn)練由廠商提供,用戶側(cè)只需進(jìn)行小數(shù)據(jù)量的再訓(xùn)練;三是預(yù)測效果的提升,研究與實(shí)踐均表明,使用大模型的效果比之前的模型效果相比,均有不同程度的提升。
當(dāng)前越來越多的大模型創(chuàng)業(yè)公司涌現(xiàn),IDC認(rèn)為未來在大模型應(yīng)用方面仍存在一定的門檻:
一是需要海量的數(shù)據(jù)和算力資源,涉及到的投資成本較高;二是落地效果仍需時間,對于創(chuàng)業(yè)公司而言,選擇特定的垂直場景,或者與具備大型算力能力的廠商合作,從特定場景訓(xùn)練自己的模型,有可能在短期內(nèi)為自身帶來規(guī)?;纳虡I(yè)應(yīng)用,存在持續(xù)發(fā)展的可能性。
人工智能另一個熱點(diǎn)是AIGC,IDC將其分為三大類:文生文、文生圖、文生視頻,典型的AIGC技術(shù)模型包括Open AI的ChatGPT-3、谷歌的PaLM和LaMDA等。
從文生文的角度而言,AIGC有落地場景的可能是數(shù)字人,最近國內(nèi)市場開放的文生文應(yīng)用越來越多,目前總結(jié)起來主要集中在幾個方面:一是對話式功能,二是支持搜索和營銷的場景。
從文生圖的角度而言,無論是國內(nèi)還是全球的文生圖的能力,目前仍有待提升。2022年斯坦福大學(xué)發(fā)布的人工智能指數(shù)報告中提到,大模型的準(zhǔn)確率僅有25%。目前文生圖的應(yīng)用主要是在文娛和游戲場景中,包括影視渲染、美術(shù)設(shè)計(jì)。而在具體的工業(yè)環(huán)境中,目前還沒有應(yīng)用場景能落地。
從文生視頻的角度而言,目前還主要還是在大模型廠商發(fā)展路線的規(guī)劃中,真正能夠基于AI生成視頻的應(yīng)用還比較少。
(圖片來源IDC)
生成式AI應(yīng)用及挑戰(zhàn)
目前生成式AI企業(yè)應(yīng)用案例主要有以下幾類:
(1)知識管理類應(yīng)用,如OpenAI與美國跨國投資管理和金融服務(wù)的應(yīng)用,對財(cái)富管理內(nèi)容的培訓(xùn)進(jìn)行微調(diào),以便金融顧問能夠搜索公司中的現(xiàn)有知識,并為客戶輕松創(chuàng)建定制內(nèi)容等;
(2)銷售和營銷應(yīng)用,如微軟的Viva sales主要是幫助賣家更有效地與潛在客戶和顧客溝通。將為各種場景生成建議的電子郵件內(nèi)容,如回復(fù)詢問或創(chuàng)建提案,并附上與收件人具體相關(guān)數(shù)據(jù),如定價、促銷和截止日期,通過氪定制內(nèi)容的自動建議,賣家可以花更少的時間編寫電子郵件和從同事或數(shù)據(jù)庫中搜索銷售數(shù)據(jù);
(3)代碼生成應(yīng)用,如OpenAI GPT-3的Codex程序,目前主要專門為代碼生成而訓(xùn)練,可以產(chǎn)生各種不同語音的代碼;
(4)特定行業(yè)用例,如醫(yī)療領(lǐng)域,生成式AI一方面可以改善醫(yī)生的工作流程,方便醫(yī)生等審查醫(yī)療記錄,并在護(hù)理點(diǎn)提供與病人和治療醫(yī)生相關(guān)的簡明總結(jié),另一方面可以通過使用生成式人工智能來設(shè)計(jì)蛋白質(zhì)或設(shè)計(jì)新抗體等。
(圖片來源IDC)
在生成式AI令人振奮的表現(xiàn)下,也隱藏著許多落地的挑戰(zhàn):
(1)人才&技能缺乏,例如prompt工程師;
(2)準(zhǔn)確度不足,不準(zhǔn)確可能導(dǎo)致其編造謊言,它們可以炮制令人信服的陰謀論,可能造成巨大的傷害或傳播迷信信息;
(3)版權(quán)不清,AI生成的內(nèi)容侵犯版權(quán),衍生作品可能會產(chǎn)生侵權(quán)后果,使用受版權(quán)保護(hù)的生成數(shù)據(jù)可能違規(guī);
(4)誤導(dǎo),任何情況下可能產(chǎn)生誤導(dǎo)、有害或無用的內(nèi)容。
(5)數(shù)據(jù)安全與隱私,生成式AI可能會增加身份盜竊、欺詐和造假;
(6)造成偏見,可能包括在線社區(qū)內(nèi)的性別歧視、種族主義或能力歧視。
未來AI市場展望
未來所有的AI應(yīng)用場景將采用大模型的AI進(jìn)行升級,基于開源的商業(yè)模型,引入行業(yè)特定領(lǐng)域的ISV解決方案,對模型進(jìn)行專門的訓(xùn)練,甚至一些場景可以直接部署到用戶的業(yè)務(wù)當(dāng)中。
從這個角度而言,未來市場格局將有以下變動:上游以具備大模型的廠商為主,中間層可能培育基于AI的行業(yè)解決方案廠商。在這個背景下,2023年有望成為AI領(lǐng)域最令人振奮的一年。
(圖片來源IDC)
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…