本文根據(jù)IDC中國研究總監(jiān)盧言霞的演講內容整理,有刪減:
生成式AI開啟市場新篇章
IDC認為,ChatGPT、生成式AI都是基于大模型的應用之一。在過往研究人工智能的時候,我們認為機器學習是最核心的層次,但在當前三大人工智能熱點的背景下,未來人工智能的應用可能是基于大模型的應用,這是IDC對于大模型和生成式AI以及ChatGPT之間簡單的辨析關系。
大模型在國內從2021年開始走向市場,但因為落地、整體解決方案、成本、技術成熟度等多方面的原因,并沒有在市場廣泛推廣,只有在最近才走進大眾的視野。目前市場對于超大模型的看法,如廠商宣傳中常提到千億級、萬億級參數(shù)為大模型、超大模型,實際在產(chǎn)業(yè)落地階段,超級預訓練大模型主要具備以下特征:(1)預訓練模型學習過海量數(shù)據(jù);(2)用戶端模型二次開發(fā)僅需少量數(shù)據(jù);(3)相比上一代的算法模型有更高的預測準確度。
IDC認為,目前行業(yè)用戶可能選擇建設的大模型主要有三個要點:一是當前的預訓練模型學習了多少數(shù)據(jù),在海量數(shù)據(jù)中包含多少實際應用的核心領域、垂直領域的數(shù)據(jù);二是遷移學習的效果如何,是不是真的比往年部署的AI應用準確率有所提高;三是部署的整體成本如何,并不是所有大模型參數(shù)都參與訓練,單體模型的參數(shù)會全部參與訓練,稀疏模型中只有部分參數(shù)參與運算。
大模型的價值體現(xiàn)在以下三點:一是開發(fā)門檻降低,用戶可以在AI原子能力的基礎上實現(xiàn)自定義模型,無需關注模型細節(jié);二是計算資源的降低,預訓練由廠商提供,用戶側只需進行小數(shù)據(jù)量的再訓練;三是預測效果的提升,研究與實踐均表明,使用大模型的效果比之前的模型效果相比,均有不同程度的提升。
當前越來越多的大模型創(chuàng)業(yè)公司涌現(xiàn),IDC認為未來在大模型應用方面仍存在一定的門檻:
一是需要海量的數(shù)據(jù)和算力資源,涉及到的投資成本較高;二是落地效果仍需時間,對于創(chuàng)業(yè)公司而言,選擇特定的垂直場景,或者與具備大型算力能力的廠商合作,從特定場景訓練自己的模型,有可能在短期內為自身帶來規(guī)?;纳虡I(yè)應用,存在持續(xù)發(fā)展的可能性。
人工智能另一個熱點是AIGC,IDC將其分為三大類:文生文、文生圖、文生視頻,典型的AIGC技術模型包括Open AI的ChatGPT-3、谷歌的PaLM和LaMDA等。
從文生文的角度而言,AIGC有落地場景的可能是數(shù)字人,最近國內市場開放的文生文應用越來越多,目前總結起來主要集中在幾個方面:一是對話式功能,二是支持搜索和營銷的場景。
從文生圖的角度而言,無論是國內還是全球的文生圖的能力,目前仍有待提升。2022年斯坦福大學發(fā)布的人工智能指數(shù)報告中提到,大模型的準確率僅有25%。目前文生圖的應用主要是在文娛和游戲場景中,包括影視渲染、美術設計。而在具體的工業(yè)環(huán)境中,目前還沒有應用場景能落地。
從文生視頻的角度而言,目前還主要還是在大模型廠商發(fā)展路線的規(guī)劃中,真正能夠基于AI生成視頻的應用還比較少。
(圖片來源IDC)
生成式AI應用及挑戰(zhàn)
目前生成式AI企業(yè)應用案例主要有以下幾類:
(1)知識管理類應用,如OpenAI與美國跨國投資管理和金融服務的應用,對財富管理內容的培訓進行微調,以便金融顧問能夠搜索公司中的現(xiàn)有知識,并為客戶輕松創(chuàng)建定制內容等;
(2)銷售和營銷應用,如微軟的Viva sales主要是幫助賣家更有效地與潛在客戶和顧客溝通。將為各種場景生成建議的電子郵件內容,如回復詢問或創(chuàng)建提案,并附上與收件人具體相關數(shù)據(jù),如定價、促銷和截止日期,通過氪定制內容的自動建議,賣家可以花更少的時間編寫電子郵件和從同事或數(shù)據(jù)庫中搜索銷售數(shù)據(jù);
(3)代碼生成應用,如OpenAI GPT-3的Codex程序,目前主要專門為代碼生成而訓練,可以產(chǎn)生各種不同語音的代碼;
(4)特定行業(yè)用例,如醫(yī)療領域,生成式AI一方面可以改善醫(yī)生的工作流程,方便醫(yī)生等審查醫(yī)療記錄,并在護理點提供與病人和治療醫(yī)生相關的簡明總結,另一方面可以通過使用生成式人工智能來設計蛋白質或設計新抗體等。
(圖片來源IDC)
在生成式AI令人振奮的表現(xiàn)下,也隱藏著許多落地的挑戰(zhàn):
(1)人才&技能缺乏,例如prompt工程師;
(2)準確度不足,不準確可能導致其編造謊言,它們可以炮制令人信服的陰謀論,可能造成巨大的傷害或傳播迷信信息;
(3)版權不清,AI生成的內容侵犯版權,衍生作品可能會產(chǎn)生侵權后果,使用受版權保護的生成數(shù)據(jù)可能違規(guī);
(4)誤導,任何情況下可能產(chǎn)生誤導、有害或無用的內容。
(5)數(shù)據(jù)安全與隱私,生成式AI可能會增加身份盜竊、欺詐和造假;
(6)造成偏見,可能包括在線社區(qū)內的性別歧視、種族主義或能力歧視。
未來AI市場展望
未來所有的AI應用場景將采用大模型的AI進行升級,基于開源的商業(yè)模型,引入行業(yè)特定領域的ISV解決方案,對模型進行專門的訓練,甚至一些場景可以直接部署到用戶的業(yè)務當中。
從這個角度而言,未來市場格局將有以下變動:上游以具備大模型的廠商為主,中間層可能培育基于AI的行業(yè)解決方案廠商。在這個背景下,2023年有望成為AI領域最令人振奮的一年。
(圖片來源IDC)
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內的諸多行業(yè)領域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…