近日,以“共創(chuàng)產業(yè)智能新高度”為主題的多模態(tài)人工智能產業(yè)聯(lián)合體第二次會議在武漢召開,會上發(fā)布了由中國科學院自動化研究所、武漢人工智能研究院、華為技術有限公司牽頭的《多模態(tài)基礎大模型技術白皮書》。
“當前,人工智能正從單模態(tài)、有監(jiān)督學習,邁向多模態(tài)、自監(jiān)督學習的時代。”中國科學院自動化研究所研究員、武漢人工智能研究院院長王金橋表示,“多模態(tài)人工智能的未來必將風光無限。”
對數(shù)據(jù)標注的依賴性降低了一個數(shù)量級以上
要了解多模態(tài)人工智能,首先需要明白何為模態(tài),“一般來說,每一種信息的來源或者形式,都可以稱為一種模態(tài)。”王金橋說。
人類在信息獲取、環(huán)境感知、知識學習與表達等方面都是采用多模態(tài)的輸入、輸出方式。比如,如果一個人要在一片草坪上找到一朵盛開的花朵,既可以通過視覺這一模態(tài)來尋找,也就是直接用眼睛看;也可以通過嗅覺這一模態(tài)來搜索,也就是用鼻子聞;還可以通過觸覺這一模態(tài)來探尋,也就是用手觸摸。面對尋找花朵這個問題,一般來說,人們會采取視覺、嗅覺等多模態(tài)的方式來進行。“某種程度上說,多模態(tài)的輸入、輸出方式正是人類智慧的重要體現(xiàn)之一。”王金橋表示。
目前的網(wǎng)絡數(shù)據(jù)包括圖像、視頻、文字、音頻等不同模態(tài)。對于人工智能來說,要想更好地掌握、分析、利用網(wǎng)絡上的數(shù)據(jù),就需要能夠對這些多模態(tài)的數(shù)據(jù)進行系統(tǒng)的統(tǒng)籌和分析。
王金橋表示:“技術創(chuàng)新是推動多模態(tài)人工智能產業(yè)發(fā)展的重要動力之一。自20世紀70年代多模態(tài)學習起步以來,伴隨著近年來生成式預訓練、基于Transformer的雙向編碼器表達等大規(guī)模預訓練模型的快速涌現(xiàn),人工智能研究領域正在經歷一場有監(jiān)督學習向無監(jiān)督學習條件下‘大數(shù)據(jù)+大模型’的大規(guī)模預訓練范式轉變,多模態(tài)人工智能發(fā)展迎來了新的巔峰。”
近年來,多模態(tài)人工智能在場景泛化性、對數(shù)據(jù)的依賴性等方面都取得了巨大的技術突破。
“多模態(tài)人工智能通過自監(jiān)督的學習方式對海量無標注數(shù)據(jù)進行學習,同時面向特定任務場景進行小數(shù)據(jù)的標注學習和微調。相對于單模態(tài)人工智能,其對數(shù)據(jù)標注的依賴性降低了一個數(shù)量級以上。”王金橋說。
“多模態(tài)大模型+小模型”模式或成主流
2017年,國務院制發(fā)《新一代人工智能發(fā)展規(guī)劃》,由人工智能技術引發(fā)的產業(yè)變革正在加速演進。目前,各行各業(yè)利用人工智能技術打造的產業(yè)新應用、新業(yè)態(tài)、新模式不斷涌現(xiàn),我國的人工智能產業(yè)化勢頭迅猛,多模態(tài)人工智能產業(yè)也取得了許多突破。
如今,多模態(tài)人工智能產業(yè)正大步走向場景化、實用化。“目前,模型參數(shù)與數(shù)據(jù)規(guī)模不再是各研發(fā)機構的比拼重點,多模態(tài)人工智能產業(yè)正在走向場景應用的新階段。”王金橋表示。
“例如,‘全媒體多模態(tài)大模型’就是基于中國科學院自動化研究所‘聞海’多模態(tài)媒體大數(shù)據(jù)和‘紫東太初’三模態(tài)大模型的技術積累,結合新華社全媒體的海量數(shù)據(jù)積累和媒體融合業(yè)務場景而建立的。‘全媒體多模態(tài)大模型’將加速推動人工智能在視頻配音、語音播報、標題摘要、海報創(chuàng)作等多元媒體業(yè)務場景的應用。”王金橋說。
此外,在智慧城市、金融科技、民生服務等許多領域,多模態(tài)人工智能也有著廣闊的應用場景。
王金橋表示,未來“多模態(tài)大模型+小模型”的模式或將成為多模態(tài)人工智能的主流,該模式可以有效解決需求碎片化、多樣化等問題。
王金橋表示,我國應該打造工業(yè)化范式的多模態(tài)大模型生態(tài),持續(xù)完善國產基礎軟硬件支撐體系,加大人工智能與醫(yī)學、材料、氣候等科學研究領域的結合力度,健全人工智能產業(yè)應用政策標準,大力培養(yǎng)人工智能復合型人才。(實習記者 李詔宇)
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內的諸多行業(yè)領域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產品創(chuàng)新及客戶服務之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產業(yè)大會暨品牌盛會,在深…