AI視覺進入“大模型時代”不僅“看得見”還“看得懂”

2023-11-13 10:13 | 來源：廣州日報

近日，第十九屆中國國際社會公共安全博覽會(以下簡稱“CPSE安博會”)和全球數(shù)字城市產(chǎn)業(yè)博覽會在深圳會展中心落幕。在6萬平方米的數(shù)字城市產(chǎn)業(yè)展區(qū)中，隨處可見AI攝像頭和AI綜合數(shù)據(jù)分析圖，而行業(yè)大模型在展會上也出現(xiàn)得更多了。

AI視覺進入“大模型時代”不僅“看得見”還“看得懂”

智慧安防領(lǐng)域需求旺盛更強調(diào)個人隱私權(quán)保護

第十九屆中國國際社會公共安全博覽會現(xiàn)場。

智慧安防更注重隱私保護。

記者采訪了解到，AI大模型如今已成為“兵家必爭之地”，而安防行業(yè)則成為AI的“第一著陸點”，豐富的感知設(shè)備和數(shù)據(jù)維度，讓這一領(lǐng)域更加成為AI大模型等前沿技術(shù)的試驗田。而中國企業(yè)在智能安防領(lǐng)域的“領(lǐng)跑式發(fā)展”，也為安防產(chǎn)品“出海”奠定基礎(chǔ)，在AI技術(shù)的加持下，安防行業(yè)又迎來了一輪革新，將成為民眾更好的“隱形守護者”。

文、圖/廣州日報全媒體記者馮秋瑜

數(shù)字孿生、視覺分析：

智慧安防營造安全、舒適社區(qū)

記者在現(xiàn)場采訪發(fā)現(xiàn)，大到天地傳感，小到社區(qū)“最后一公里”，在新技術(shù)的助力下，我們所居住的城市正在加速向“智慧城市”轉(zhuǎn)變，計算機視覺(CV)作為人工智能領(lǐng)域最大的應(yīng)用領(lǐng)域，在人臉識別、視頻監(jiān)控、門禁卡、防盜報警等智慧安防領(lǐng)域率先實現(xiàn)了商業(yè)化。

“相比于傳統(tǒng)的社區(qū)管理模式，‘智慧社區(qū)’更加以人為本，以不斷滿足居民的幸福感和滿意度為核心，為居民提供更便捷、安全的社區(qū)環(huán)境，讓孩子茁壯成長，讓老人盡享天倫。”英特爾中國區(qū)物聯(lián)網(wǎng)及渠道數(shù)據(jù)中心事業(yè)部總經(jīng)理郭威告訴記者，之前的攝像頭只是“看得見”，而智能視頻分析系統(tǒng)可以“看得懂”。

據(jù)了解，智能視覺分析通過對采集社區(qū)中的人、車、公共設(shè)施等管理對象的視覺數(shù)據(jù)進行智慧化的數(shù)據(jù)洞察，實現(xiàn)“入侵”“攀高”“自行車/電動自行車違停”“亂丟垃圾”“高空拋物”“水域入侵”“占道堆物”等方面的識別需求，在事件發(fā)生后，系統(tǒng)能夠在3秒內(nèi)通過AI應(yīng)用對圖像進行識別并判斷該事件是否違規(guī)，并在5分鐘內(nèi)處置完成，從而營造更智能、安全、舒適的社區(qū)和公共環(huán)境。

“地面沉陷、暴雨成災(zāi)、交通擁堵等是城市發(fā)展中遇到的共性問題，利用時空大數(shù)據(jù)建設(shè)好基于數(shù)字孿生的智慧城市，可以推動城市升級發(fā)展。”中國科學(xué)院院士、中國工程院院士李德仁向記者介紹了基于天地傳感網(wǎng)的數(shù)字孿生技術(shù)在災(zāi)害智能管理方面的應(yīng)用：“今年5月21日，國際首顆遙感成像、氣象探測和水利應(yīng)用一體化衛(wèi)星‘珞珈二號’在酒泉衛(wèi)星發(fā)射中心發(fā)射，能滿足目標(biāo)識別級的遙感感知的高分辨率、視頻等多種探測需求。在今年夏天京津冀地區(qū)的防汛工作中，‘珞珈二號’觀測到堤防決口的影像，第一時間發(fā)布預(yù)警，幫6300余名群眾當(dāng)天完成轉(zhuǎn)移。”

動態(tài)監(jiān)測老人、賽事、施工

“AI視覺行為分析”實時告知

“攝像頭我們已經(jīng)用很多年了，最大的感觸就是無法事前報警。比如說，有的老人在起居室里摔倒了，或者小孩爬到?jīng)]有關(guān)閉窗戶的危險地帶，原來的攝像頭可能會認出來有老人有小孩，但它不能理解畫面的語義；但當(dāng)攝像頭有了一個‘認知性大腦’，看到這些場景時，自然就會聯(lián)想到這個人可能處在危險之中，從而實現(xiàn)事中的監(jiān)測和預(yù)警。”上海趨視科技總裁徐飆向記者介紹了其最新的“AI視覺行為分析”技術(shù)：“采用TOF(Time-of-Flight) 傳感器采集數(shù)據(jù)，并通過‘智能分析儀’進行AI推理，可以精準(zhǔn)地識別老人跌倒、久坐不起等風(fēng)險因素，通過APP實時將信息發(fā)送至家人或社區(qū)服務(wù)人員手機端。”

徐飆介紹：“比如，某街道違章停車、渣土車違規(guī)行駛、無證攤販臨時擺攤、商鋪占道經(jīng)營、亂倒垃圾等社區(qū)問題頻現(xiàn)，對于人員缺乏的社區(qū)管理隊伍而言，會出現(xiàn)如問題發(fā)現(xiàn)不及時，協(xié)調(diào)成本高，管理缺少數(shù)據(jù)支撐等現(xiàn)象；而智能視頻行為分析技術(shù)給街道每一部攝像機都裝上‘AI 大腦’，實時分析街面情況，對違規(guī)行為自動且及時地上報。當(dāng)偵測到指定區(qū)域內(nèi)出現(xiàn)違規(guī)行為，系統(tǒng)會生成提醒信號，實時推送到管理人員隨身設(shè)備中，實現(xiàn)社區(qū)問題處理敏捷化。”

高新興科技集團首席技術(shù)官陳利軍對記者介紹，在即將于12月24日于廣州舉行的黃埔馬拉松比賽中，通過在沿路高聳的樓宇部署的AI視頻監(jiān)控和無人機，可以做到賽事的全程管控。“無論隊伍到哪里，整個隊伍都是在可視范圍內(nèi)。比如說哪里發(fā)生擁擠或是有什么異常，AI視覺分析可以協(xié)助管理人員快速掌握全局。”

記者采訪發(fā)現(xiàn)，通過“AI視覺行為分析”，在馬路上，攝像頭可以識別車牌、追蹤違規(guī)行為；在工地上，可以識別工人是否佩戴工作手套、絕緣鞋、護目鏡等，為工人施工建立安全屏障；在校園里，有了“AI校園防欺凌終端”，可以針對“救命、打架、110”等異常詞匯進行采集；而在食堂，“明亮灶廚算法”能讓攝像頭識別廚師有沒有戴廚師帽和口罩，還有各種用具的擺放合不合規(guī)，食堂夠不夠衛(wèi)生、有沒有老鼠等；在家門口，可視門鈴能夠識別來訪是你的家人、朋友還是陌生人。

視覺大模型被“引爆”

多模態(tài)AI學(xué)人類“感知”世界

在本次CPSE安博會上，至少有六家頭部企業(yè)推出了通用或行業(yè)大模型，或是展示大模型應(yīng)用。郭威認為，視頻大模型已成為繼自然語言處理(NLP)之后AI技術(shù)的下一個引爆點。“大模型最大的意義是讓我們從判別式AI走向深層次判別式的AI，前者主要從數(shù)據(jù)和信號中去提取特征進行識別，完成像人臉識別語音識別、圖像識別這樣的任務(wù)；而后者可以在海量數(shù)據(jù)訓(xùn)練的基礎(chǔ)上生成文字、語言、圖片、視頻代碼甚至算法，完成各類專業(yè)人士的工作，在生產(chǎn)力的提升上更為直接。”

計算機視覺已經(jīng)邁入“大模型時代”，在許多領(lǐng)域都展現(xiàn)出了巨大潛力和價值，安防領(lǐng)域也不例外。記者采訪了解到，目前安防產(chǎn)業(yè)鏈上的各細分領(lǐng)域企業(yè)也推出了自己的大模型，如大華的“星漢”以視覺解析為核心；宇視科技的“梧桐”集CV行業(yè)、NLP行業(yè)等于一身，能夠滿足多樣化的任務(wù)和場景需求；云從科技的大模型“從容”應(yīng)用于視頻監(jiān)控、入侵檢測、人臉識別等過程中的數(shù)據(jù)分析，“行人基礎(chǔ)大模型”覆蓋了人體全局屬性(性別、年齡)、局部屬性(穿戴風(fēng)格、配飾)、攜帶屬性(手機、刀棍、手提包等)、人-物交互HOI(抽煙，持刀棍，手機拍屏幕)等，廣泛應(yīng)用于礦山、建筑工地以及特殊場所的安全布控，監(jiān)控作業(yè)人員穿戴合規(guī)，姿態(tài)行為等異常和違規(guī)行為。

熵基科技首席科學(xué)家陳書楷介紹：“我們?nèi)祟惖闹腔垠w現(xiàn)在我們可以通過感知、思考和行動來改變世界。現(xiàn)在機器也擁有了‘感知’和‘思考’的能力，伴隨AI的發(fā)展，機器必須通過視覺來理解周圍的環(huán)境，做出決策。”該企業(yè)自研的BioCV大模型可以實現(xiàn)園區(qū)運行安全“一屏統(tǒng)覽”。陳書楷表示，多模態(tài)AI結(jié)合了更多的感官模式，它模仿了人類感知世界的方式，能夠為多樣化場景下的智能個性化應(yīng)用開創(chuàng)全新可能。

明年有望大范圍落地

智慧社區(qū)更關(guān)注隱私保護

國際數(shù)據(jù)公司(IDC)數(shù)據(jù)顯示，自2023年開始，隨著大模型、生成式AI的盛行，智慧城市人工智能市場迎來新的機遇。IDC預(yù)計，未來5年人工智能將進入大規(guī)模落地應(yīng)用關(guān)鍵期。

一位業(yè)內(nèi)專家在接受記者采訪時談到，隨著AI和大模型一日千里的發(fā)展，智能視覺技術(shù)將在所有垂直行業(yè)得到更廣泛的應(yīng)用。“在大模型實施之后，因其更好的理解能力和更高的訓(xùn)練效率，我們可以用相對少的數(shù)據(jù)就達到非常高的準(zhǔn)確度。針對不同的場景，大模型的泛化能力也比傳統(tǒng)AI有非常大的提高。”

郭威認為：“大模型現(xiàn)在各個行業(yè)都在試，我覺得明年在很多行業(yè)，特別是在很多智慧社區(qū)，大模型能夠有效落地，形成商業(yè)閉環(huán)。”

智慧社區(qū)對于人工智能有著旺盛的需求，也是能夠?qū)崿F(xiàn)規(guī)?；l(fā)展、可復(fù)制性強的場景。記者發(fā)現(xiàn)，在此次CPSE安博會上，“個人隱私保護”也被多位專家和業(yè)內(nèi)人士著重強調(diào)。“視覺分析系統(tǒng)涉及采集并分析一些日常生活畫面，需要平衡監(jiān)控與隱私保護之間的關(guān)系，確保合理使用和保護個人隱私權(quán)。”據(jù)了解，針對智慧社區(qū)場景的特點，趨視科技、精華隆智慧感知等企業(yè)采用了可以“脫敏”的采集技術(shù)，不是通過視頻監(jiān)控，而是通過僅可見“影子”的深度圖像，反映景內(nèi)物體的距離和角度值，不直接包含面部、身體或其他私人信息，大大降低了隱私泄露的風(fēng)險。

記者采訪發(fā)現(xiàn)，目前部分智能安防產(chǎn)品和現(xiàn)有的基礎(chǔ)大模型還沒有掛鉤，但徐飆介紹，未來，相關(guān)安防設(shè)備可以和目前一些成熟的語音大模型對接，感知方式從視覺延伸到紅外、雷達、光纖、聲紋等更多維度，隨著TOF類雷達傳感器的不斷應(yīng)用，除了語音和圖像外，第三維深度數(shù)據(jù)感知越來越豐富，基于深度數(shù)據(jù)的大模型必將把機器“認知”世界的能力帶到一個新高度。(廣州日報)

THE END

責(zé)任編輯：趙智華

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關(guān)閱讀

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準(zhǔn)！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風(fēng)飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預(yù)案中針對特定突發(fā)情況的模擬處置演練…
應(yīng)用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當(dāng)家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領(lǐng)行業(yè)再躍遷