AI視覺進(jìn)入“大模型時代”不僅“看得見”還“看得懂”
智慧安防領(lǐng)域需求旺盛 更強(qiáng)調(diào)個人隱私權(quán)保護(hù)
第十九屆中國國際社會公共安全博覽會現(xiàn)場。
智慧安防更注重隱私保護(hù)。
近日,第十九屆中國國際社會公共安全博覽會(以下簡稱“CPSE安博會”)和全球數(shù)字城市產(chǎn)業(yè)博覽會在深圳會展中心落幕。在6萬平方米的數(shù)字城市產(chǎn)業(yè)展區(qū)中,隨處可見AI攝像頭和AI綜合數(shù)據(jù)分析圖,而行業(yè)大模型在展會上也出現(xiàn)得更多了。
記者采訪了解到,AI大模型如今已成為“兵家必爭之地”,而安防行業(yè)則成為AI的“第一著陸點”,豐富的感知設(shè)備和數(shù)據(jù)維度,讓這一領(lǐng)域更加成為AI大模型等前沿技術(shù)的試驗田。而中國企業(yè)在智能安防領(lǐng)域的“領(lǐng)跑式發(fā)展”,也為安防產(chǎn)品“出海”奠定基礎(chǔ),在AI技術(shù)的加持下,安防行業(yè)又迎來了一輪革新,將成為民眾更好的“隱形守護(hù)者”。
文、圖/廣州日報全媒體記者 馮秋瑜
數(shù)字孿生、視覺分析:
智慧安防營造安全、舒適社區(qū)
記者在現(xiàn)場采訪發(fā)現(xiàn),大到天地傳感,小到社區(qū)“最后一公里”,在新技術(shù)的助力下,我們所居住的城市正在加速向“智慧城市”轉(zhuǎn)變,計算機(jī)視覺(CV)作為人工智能領(lǐng)域最大的應(yīng)用領(lǐng)域,在人臉識別、視頻監(jiān)控、門禁卡、防盜報警等智慧安防領(lǐng)域率先實現(xiàn)了商業(yè)化。
“相比于傳統(tǒng)的社區(qū)管理模式,‘智慧社區(qū)’更加以人為本,以不斷滿足居民的幸福感和滿意度為核心,為居民提供更便捷、安全的社區(qū)環(huán)境,讓孩子茁壯成長,讓老人盡享天倫。”英特爾中國區(qū)物聯(lián)網(wǎng)及渠道數(shù)據(jù)中心事業(yè)部總經(jīng)理郭威告訴記者,之前的攝像頭只是“看得見”,而智能視頻分析系統(tǒng)可以“看得懂”。
據(jù)了解,智能視覺分析通過對采集社區(qū)中的人、車、公共設(shè)施等管理對象的視覺數(shù)據(jù)進(jìn)行智慧化的數(shù)據(jù)洞察,實現(xiàn)“入侵”“攀高”“自行車/電動自行車違停”“亂丟垃圾”“高空拋物”“水域入侵”“占道堆物”等方面的識別需求,在事件發(fā)生后,系統(tǒng)能夠在3秒內(nèi)通過AI應(yīng)用對圖像進(jìn)行識別并判斷該事件是否違規(guī),并在5分鐘內(nèi)處置完成,從而營造更智能、安全、舒適的社區(qū)和公共環(huán)境。
“地面沉陷、暴雨成災(zāi)、交通擁堵等是城市發(fā)展中遇到的共性問題,利用時空大數(shù)據(jù)建設(shè)好基于數(shù)字孿生的智慧城市,可以推動城市升級發(fā)展。”中國科學(xué)院院士、中國工程院院士李德仁向記者介紹了基于天地傳感網(wǎng)的數(shù)字孿生技術(shù)在災(zāi)害智能管理方面的應(yīng)用:“今年5月21日,國際首顆遙感成像、氣象探測和水利應(yīng)用一體化衛(wèi)星‘珞珈二號’在酒泉衛(wèi)星發(fā)射中心發(fā)射,能滿足目標(biāo)識別級的遙感感知的高分辨率、視頻等多種探測需求。在今年夏天京津冀地區(qū)的防汛工作中,‘珞珈二號’觀測到堤防決口的影像,第一時間發(fā)布預(yù)警,幫6300余名群眾當(dāng)天完成轉(zhuǎn)移。”
動態(tài)監(jiān)測老人、賽事、施工
“AI視覺行為分析”實時告知
“攝像頭我們已經(jīng)用很多年了,最大的感觸就是無法事前報警。比如說,有的老人在起居室里摔倒了,或者小孩爬到?jīng)]有關(guān)閉窗戶的危險地帶,原來的攝像頭可能會認(rèn)出來有老人有小孩,但它不能理解畫面的語義;但當(dāng)攝像頭有了一個‘認(rèn)知性大腦’,看到這些場景時,自然就會聯(lián)想到這個人可能處在危險之中,從而實現(xiàn)事中的監(jiān)測和預(yù)警。”上海趨視科技總裁徐飆向記者介紹了其最新的“AI視覺行為分析”技術(shù):“采用TOF(Time-of-Flight) 傳感器采集數(shù)據(jù),并通過‘智能分析儀’進(jìn)行AI推理,可以精準(zhǔn)地識別老人跌倒、久坐不起等風(fēng)險因素,通過APP實時將信息發(fā)送至家人或社區(qū)服務(wù)人員手機(jī)端。”
徐飆介紹:“比如,某街道違章停車、渣土車違規(guī)行駛、無證攤販臨時擺攤、商鋪占道經(jīng)營、亂倒垃圾等社區(qū)問題頻現(xiàn),對于人員缺乏的社區(qū)管理隊伍而言,會出現(xiàn)如問題發(fā)現(xiàn)不及時,協(xié)調(diào)成本高,管理缺少數(shù)據(jù)支撐等現(xiàn)象;而智能視頻行為分析技術(shù)給街道每一部攝像機(jī)都裝上‘AI 大腦’,實時分析街面情況,對違規(guī)行為自動且及時地上報。當(dāng)偵測到指定區(qū)域內(nèi)出現(xiàn)違規(guī)行為,系統(tǒng)會生成提醒信號,實時推送到管理人員隨身設(shè)備中,實現(xiàn)社區(qū)問題處理敏捷化。”
高新興科技集團(tuán)首席技術(shù)官陳利軍對記者介紹,在即將于12月24日于廣州舉行的黃埔馬拉松比賽中,通過在沿路高聳的樓宇部署的AI視頻監(jiān)控和無人機(jī),可以做到賽事的全程管控。“無論隊伍到哪里,整個隊伍都是在可視范圍內(nèi)。比如說哪里發(fā)生擁擠或是有什么異常,AI視覺分析可以協(xié)助管理人員快速掌握全局。”
記者采訪發(fā)現(xiàn),通過“AI視覺行為分析”,在馬路上,攝像頭可以識別車牌、追蹤違規(guī)行為;在工地上,可以識別工人是否佩戴工作手套、絕緣鞋、護(hù)目鏡等,為工人施工建立安全屏障;在校園里,有了“AI校園防欺凌終端”,可以針對“救命、打架、110”等異常詞匯進(jìn)行采集;而在食堂,“明亮灶廚算法”能讓攝像頭識別廚師有沒有戴廚師帽和口罩,還有各種用具的擺放合不合規(guī),食堂夠不夠衛(wèi)生、有沒有老鼠等;在家門口,可視門鈴能夠識別來訪是你的家人、朋友還是陌生人。
視覺大模型被“引爆”
多模態(tài)AI學(xué)人類“感知”世界
在本次CPSE安博會上,至少有六家頭部企業(yè)推出了通用或行業(yè)大模型,或是展示大模型應(yīng)用。郭威認(rèn)為,視頻大模型已成為繼自然語言處理(NLP)之后AI技術(shù)的下一個引爆點。“大模型最大的意義是讓我們從判別式AI走向深層次判別式的AI,前者主要從數(shù)據(jù)和信號中去提取特征進(jìn)行識別,完成像人臉識別語音識別、圖像識別這樣的任務(wù);而后者可以在海量數(shù)據(jù)訓(xùn)練的基礎(chǔ)上生成文字、語言、圖片、視頻代碼甚至算法,完成各類專業(yè)人士的工作,在生產(chǎn)力的提升上更為直接。”
計算機(jī)視覺已經(jīng)邁入“大模型時代”,在許多領(lǐng)域都展現(xiàn)出了巨大潛力和價值,安防領(lǐng)域也不例外。記者采訪了解到,目前安防產(chǎn)業(yè)鏈上的各細(xì)分領(lǐng)域企業(yè)也推出了自己的大模型,如大華的“星漢”以視覺解析為核心;宇視科技的“梧桐”集CV行業(yè)、NLP行業(yè)等于一身,能夠滿足多樣化的任務(wù)和場景需求;云從科技的大模型“從容”應(yīng)用于視頻監(jiān)控、入侵檢測、人臉識別等過程中的數(shù)據(jù)分析,“行人基礎(chǔ)大模型”覆蓋了人體全局屬性(性別、年齡)、局部屬性(穿戴風(fēng)格、配飾)、攜帶屬性(手機(jī)、刀棍、手提包等)、人-物交互HOI(抽煙,持刀棍,手機(jī)拍屏幕)等,廣泛應(yīng)用于礦山、建筑工地以及特殊場所的安全布控,監(jiān)控作業(yè)人員穿戴合規(guī),姿態(tài)行為等異常和違規(guī)行為。
熵基科技首席科學(xué)家陳書楷介紹:“我們?nèi)祟惖闹腔垠w現(xiàn)在我們可以通過感知、思考和行動來改變世界?,F(xiàn)在機(jī)器也擁有了‘感知’和‘思考’的能力,伴隨AI的發(fā)展,機(jī)器必須通過視覺來理解周圍的環(huán)境,做出決策。”該企業(yè)自研的BioCV大模型可以實現(xiàn)園區(qū)運(yùn)行安全“一屏統(tǒng)覽”。陳書楷表示,多模態(tài)AI結(jié)合了更多的感官模式,它模仿了人類感知世界的方式,能夠為多樣化場景下的智能個性化應(yīng)用開創(chuàng)全新可能。
明年有望大范圍落地
智慧社區(qū)更關(guān)注隱私保護(hù)
國際數(shù)據(jù)公司(IDC)數(shù)據(jù)顯示,自2023年開始,隨著大模型、生成式AI的盛行,智慧城市人工智能市場迎來新的機(jī)遇。IDC預(yù)計,未來5年人工智能將進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。
一位業(yè)內(nèi)專家在接受記者采訪時談到,隨著AI和大模型一日千里的發(fā)展,智能視覺技術(shù)將在所有垂直行業(yè)得到更廣泛的應(yīng)用。“在大模型實施之后,因其更好的理解能力和更高的訓(xùn)練效率,我們可以用相對少的數(shù)據(jù)就達(dá)到非常高的準(zhǔn)確度。針對不同的場景,大模型的泛化能力也比傳統(tǒng)AI有非常大的提高。”
郭威認(rèn)為:“大模型現(xiàn)在各個行業(yè)都在試,我覺得明年在很多行業(yè),特別是在很多智慧社區(qū),大模型能夠有效落地,形成商業(yè)閉環(huán)。”
智慧社區(qū)對于人工智能有著旺盛的需求,也是能夠?qū)崿F(xiàn)規(guī)模化發(fā)展、可復(fù)制性強(qiáng)的場景。記者發(fā)現(xiàn),在此次CPSE安博會上,“個人隱私保護(hù)”也被多位專家和業(yè)內(nèi)人士著重強(qiáng)調(diào)。“視覺分析系統(tǒng)涉及采集并分析一些日常生活畫面,需要平衡監(jiān)控與隱私保護(hù)之間的關(guān)系,確保合理使用和保護(hù)個人隱私權(quán)。”據(jù)了解,針對智慧社區(qū)場景的特點,趨視科技、精華隆智慧感知等企業(yè)采用了可以“脫敏”的采集技術(shù),不是通過視頻監(jiān)控,而是通過僅可見“影子”的深度圖像,反映景內(nèi)物體的距離和角度值,不直接包含面部、身體或其他私人信息,大大降低了隱私泄露的風(fēng)險。
記者采訪發(fā)現(xiàn),目前部分智能安防產(chǎn)品和現(xiàn)有的基礎(chǔ)大模型還沒有掛鉤,但徐飆介紹,未來,相關(guān)安防設(shè)備可以和目前一些成熟的語音大模型對接,感知方式從視覺延伸到紅外、雷達(dá)、光纖、聲紋等更多維度,隨著TOF類雷達(dá)傳感器的不斷應(yīng)用,除了語音和圖像外,第三維深度數(shù)據(jù)感知越來越豐富,基于深度數(shù)據(jù)的大模型必將把機(jī)器“認(rèn)知”世界的能力帶到一個新高度。(廣州日報)
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…