Meta發(fā)布史上首個圖像分割基礎(chǔ)模型

2023-04-11 10:11

4月6日，Meta推出了一款Segment Anything Model (SAM)。據(jù)介紹，該模型能夠根據(jù)文本指令等方式實現(xiàn)圖像分割，而且萬物皆可識別和“一鍵摳圖”。SAM是第一個致力于圖像分割的基礎(chǔ)模型。據(jù)Meta介紹，SAM已經(jīng)學(xué)會了關(guān)于物體的一般概念，并且它可以為任何圖像或視頻中的任何物體生成掩碼，甚至包括在訓(xùn)練過程中沒有遇到過的物體和圖像類型。SAM足夠通用，可以涵蓋廣泛的用例，并且可以在新的圖像領(lǐng)域上即開即用，無需額外的訓(xùn)練。

在此之前，分割作為計算機視覺的核心任務(wù)，已經(jīng)得到廣泛應(yīng)用。但是，為特定任務(wù)創(chuàng)建準確的分割模型通常需要技術(shù)專家進行高度專業(yè)化的工作，此外，該項任務(wù)還需要大量的領(lǐng)域標注數(shù)據(jù)，種種因素限制了圖像分割的進一步發(fā)展。

以前,解決分割問題大致有兩種方法。第一種是交互式分割，該方法允許分割任何類別的對象，但需要一個人通過迭代細化掩碼來指導(dǎo)該方法。第二種，自動分割，允許分割提前定義的特定對象類別（例如，貓或椅子），但需要大量的手動注釋對象來訓(xùn)練（例如，數(shù)千甚至數(shù)萬個分割貓的例子）。這兩種方法都沒有提供通用的、全自動的分割方法。

SAM是這兩類方法的結(jié)合。它是一個單一的模型，可以輕松地執(zhí)行交互式分割和自動分割。該模型的可提示界面允許以靈活的方式使用它，只需為模型設(shè)計正確的提示（點擊、框、文本等），就可以完成范圍廣泛的分割任務(wù)。

此外，SAM在包含超過10億個掩碼（作為該項目的一部分收集）的多樣化、高質(zhì)量數(shù)據(jù)集上進行訓(xùn)練，這使其能夠泛化到新類型的對象和圖像，超出其在訓(xùn)練期間觀察到的內(nèi)容。這種概括能力意味著，從業(yè)者將不再需要收集他們自己的細分數(shù)據(jù)并為他們的場景微調(diào)模型。

總而言之，這些功能使SAM能夠泛化到新任務(wù)和新領(lǐng)域。這種靈活性在圖像分割領(lǐng)域尚屬首創(chuàng)。最強大的是，Meta實現(xiàn)了一個完全不同的CV范式，你可以在一個統(tǒng)一框架prompt encoder內(nèi)，指定一個點、一個邊界框、一句話，直接一鍵分割出物體。

THE END

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風(fēng)飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
視頻監(jiān)控殺出合規(guī)黑馬：爍博科技靠的竟是這臺 "全能戰(zhàn)士"
大華股份與京東工業(yè)簽署戰(zhàn)略合作協(xié)議
犀靈視覺完成數(shù)千萬元Pre-A輪融資，盈富泰克投資
一文讀懂熵基科技全球三大智造基地