谷歌DeepMind構(gòu)建“早期預(yù)警系統(tǒng)”推進AI治理，確保AI目標與人類一致

2023-05-31 10:07 來源:極客網(wǎng)

DeepMind的研究人員表示，負責任的AI開發(fā)人員需要解決或規(guī)避當前的風險，并預(yù)測未來可能出現(xiàn)的風險，因為大型語言模型越來越擅長獨立思考。他們在報告中寫道，“在持續(xù)進步之后，未來的通用模型可能

谷歌旗下AI研究實驗室DeepMind日前表示，已經(jīng)創(chuàng)建一個“早期預(yù)警系統(tǒng)”，可以在AI模型出現(xiàn)問題之前發(fā)現(xiàn)一些潛在的危險。

總部位于英國的DeepMind一直活躍在AI研究的前沿，是全球少數(shù)幾家致力于開發(fā)達到人類水平的通用AI公司之一，最近與母公司谷歌進行了更緊密的整合。

DeepMind的研究團隊與來自學術(shù)界，以及OpenAI和Anthropic等其他主要AI開發(fā)商的研究人員合作，開發(fā)了這一新的威脅檢測系統(tǒng)。

DeepMind工程師在一篇關(guān)于新框架的技術(shù)博客中宣稱，“為了負責任地走在AI研究的前沿，我們必須盡早識別AI系統(tǒng)中的新功能和新風險。”

如今已經(jīng)有了一些評估工具，可以根據(jù)特定的風險檢查功能強大的通用模型。這些工具在AI系統(tǒng)向公眾廣泛提供之前識別出其存在的一些不必要的行為，包括尋找誤導性陳述，有偏見的決定或復制版權(quán)保護的內(nèi)容。

這些問題來自于越來越高級的大模型，它們的能力超出了簡單的內(nèi)容生成，而包括在操縱、欺騙、網(wǎng)絡(luò)攻擊或其他危險能力方面的強大技能。新框架被描述為可用于減輕這些風險的“早期預(yù)警系統(tǒng)”。

DeepMind的研究人員表示，負責任的AI開發(fā)人員需要解決或規(guī)避當前的風險，并預(yù)測未來可能出現(xiàn)的風險，因為大型語言模型越來越擅長獨立思考。他們在報告中寫道，“在持續(xù)進步之后，未來的通用模型可能會默認學習各種危險的能力。”

雖然對這一風險并不確定，但該團隊表示，未來的AI系統(tǒng)與人類的利益不太一致，可能會實施攻擊性的行為，在對話中巧妙地欺騙人類，操縱人類實施有害的行動，設(shè)計或獲取武器，微調(diào)和操作云計算平臺上的其他高風險AI系統(tǒng)。

谷歌DeepMind構(gòu)建“早期預(yù)警系統(tǒng)”推進AI治理，確保AI目標與人類一致

AI還可以幫助人類執(zhí)行這些任務(wù)，增加恐怖分子獲取他們以前無法獲取的數(shù)據(jù)和內(nèi)容的風險。DeepMind的開發(fā)團隊在博客中寫道，“模型評估可以幫助我們提前識別這些風險。”

框架中提出的模型評估可用于發(fā)現(xiàn)某個AI模型何時具有可用于威脅、施加或逃避的“危險能力”。它還允許開發(fā)人員確定模型在多大程度上傾向于應(yīng)用這種能力來造成損害——也就是它的一致性。DeepMind的開發(fā)團隊在博客中寫道，“即使在非常廣泛的場景中，一致性評估也應(yīng)確認模型的行為符合預(yù)期，并在可能的情況下檢查模型的內(nèi)部工作。”

這些結(jié)果可以用來了解風險水平以及導致風險水平的因素是什么。研究人員警告說：“如果AI系統(tǒng)的能力足以造成極端傷害，假設(shè)它被濫用或安排不當，AI社區(qū)應(yīng)該將其視為高度危險的系統(tǒng)。要在現(xiàn)實世界中部署這樣的系統(tǒng)，AI開發(fā)人員需要展示出異常高的安全標準。”

這就是治理結(jié)構(gòu)發(fā)揮重要作用的地方。OpenAI最近宣布，將向開發(fā)AI治理系統(tǒng)的機構(gòu)和組織提供10筆10萬美元的贈款，而七國集團(G7)也計劃舉行會議，將討論如何應(yīng)對AI風險。

DeepMind表示：“如果我們有更好的工具來識別哪些模型存在風險，開發(fā)商和監(jiān)管機構(gòu)就能更好地確保負責任地對AI進行訓練，根據(jù)風險評估做出部署決策，而透明度至關(guān)重要，包括報告風險，并確保有適當?shù)臄?shù)據(jù)和信息安全控制措施。”

AI法律服務(wù)商Luminance總法律顧問HarryBorovick表示，合規(guī)需要一致性。他說：“近幾個月來對監(jiān)管制度不斷的解釋，為AI開發(fā)商和采用AI的企業(yè)構(gòu)建了一個合規(guī)雷區(qū)。由于開發(fā)AI競賽并不會很快放緩，因此對明確而一致的監(jiān)管指導的需求從未像現(xiàn)在這樣迫切。然而需要記住的是，AI技術(shù)以及它做出決定的方式是無法解釋的。這就是在制定法規(guī)時，科技和AI專家的正確結(jié)合是如此重要的原因。”

THE END

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關(guān)閱讀

基于芯片的量子密鑰分發(fā)系統(tǒng)制成2023-05-30
鵬城實驗室發(fā)布星云系統(tǒng)2023-05-26
運動感應(yīng)照明系統(tǒng)優(yōu)缺點有哪些2023-05-25
etc系統(tǒng)解決方案供應(yīng)商計通退確定退市2023-05-23
西門子第二季度繼續(xù)卓越表現(xiàn) 再次上調(diào)業(yè)績目標指引2023-05-18
谷歌宣布推出最新大型語言模型PaLM 22023-05-12
建行這套安防物聯(lián)管理平臺系統(tǒng)“立功了”2023-05-08
智能樓宇和樓宇自動化系統(tǒng)將如何改變設(shè)施管理2023-04-27
大眼萌“預(yù)警機器人”站崗高速路！2023-04-23
什么是防盜報警系統(tǒng)？2023-04-18

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，海康威視發(fā)布文搜存儲系列產(chǎn)品
近日，海康威視基于觀瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預(yù)案中針對特定突發(fā)情況的模擬處置演練…
應(yīng)用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領(lǐng)行業(yè)再躍遷