DeepMind推出AI聊天機器人Sparrow，可通過谷歌搜索來回答問題

2022-09-25 10:48

Alphabet 旗下人工智能實驗室 DeepMind 的一篇新論文顯示，制造一個好的人工智能（AI，Artificial intelligence）聊天機器人的訣竅，可能是先讓人類制定一系列不可打破的鐵律，然后使該模型利用互聯(lián)網(wǎng)搜索尋找證據(jù)，支持其主張或回答。

在近日發(fā)表的一篇新的未經(jīng)同行評議論文中，DeepMind 發(fā)布了一種使用其大型語言模型 Chinchilla 訓練的人工智能聊天機器人 Sparrow。

（來源：DeepMind）

Sparrow 的設計目的是與人類交談并回答問題，同時實時使用谷歌搜索或有關(guān)信息來支持它的答案。

根據(jù)人們對這些答案有用與否的回應，再使用強化學習算法進行訓練。該算法通過反復試驗（試錯）來學習，以實現(xiàn)特定的目標。

該系統(tǒng)旨在推動人工智能發(fā)展成為可以與人類對話，但卻不會產(chǎn)生諸如讓人們傷害自己或他人的嚴重后果。

大型語言模型生成的文本看起來就像是人類寫出來的。它們正日漸成為互聯(lián)網(wǎng)基礎設施中的重要組成部分，被用于總結(jié)、構(gòu)建更強大的搜索工具，或者是為客戶服務的聊天機器人。

但是，這些模型是通過從互聯(lián)網(wǎng)上抓取大量數(shù)據(jù)和文本來接受訓練的，這不可避免地包含許多有害的偏見。

只需要一點誘導，它們就會生產(chǎn)“有毒”的或歧視性的內(nèi)容。在一個旨在與人類對話的人工智能工具中，其結(jié)果可能是災難性的。

一個沒有適當安全措施的對話式人工智能，可能會對少數(shù)群體說出帶有冒犯性的話語，或者建議人們喝漂白劑來對抗病毒。據(jù)悉，那些開發(fā)對話式人工智能系統(tǒng)的公司，已嘗試使用許多技術(shù)來使模型更安全。

著名大型語言模型 GPT-3 的創(chuàng)造者 OpenAI，以及人工智能初創(chuàng)公司 Anthropic 已經(jīng)在利用強化學習，將人類的偏好融入到他們的模型中。Meta（原 Facebook）的人工智能聊天機器人 BlenderBot 通過在線搜索來完善其答案。而 DeepMind 的 Sparrow 將所有這些技術(shù)整合在一個模型中。

據(jù)介紹，DeepMind 向人類參與者展示了該模型對同一問題給出的多個答案，并且還會問他們最喜歡哪一個。

然后他們被要求判斷這些答案是否可信，以及 Sparrow 是否使用了適當?shù)淖C據(jù)支持這個答案，比如提供信息來源的鏈接。

比如，該模型通過使用從互聯(lián)網(wǎng)上檢索到的證據(jù)，能夠在 78% 的情況下對事實問題進行合理的回答。

在制定這些答案時，它會遵循由研究人員規(guī)定的 23 條規(guī)則，比如不提供財務建議、不發(fā)威脅性文字、不聲稱自己是一個人。

DeepMind 安全研究員杰弗里·歐文（）說，這種方法與之前的不同之處在于，DeepMind 希望達到“對話的長期安全”。

他說：“這意味著我們不期望這些模型面臨的問題——錯誤信息或刻板印象——乍一看是顯而易見的，我們想詳細討論它們。”

非營利性人工智能研究實驗室 Cohere for AI 的負責人薩拉·胡克（）說，利用人類偏好來優(yōu)化人工智能模型學習方式的想法并不新鮮。

但認為，這些改進令人信服，同時展示出在大型語言模型環(huán)境中，以人為引導的方式優(yōu)化對話代理有明顯的好處。

人工智能初創(chuàng)公司 Hugging Face 的研究員都維·基拉（）說，Sparrow 是“很好地遵循了人工智能總體趨勢的下一步，我們正在更努力地改進大型語言模型的部署安全性。”

但在這些對話人工智能模型被部署到社會中之前，還有很多工作要做。

比如，Sparrow 仍然會犯錯誤，這個模型有時會所問非所答或給出隨機答案。那些有毅力的參與者也可以打破人為定下的規(guī)則，這樣的情況約有 8%。與老款模型相比，這仍是一個改進：即打破 DeepMind 老款模型規(guī)則的頻率，是 Sparrow 的三倍。

說：“比如（用大模型來）提供醫(yī)療和財務建議，那么對許多人來說，8% 可能仍然是一個令人無法接受的高失敗率。”

這項工作也僅建立在英語模型上，“而我們生活在一個技術(shù)必須安全和負責任地為許多不同的語言服務的世界里，”他補充道。

指出的另一個問題是：“依賴谷歌來尋找信息，會導致難以發(fā)現(xiàn)的未知偏見，因為所有信息源都是封閉的。”

支持：Ren

原文：

https://www.technologyreview.com/2022/09/22/1059922/deepminds-new-chatbot-uses-google-searches-plus-humans-to-give-better-answers/

參考：

https://www.deepmind.com/blog/building-safer-dialogue-agents

THE END

責任編輯：李斌

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關(guān)閱讀

展會預告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，海康威視基于觀瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！海康威視發(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，海康威視發(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務之舟，在市場變革中逆風飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預案中針對特定突發(fā)情況的模擬處置演練…
應用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領(lǐng)行業(yè)再躍遷

DeepMind推出AI聊天機器人Sparrow，可通過谷歌搜索來回答問題

DeepMind推出AI聊天機器人Sparrow，可通過谷歌搜索來回答問題