苦于缺乏談判技巧的人們,或許未來(lái)可以求助于人工智能(AI)了。英國(guó)《自然·通訊》雜志6日?qǐng)?bào)告,“深度思維”公司研發(fā)的一種“AI代理”會(huì)談判并能達(dá)成協(xié)議,其已在測(cè)試平臺(tái)中勝過(guò)其他無(wú)此能力的代理。這一成果展示了一種深度強(qiáng)化學(xué)習(xí)方法,用其建模的“AI代理”可與其他人工代理溝通合作,在玩游戲時(shí)共同制定計(jì)劃。
開(kāi)發(fā)能展現(xiàn)出代理間合作和溝通的AI十分重要。流行桌面游戲《外交》為此類(lèi)行為提供了有用的測(cè)試平臺(tái),它包含玩家之間復(fù)雜的溝通、談判和形成同盟,而AI一直很難達(dá)成這些。要贏得游戲,《外交》需要推斷在場(chǎng)玩家的未來(lái)計(jì)劃、玩家間的承諾,和他們的誠(chéng)實(shí)合作。過(guò)去的“AI代理”在單個(gè)玩家或兩個(gè)競(jìng)爭(zhēng)性玩家的游戲中取得過(guò)成功,其中玩家之間沒(méi)有交流。
英國(guó)“深度思維”研究團(tuán)隊(duì)此次設(shè)計(jì)了一種深度強(qiáng)化學(xué)習(xí)方法,讓代理可以協(xié)商同盟、共同制定計(jì)劃。研究人員創(chuàng)造出了模擬玩家的代理,形成團(tuán)隊(duì),嘗試勝過(guò)其他隊(duì)伍的策略。通過(guò)預(yù)測(cè)可能的未來(lái)游戲狀態(tài),這一學(xué)習(xí)算法允許代理對(duì)未來(lái)行動(dòng)達(dá)成一致,識(shí)別有益交易。為接近人類(lèi)水平的表現(xiàn),他們還通過(guò)檢驗(yàn)一些代理間承諾破裂的場(chǎng)景(代理背離了過(guò)去的協(xié)議),調(diào)查了誠(chéng)實(shí)合作的條件。
這些成果有助于“AI代理”形成靈活溝通機(jī)制,使其能根據(jù)環(huán)境調(diào)整策略。此外,這些發(fā)現(xiàn)還表明,對(duì)違反協(xié)議的同伴的制裁傾向會(huì)大大降低這類(lèi)違反者的優(yōu)勢(shì),有助于形成大多可信的交流,盡管情況最初更有利于違反協(xié)議者。
我們現(xiàn)在也常會(huì)跟AI打交道。它熱情洋溢、語(yǔ)調(diào)輕快地推銷(xiāo)商品,介紹活動(dòng),提供售后服務(wù)。不過(guò),通常情況下我們很快就能發(fā)現(xiàn)電話(huà)那頭的是AI。它很難靈活變通,也回答不了超出設(shè)置之外的問(wèn)題。在“深度思維”公司的這項(xiàng)研究中,AI已經(jīng)能上談判桌了。它們不僅會(huì)審時(shí)度勢(shì),還會(huì)合縱連橫,并懲罰談判上的不可信者。當(dāng)然,人類(lèi)不可能放心直接讓AI談判,但這類(lèi)嘗試可以讓AI形成靈活溝通機(jī)制,從而增進(jìn)它們?cè)谄渌S多領(lǐng)域的表現(xiàn)。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》(以下簡(jiǎn)稱(chēng)“報(bào)告”),該報(bào)告…
數(shù)字化浪潮下,安防廠商如何滿(mǎn)足行業(yè)客戶(hù)的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來(lái)自市場(chǎng) “不確定性”因素的沖擊,市場(chǎng)…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶(hù)服務(wù)之舟,在市場(chǎng)變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì),在深…