用代碼驅(qū)動(dòng)的機(jī)器人,如何更好地進(jìn)行人機(jī)交互?最近,布朗大學(xué)的人機(jī)機(jī)器人實(shí)驗(yàn)室使用AI加持的新系統(tǒng)進(jìn)行測(cè)試,該系統(tǒng)的目標(biāo)是讓機(jī)器人理解人類用日常語(yǔ)言發(fā)出的指令,并準(zhǔn)確執(zhí)行任務(wù)。
這項(xiàng)研究的關(guān)鍵點(diǎn)在于,他們開(kāi)發(fā)了一種新的系統(tǒng),能夠使機(jī)器人執(zhí)行復(fù)雜的任務(wù),而不需要數(shù)千小時(shí)的數(shù)據(jù)訓(xùn)練。傳統(tǒng)的機(jī)器訓(xùn)練中,要讓機(jī)器人在不同地方進(jìn)行導(dǎo)航,需要大量示例來(lái)告訴機(jī)器人如何理解和執(zhí)行指令,而這個(gè)新系統(tǒng)可以使機(jī)器人可以在不同環(huán)境中運(yùn)行,只需要提供該區(qū)域的詳細(xì)地圖。
研究人員介紹了他們系統(tǒng)中嵌入的大語(yǔ)言模型的作用,通過(guò)將指令進(jìn)行分解,無(wú)需大量訓(xùn)練數(shù)據(jù),就可以使機(jī)器人理解并執(zhí)行任務(wù)。該系統(tǒng)不僅能夠接受自然語(yǔ)言指令,還能夠根據(jù)環(huán)境的上下文來(lái)計(jì)算機(jī)器人可能需要的邏輯跳,這使得指令更加簡(jiǎn)單明了,包括機(jī)器人可以做什么、不能做什么以及按什么順序執(zhí)行。
該項(xiàng)目的主要研究員之一,布朗大學(xué)計(jì)算機(jī)科學(xué)教授StefanieTellex介紹道:“在選擇實(shí)驗(yàn)對(duì)象時(shí),我們特別考慮了在環(huán)境中移動(dòng)的移動(dòng)機(jī)器人,我們想用一種方法,讓機(jī)器人可以聽(tīng)懂人類對(duì)他下達(dá)的復(fù)雜且口語(yǔ)化的指令串聯(lián)起來(lái),比如沿著普羅維登斯的塞耶街去咖啡店見(jiàn)我,但避開(kāi)CVS并首先在銀行停下來(lái),并具體地按照指令步驟準(zhǔn)確實(shí)施。”
如果該研究取得成果,未來(lái)將會(huì)應(yīng)用于在城市中的眾多移動(dòng)機(jī)器人上,包括無(wú)人機(jī)、自動(dòng)駕駛汽車、無(wú)人運(yùn)輸車輛等,你只需要用平時(shí)與人交流的說(shuō)話方式和機(jī)器人交互,他便可以準(zhǔn)確理解你的指令,使移動(dòng)機(jī)器人在復(fù)雜環(huán)境下的應(yīng)用成為可能。
為了測(cè)試這個(gè)系統(tǒng),研究人員在21個(gè)城市使用OpenStreetMap進(jìn)行了模擬,結(jié)果顯示系統(tǒng)在80%的時(shí)間內(nèi)都能準(zhǔn)確執(zhí)行任務(wù),這一準(zhǔn)確率遠(yuǎn)高于其他類似系統(tǒng),它們通常只能達(dá)到20%左右的準(zhǔn)確率,無(wú)法處理復(fù)雜的指令和任務(wù)。
同時(shí),團(tuán)隊(duì)還在布朗大學(xué)校園內(nèi)使用波士頓動(dòng)力的Spot機(jī)器人進(jìn)行了室內(nèi)測(cè)試,spot機(jī)器人被認(rèn)為是全球領(lǐng)先的通用四足機(jī)器人之一,在spot身上取得驗(yàn)證的成功有利于促進(jìn)該系統(tǒng)對(duì)其他廠商機(jī)器人的適用性。
JasonXinyu是一名計(jì)算機(jī)科學(xué)博士,也是本次研究團(tuán)隊(duì)的主要成員,他用一個(gè)例子解釋了這個(gè)系統(tǒng)的工作原理。
假如用戶告訴無(wú)人機(jī)去“商店”在“主街”,但要先去“銀行”。輸入該指令后,首先,軟件將這兩個(gè)地點(diǎn)識(shí)別出來(lái),然后語(yǔ)言模型開(kāi)始將這些抽象地點(diǎn)與機(jī)器人所在的具體地點(diǎn)進(jìn)行匹配;與此同時(shí),它還分析地點(diǎn)的元數(shù)據(jù),比如地址或地點(diǎn)的類型,以幫助系統(tǒng)做出決策,在這種情況下,有幾家商店附近,但只有一家在主街上,所以系統(tǒng)知道要去哪里;隨后,語(yǔ)言模型將命令翻譯成線性時(shí)序邏輯,這是一種數(shù)學(xué)代碼和符號(hào)來(lái)表達(dá)命令;最后,系統(tǒng)將當(dāng)前映射的位置代入這個(gè)公式中,告訴機(jī)器人前往A點(diǎn),但要在B點(diǎn)之后。
Jason介紹,11月將在網(wǎng)上發(fā)布基于OpenStreetMaps的模擬,允許用戶自己測(cè)試這個(gè)系統(tǒng)。用戶可以在網(wǎng)頁(yè)上輸入自然語(yǔ)言命令,指導(dǎo)模擬中的無(wú)人機(jī)執(zhí)行導(dǎo)航任務(wù),以幫助研究人員微調(diào)軟件。
這意味著,一個(gè)由大眾共同訓(xùn)練的“AI+機(jī)器人”項(xiàng)目,正在向我們走來(lái)。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》(以下簡(jiǎn)稱“報(bào)告”),該報(bào)告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來(lái)自市場(chǎng) “不確定性”因素的沖擊,市場(chǎng)…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場(chǎng)變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì),在深…