人工智能聲吶眼鏡可識別唇語，準(zhǔn)確率約為95%

2023-04-10 09:03

美國康奈爾大學(xué)研究人員開發(fā)了一款聲吶眼鏡，它通過聲學(xué)感應(yīng)和人工智能跟蹤嘴唇和嘴巴的動作，可連續(xù)識別多達(dá)31條無聲的命令，該系統(tǒng)可為那些暫時不方便說話或無法發(fā)聲的人提供幫助。相關(guān)論文將在本月于德國漢堡舉行的計算機(jī)協(xié)會計算系統(tǒng)人為因素會議上發(fā)表。

EchoSpeech眼鏡。圖片來源：康奈爾大學(xué)

這款眼鏡是一種名為EchoSpeech的無聲語音識別接口。該眼鏡配備了一對麥克風(fēng)和比鉛筆橡皮擦還小的揚(yáng)聲器，成為一個可穿戴的人工智能驅(qū)動的聲吶系統(tǒng)，在面部發(fā)送和接收聲波，并感知嘴巴的運(yùn)動。然后，深度學(xué)習(xí)算法實(shí)時分析這些回聲輪廓，準(zhǔn)確率約為95%。這款低功耗、可穿戴的眼鏡只需要幾分鐘的用戶訓(xùn)練數(shù)據(jù)，即可識別命令并可在智能手機(jī)上運(yùn)行。

EchoSpeech可用于在說話不方便或不合適的地方通過智能手機(jī)與他人交流，比如在嘈雜的餐廳或安靜的圖書館里。無聲語音界面還可與觸筆配對，并與CAD等設(shè)計軟件一起使用，幾乎不需要鍵盤和鼠標(biāo)。

研究人員表示，他們正在將聲吶技術(shù)“搬”到人體上。它體積小、功耗低、對隱私敏感，這些都是在現(xiàn)實(shí)世界中部署新的可穿戴技術(shù)的重要功能。無聲語音識別中的大多數(shù)技術(shù)都局限于一組選定的預(yù)定命令，需要用戶面部或佩戴攝像頭，這既不實(shí)用也不可行?？纱┐魇綌z像頭也存在重大的隱私問題，對用戶和與之互動的人來說都是如此。而像EchoSpeech這樣的聲學(xué)傳感技術(shù)消除了對可穿戴式攝像機(jī)的需求。

此外，由于音頻數(shù)據(jù)比圖像或視頻數(shù)據(jù)小得多，因此EchoSpeech只需更小的帶寬，通過藍(lán)牙實(shí)時傳輸?shù)街悄苁謾C(jī)上，且數(shù)據(jù)在本地，不在云端，確保了敏感隱私信息安全。

今年以來，人工智能再次引發(fā)極大關(guān)注。幾年前，專家們還在探討如何讓人工智能更加準(zhǔn)確地理解人的意圖，并與人進(jìn)行多輪對話。曾經(jīng)，讓人工智能讀懂唇語，還只是科幻電影中的橋段。如今，這些都在快速變?yōu)楝F(xiàn)實(shí)。面對人工智能帶來的超乎預(yù)期的變化，不能停留在“看熱鬧”階段，人們需要真正去思考，如何更好地主宰人工智能，利用它為人類造福，并盡量規(guī)避它可能帶來的麻煩。

THE END

責(zé)任編輯：趙智華

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請諒解！

相關(guān)閱讀

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機(jī)
更準(zhǔn)！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風(fēng)飛揚(yáng)

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
視頻監(jiān)控殺出合規(guī)黑馬：爍博科技靠的竟是這臺 "全能戰(zhàn)士"
大華股份與京東工業(yè)簽署戰(zhàn)略合作協(xié)議
犀靈視覺完成數(shù)千萬元Pre-A輪融資，盈富泰克投資
一文讀懂熵基科技全球三大智造基地

人工智能聲吶眼鏡可識別唇語，準(zhǔn)確率約為95%

人工智能聲吶眼鏡可識別唇語，準(zhǔn)確率約為95%