11月12日,由工業(yè)和信息化部、江西省人民政府共同主辦的2022世界VR產(chǎn)業(yè)大會(huì)在南昌開(kāi)幕。在開(kāi)幕演講中,科大訊飛股份有限公司董事長(zhǎng)劉慶峰在題為“以人工智能賦能虛擬現(xiàn)實(shí)產(chǎn)業(yè)”的演講中表示,當(dāng)前,人工智能與虛擬現(xiàn)實(shí)技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢(shì),兩者有著天然的聯(lián)系,已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢(shì)。
人工智能與虛擬現(xiàn)實(shí)技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢(shì)
“人工智能與虛擬現(xiàn)實(shí)的結(jié)合具有天然的源頭相關(guān)性。數(shù)字經(jīng)濟(jì)是未來(lái)經(jīng)濟(jì)的重要引擎,虛擬和現(xiàn)實(shí)結(jié)合、線上和線下相結(jié)合是數(shù)字經(jīng)濟(jì)發(fā)展的大勢(shì)所趨。”劉慶峰認(rèn)為,人工智能可以為虛擬現(xiàn)實(shí)深度賦能,智能運(yùn)算讓機(jī)器運(yùn)算能力和存儲(chǔ)力遠(yuǎn)超人類,感知讓計(jì)算機(jī)能看會(huì)說(shuō),像人一樣自動(dòng)交流,讓機(jī)器具備認(rèn)知的能力,能理解、會(huì)思考,具備學(xué)習(xí)推理和決策的能力。
在劉慶峰看來(lái),人工智能技術(shù)是虛擬現(xiàn)實(shí)的重要支撐,助力虛擬現(xiàn)實(shí)產(chǎn)業(yè)發(fā)展。當(dāng)前,人工智能與虛擬現(xiàn)實(shí)技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢(shì),兩者有著天然的聯(lián)系,已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢(shì)。人工智能對(duì)虛擬現(xiàn)實(shí)的賦能作用體現(xiàn)在三個(gè)方面:一是虛擬對(duì)象智能化,虛擬人的智能行為將更多地出現(xiàn)在各種虛擬環(huán)境和虛擬現(xiàn)實(shí)應(yīng)用中;二是交互方式智能化,智能交互將綜合視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)等感知通道,帶來(lái)全新的交互體驗(yàn),讓虛擬現(xiàn)實(shí)真正“化虛為實(shí)”;三是虛擬現(xiàn)實(shí)內(nèi)容研發(fā)與生產(chǎn)智能化,人工智能將提升虛擬現(xiàn)實(shí)制作工具、開(kāi)發(fā)平臺(tái)的智能化及自動(dòng)化水平,提升建模效率和虛擬現(xiàn)實(shí)內(nèi)容生產(chǎn)力。人工智能與虛擬現(xiàn)實(shí)兩種技術(shù)的融合發(fā)展將開(kāi)辟新一代信息技術(shù)產(chǎn)業(yè)新的增長(zhǎng)源泉。
智能人機(jī)交互在三方面實(shí)現(xiàn)突破
智能人機(jī)交互是虛擬現(xiàn)實(shí)的核心能力,特別是在人工智能與元宇宙結(jié)合方面,元宇宙需要更智能的人機(jī)交互突破,用戶需要在未來(lái)虛擬世界中體驗(yàn)到與真實(shí)世界一樣的工作和交流感受,因此需要人工智能在交互方面有所突破。
“在虛擬現(xiàn)實(shí)技術(shù)中,實(shí)現(xiàn)智能人機(jī)交互有三個(gè)關(guān)鍵要素——多模感知能力、深度理解能力和多維表達(dá)能力。” 劉慶峰指出,“這三個(gè)要素決定我們能聽(tīng)得懂、看得到、觸摸得到的多模感知能力,能不能在虛擬世界和真實(shí)世界中一樣有真實(shí)的感知,面對(duì)物體、人物與環(huán)境進(jìn)行深度理解,理解之后再進(jìn)行多維表達(dá),以完成我們相關(guān)的工作。”
劉慶峰介紹,在多模感知能力方面,科大訊飛的語(yǔ)音交互技術(shù)可以把聽(tīng)到的語(yǔ)音轉(zhuǎn)變?yōu)槲淖?。由于每個(gè)人聲音不一樣,它在自然世界和虛擬世界中都能通過(guò)語(yǔ)音快速感知。在今年兩會(huì)期間,34個(gè)地方代表團(tuán)全面使用了訊飛聽(tīng)見(jiàn),對(duì)兩會(huì)代表、委員發(fā)言進(jìn)行實(shí)時(shí)轉(zhuǎn)寫,記錄1476萬(wàn)字發(fā)言,平均準(zhǔn)確度達(dá)到96%,語(yǔ)音識(shí)別準(zhǔn)確度遠(yuǎn)超人工速記員。在語(yǔ)音識(shí)別和圖文識(shí)別技術(shù)上,基于科大訊飛最新的算法突破,可以實(shí)現(xiàn)文字的識(shí)別和對(duì)物體的理解,再加上圖像識(shí)別后,就可以把語(yǔ)音、手勢(shì)、肢體語(yǔ)言以及面部表情等融合在一起。當(dāng)前,以語(yǔ)音為輔,以肢體語(yǔ)言、動(dòng)作為交互的時(shí)代正在到來(lái),科大訊飛把多模態(tài)識(shí)別系統(tǒng)引入進(jìn)來(lái),在語(yǔ)音識(shí)別的基礎(chǔ)上,結(jié)合人臉識(shí)別、嘴部的唇語(yǔ)識(shí)別,把多種維度的感知結(jié)合成為多模態(tài)系統(tǒng),顯著提升復(fù)雜場(chǎng)景識(shí)別效果。
在深度理解能力方面,科大訊飛的認(rèn)知智能技術(shù)不斷突破并實(shí)現(xiàn)規(guī)模應(yīng)用。劉慶峰舉例說(shuō),科大訊飛閱讀理解系統(tǒng)在Squad比賽中的效果首次超過(guò)人類平均水平;在OpenBookQA科學(xué)知識(shí)推理挑戰(zhàn)賽中,科大訊飛單模型全球首超人類平均水平;訊飛智醫(yī)助理在國(guó)家臨床執(zhí)業(yè)醫(yī)師考試筆試中取得456分,超過(guò)96.3%的人類醫(yī)師考生,在全球首次通過(guò)測(cè)試;科大訊飛的作文評(píng)閱技術(shù)達(dá)到人工專家水平,2022年已經(jīng)服務(wù)于12個(gè)省高考作文閱卷和雅思作文閱卷。
在多維表達(dá)能力方面,劉慶峰表示,科大訊飛的語(yǔ)音合成已經(jīng)實(shí)現(xiàn)從超過(guò)普通人發(fā)音水平到高表現(xiàn)力個(gè)性化。虛擬主播已廣泛用于媒體傳播,虛擬主播在主流媒體和各類場(chǎng)景中廣泛使用??拼笥嶏w通過(guò)個(gè)性化真人捏臉系統(tǒng),可以快速實(shí)現(xiàn)虛擬人生產(chǎn)。虛擬客服、虛擬醫(yī)生、虛擬老師、虛擬員工,以及虛擬志愿者、虛擬偶像等,可以在虛擬現(xiàn)實(shí)中對(duì)人類產(chǎn)生更切實(shí)的幫助。今年,數(shù)字員工正在加速進(jìn)入到人機(jī)協(xié)同新階段,利用人工大腦,再結(jié)合IT工作流程的自動(dòng)化,可以迅速完成人們?cè)谌粘^k公和生產(chǎn)中的財(cái)務(wù)、電子合同管理、招聘等方面的工作。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》(以下簡(jiǎn)稱“報(bào)告”),該報(bào)告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來(lái)自市場(chǎng) “不確定性”因素的沖擊,市場(chǎng)…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場(chǎng)變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì),在深…