11月12日,由工業(yè)和信息化部、江西省人民政府共同主辦的2022世界VR產(chǎn)業(yè)大會在南昌開幕。在開幕演講中,科大訊飛股份有限公司董事長劉慶峰在題為“以人工智能賦能虛擬現(xiàn)實產(chǎn)業(yè)”的演講中表示,當前,人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢,兩者有著天然的聯(lián)系,已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢。
人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢
“人工智能與虛擬現(xiàn)實的結(jié)合具有天然的源頭相關性。數(shù)字經(jīng)濟是未來經(jīng)濟的重要引擎,虛擬和現(xiàn)實結(jié)合、線上和線下相結(jié)合是數(shù)字經(jīng)濟發(fā)展的大勢所趨。”劉慶峰認為,人工智能可以為虛擬現(xiàn)實深度賦能,智能運算讓機器運算能力和存儲力遠超人類,感知讓計算機能看會說,像人一樣自動交流,讓機器具備認知的能力,能理解、會思考,具備學習推理和決策的能力。
在劉慶峰看來,人工智能技術(shù)是虛擬現(xiàn)實的重要支撐,助力虛擬現(xiàn)實產(chǎn)業(yè)發(fā)展。當前,人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢,兩者有著天然的聯(lián)系,已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢。人工智能對虛擬現(xiàn)實的賦能作用體現(xiàn)在三個方面:一是虛擬對象智能化,虛擬人的智能行為將更多地出現(xiàn)在各種虛擬環(huán)境和虛擬現(xiàn)實應用中;二是交互方式智能化,智能交互將綜合視覺、聽覺、嗅覺等感知通道,帶來全新的交互體驗,讓虛擬現(xiàn)實真正“化虛為實”;三是虛擬現(xiàn)實內(nèi)容研發(fā)與生產(chǎn)智能化,人工智能將提升虛擬現(xiàn)實制作工具、開發(fā)平臺的智能化及自動化水平,提升建模效率和虛擬現(xiàn)實內(nèi)容生產(chǎn)力。人工智能與虛擬現(xiàn)實兩種技術(shù)的融合發(fā)展將開辟新一代信息技術(shù)產(chǎn)業(yè)新的增長源泉。
智能人機交互在三方面實現(xiàn)突破
智能人機交互是虛擬現(xiàn)實的核心能力,特別是在人工智能與元宇宙結(jié)合方面,元宇宙需要更智能的人機交互突破,用戶需要在未來虛擬世界中體驗到與真實世界一樣的工作和交流感受,因此需要人工智能在交互方面有所突破。
“在虛擬現(xiàn)實技術(shù)中,實現(xiàn)智能人機交互有三個關鍵要素——多模感知能力、深度理解能力和多維表達能力。” 劉慶峰指出,“這三個要素決定我們能聽得懂、看得到、觸摸得到的多模感知能力,能不能在虛擬世界和真實世界中一樣有真實的感知,面對物體、人物與環(huán)境進行深度理解,理解之后再進行多維表達,以完成我們相關的工作。”
劉慶峰介紹,在多模感知能力方面,科大訊飛的語音交互技術(shù)可以把聽到的語音轉(zhuǎn)變?yōu)槲淖?。由于每個人聲音不一樣,它在自然世界和虛擬世界中都能通過語音快速感知。在今年兩會期間,34個地方代表團全面使用了訊飛聽見,對兩會代表、委員發(fā)言進行實時轉(zhuǎn)寫,記錄1476萬字發(fā)言,平均準確度達到96%,語音識別準確度遠超人工速記員。在語音識別和圖文識別技術(shù)上,基于科大訊飛最新的算法突破,可以實現(xiàn)文字的識別和對物體的理解,再加上圖像識別后,就可以把語音、手勢、肢體語言以及面部表情等融合在一起。當前,以語音為輔,以肢體語言、動作為交互的時代正在到來,科大訊飛把多模態(tài)識別系統(tǒng)引入進來,在語音識別的基礎上,結(jié)合人臉識別、嘴部的唇語識別,把多種維度的感知結(jié)合成為多模態(tài)系統(tǒng),顯著提升復雜場景識別效果。
在深度理解能力方面,科大訊飛的認知智能技術(shù)不斷突破并實現(xiàn)規(guī)模應用。劉慶峰舉例說,科大訊飛閱讀理解系統(tǒng)在Squad比賽中的效果首次超過人類平均水平;在OpenBookQA科學知識推理挑戰(zhàn)賽中,科大訊飛單模型全球首超人類平均水平;訊飛智醫(yī)助理在國家臨床執(zhí)業(yè)醫(yī)師考試筆試中取得456分,超過96.3%的人類醫(yī)師考生,在全球首次通過測試;科大訊飛的作文評閱技術(shù)達到人工專家水平,2022年已經(jīng)服務于12個省高考作文閱卷和雅思作文閱卷。
在多維表達能力方面,劉慶峰表示,科大訊飛的語音合成已經(jīng)實現(xiàn)從超過普通人發(fā)音水平到高表現(xiàn)力個性化。虛擬主播已廣泛用于媒體傳播,虛擬主播在主流媒體和各類場景中廣泛使用??拼笥嶏w通過個性化真人捏臉系統(tǒng),可以快速實現(xiàn)虛擬人生產(chǎn)。虛擬客服、虛擬醫(yī)生、虛擬老師、虛擬員工,以及虛擬志愿者、虛擬偶像等,可以在虛擬現(xiàn)實中對人類產(chǎn)生更切實的幫助。今年,數(shù)字員工正在加速進入到人機協(xié)同新階段,利用人工大腦,再結(jié)合IT工作流程的自動化,可以迅速完成人們在日常辦公和生產(chǎn)中的財務、電子合同管理、招聘等方面的工作。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…