科大訊飛董事長劉慶峰：人工智能與VR結(jié)合具有源頭相關性

2022-11-13 11:31 來源:中國電子報

11月12日，由工業(yè)和信息化部、江西省人民政府共同主辦的2022世界VR產(chǎn)業(yè)大會在南昌開幕。在開幕演講中，科大訊飛股份有限公司董事長劉慶峰在題為“以人工智能賦能虛擬現(xiàn)實產(chǎn)業(yè)”的演講中表示，當前，人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢，兩者有著天然的聯(lián)系，已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢。

人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢

“人工智能與虛擬現(xiàn)實的結(jié)合具有天然的源頭相關性。數(shù)字經(jīng)濟是未來經(jīng)濟的重要引擎，虛擬和現(xiàn)實結(jié)合、線上和線下相結(jié)合是數(shù)字經(jīng)濟發(fā)展的大勢所趨。”劉慶峰認為，人工智能可以為虛擬現(xiàn)實深度賦能，智能運算讓機器運算能力和存儲力遠超人類，感知讓計算機能看會說，像人一樣自動交流，讓機器具備認知的能力，能理解、會思考，具備學習推理和決策的能力。

在劉慶峰看來，人工智能技術(shù)是虛擬現(xiàn)實的重要支撐，助力虛擬現(xiàn)實產(chǎn)業(yè)發(fā)展。當前，人工智能與虛擬現(xiàn)實技術(shù)呈現(xiàn)融合發(fā)展態(tài)勢，兩者有著天然的聯(lián)系，已經(jīng)呈現(xiàn)出你中有我、我中有你的趨勢。人工智能對虛擬現(xiàn)實的賦能作用體現(xiàn)在三個方面：一是虛擬對象智能化，虛擬人的智能行為將更多地出現(xiàn)在各種虛擬環(huán)境和虛擬現(xiàn)實應用中；二是交互方式智能化，智能交互將綜合視覺、聽覺、嗅覺等感知通道，帶來全新的交互體驗，讓虛擬現(xiàn)實真正“化虛為實”；三是虛擬現(xiàn)實內(nèi)容研發(fā)與生產(chǎn)智能化，人工智能將提升虛擬現(xiàn)實制作工具、開發(fā)平臺的智能化及自動化水平，提升建模效率和虛擬現(xiàn)實內(nèi)容生產(chǎn)力。人工智能與虛擬現(xiàn)實兩種技術(shù)的融合發(fā)展將開辟新一代信息技術(shù)產(chǎn)業(yè)新的增長源泉。

智能人機交互在三方面實現(xiàn)突破

智能人機交互是虛擬現(xiàn)實的核心能力，特別是在人工智能與元宇宙結(jié)合方面，元宇宙需要更智能的人機交互突破，用戶需要在未來虛擬世界中體驗到與真實世界一樣的工作和交流感受，因此需要人工智能在交互方面有所突破。

“在虛擬現(xiàn)實技術(shù)中，實現(xiàn)智能人機交互有三個關鍵要素——多模感知能力、深度理解能力和多維表達能力。” 劉慶峰指出，“這三個要素決定我們能聽得懂、看得到、觸摸得到的多模感知能力，能不能在虛擬世界和真實世界中一樣有真實的感知，面對物體、人物與環(huán)境進行深度理解，理解之后再進行多維表達，以完成我們相關的工作。”

劉慶峰介紹，在多模感知能力方面，科大訊飛的語音交互技術(shù)可以把聽到的語音轉(zhuǎn)變?yōu)槲淖?。由于每個人聲音不一樣，它在自然世界和虛擬世界中都能通過語音快速感知。在今年兩會期間，34個地方代表團全面使用了訊飛聽見，對兩會代表、委員發(fā)言進行實時轉(zhuǎn)寫，記錄1476萬字發(fā)言，平均準確度達到96%，語音識別準確度遠超人工速記員。在語音識別和圖文識別技術(shù)上，基于科大訊飛最新的算法突破，可以實現(xiàn)文字的識別和對物體的理解，再加上圖像識別后，就可以把語音、手勢、肢體語言以及面部表情等融合在一起。當前，以語音為輔，以肢體語言、動作為交互的時代正在到來，科大訊飛把多模態(tài)識別系統(tǒng)引入進來，在語音識別的基礎上，結(jié)合人臉識別、嘴部的唇語識別，把多種維度的感知結(jié)合成為多模態(tài)系統(tǒng)，顯著提升復雜場景識別效果。

在深度理解能力方面，科大訊飛的認知智能技術(shù)不斷突破并實現(xiàn)規(guī)模應用。劉慶峰舉例說，科大訊飛閱讀理解系統(tǒng)在Squad比賽中的效果首次超過人類平均水平；在OpenBookQA科學知識推理挑戰(zhàn)賽中，科大訊飛單模型全球首超人類平均水平；訊飛智醫(yī)助理在國家臨床執(zhí)業(yè)醫(yī)師考試筆試中取得456分，超過96.3%的人類醫(yī)師考生，在全球首次通過測試；科大訊飛的作文評閱技術(shù)達到人工專家水平，2022年已經(jīng)服務于12個省高考作文閱卷和雅思作文閱卷。

在多維表達能力方面，劉慶峰表示，科大訊飛的語音合成已經(jīng)實現(xiàn)從超過普通人發(fā)音水平到高表現(xiàn)力個性化。虛擬主播已廣泛用于媒體傳播，虛擬主播在主流媒體和各類場景中廣泛使用?？拼笥嶏w通過個性化真人捏臉系統(tǒng)，可以快速實現(xiàn)虛擬人生產(chǎn)。虛擬客服、虛擬醫(yī)生、虛擬老師、虛擬員工，以及虛擬志愿者、虛擬偶像等，可以在虛擬現(xiàn)實中對人類產(chǎn)生更切實的幫助。今年，數(shù)字員工正在加速進入到人機協(xié)同新階段，利用人工大腦，再結(jié)合IT工作流程的自動化，可以迅速完成人們在日常辦公和生產(chǎn)中的財務、電子合同管理、招聘等方面的工作。

THE END

責任編輯：趙龍

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關閱讀

展會預告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，海康威視基于觀瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務之舟，在市場變革中逆風飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預案中針對特定突發(fā)情況的模擬處置演練…
應用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領行業(yè)再躍遷