云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

2023-09-25 15:23 | 來源：芯東西

芯東西9月18日報道，9月14日-15日，2023全球AI芯片峰會（GACS 2023）在深圳市南山區(qū)圓滿舉行。開幕首日現(xiàn)場人氣十分火爆，不僅全場座無虛席，連會場大門都里三層外三層擠滿了熱情聆聽的觀眾，許多觀眾甚至站著聽完了全程。峰會全程啟動云直播，全網(wǎng)觀看人數(shù)高達153萬人次。

芯東西（公眾號：aichip001）

作者 | GACS

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

這場高規(guī)格產(chǎn)業(yè)會議由智一科技旗下芯東西聯(lián)合智猩猩發(fā)起主辦，在南山區(qū)科技創(chuàng)新局的指導(dǎo)下以“AI大時代逐鹿芯世界”為主題，設(shè)置七大板塊，主會場包括開幕式和AI芯片架構(gòu)創(chuàng)新、AI大算力芯片和高能效AI芯片三大專場，并公布2023中國AI芯片企業(yè)「先鋒企業(yè) TOP30」和「新銳企業(yè) TOP10」評選結(jié)果；分會場包括首次增設(shè)的集成電路政策交流會、AI芯片分析師論壇、智算中心算力與網(wǎng)絡(luò)高峰論壇。

本屆峰會針對行業(yè)變化，圍繞AI芯片的學術(shù)研究、GPGPU、ASIC、Chiplet、存算一體、智算中心等方向設(shè)置議程，邀請46+位嘉賓暢談生成式AI與大模型算力需求、投融資機遇、架構(gòu)創(chuàng)新、商用落地等AI芯片焦點議題。

在首日舉行的主會場上，清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍進行主題報告《再談人工智能芯片的發(fā)展》，來自英偉達、燧原科技、高通、億鑄科技、北極雄芯、AMD、奎芯科技、后摩智能、安謀科技、鯤云科技、珠海芯動力、芯至科技、每刻深思等12家國內(nèi)外頂尖AI芯片企業(yè)及新銳企業(yè)的創(chuàng)始人、技術(shù)決策者及高管分別發(fā)表主題演講，分享對AI芯片產(chǎn)業(yè)趨勢的前沿研判與最新實踐。

深圳市南?區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)代表深圳市南山區(qū)科創(chuàng)局，對峰會的召開表示熱烈祝賀，并為本屆峰會致辭。他表示，2023全球AI芯片峰會（GACS 2023）定位于集成電路與高科技產(chǎn)業(yè)政策的宣傳平臺、全球AI芯片產(chǎn)業(yè)的集聚與交流的平臺，嘉賓陣容強大，內(nèi)容豐富，并專設(shè)深圳集成電路政策交流會，對推動深圳AI芯片產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要的意義。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲深圳市南?區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常作為主辦方發(fā)表致辭，宣布智一科技深圳總部正式落戶南山區(qū)西麗湖國際科教城，智東西公開課品牌正式升級為「智猩猩」，深圳總部將承擔西麗湖國際科教城的智猩猩AI產(chǎn)業(yè)服務(wù)平臺的建設(shè)，未來希望與大灣區(qū)的企業(yè)有更多的合作。智猩猩由智東西公開課全新升級而來，定位于新科技服務(wù)平臺，聚焦人工智能與新興科技，面向企業(yè)側(cè)和用戶側(cè)提供價值服務(wù)。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常

通過峰會首日的AI芯片峰會嘉賓分享和觀點碰撞，我們探討了生成式AI與大模型帶來的算力壓力與機遇，看到了產(chǎn)學界如何通過越來越廣泛的創(chuàng)新思路來繞過摩爾定律瀕臨極限的瓶頸，見證了存算一體、可重構(gòu)計算、“算力統(tǒng)一場”等各路創(chuàng)新流派百家爭鳴。通過這場干貨滿滿的AI芯片產(chǎn)業(yè)盛宴，我們總結(jié)了以下五大趨勢：

1、生成式AI和大模型正在主導(dǎo)AI應(yīng)用，得算力者得天下，要求產(chǎn)業(yè)從芯片設(shè)計、通信、集群、軟件等多方面進行優(yōu)化AI芯片研發(fā)和落地，以實現(xiàn)更高性能、更低時延、更低成本。

2、現(xiàn)實算力資源和理想的算力資源存在鴻溝。一方面AI芯片產(chǎn)業(yè)繼續(xù)追求大算力，另一方面則通過架構(gòu)創(chuàng)新及軟件定義新方式突破算力瓶頸。

3、隨著芯片制程工藝觸碰天花板，架構(gòu)創(chuàng)新有望迎來“黃金十年”。比如感存算一體架構(gòu)有望通過破除“存儲墻”，降低海量數(shù)據(jù)搬運負擔；可重構(gòu)計算架構(gòu)通過提高芯片利用率，用設(shè)計換制程；Chiplet則通過拆分組合實現(xiàn)異構(gòu)集成，提高芯片性能，這些領(lǐng)域都已涌現(xiàn)出創(chuàng)業(yè)先行者。

4、Transformer正通過統(tǒng)一的大模型構(gòu)建一個“大樹型”的統(tǒng)一濃縮生態(tài)，解決過去多個“小樹苗”AI生態(tài)的碎片化痛點。因此AI芯片企業(yè)可以通過硬件、軟件、系統(tǒng)、方案多產(chǎn)業(yè)聯(lián)動促進AI芯片商業(yè)化落地。

5、從資本市場來看，一級市場的監(jiān)管政策客觀上會促進AI芯片產(chǎn)業(yè)資源重新配置，IPO收縮或具有短期性；二級市場出現(xiàn)的“炒作”現(xiàn)象客觀上為一級市場吸引了投資。

一、魏少軍：大模型時代再談AI芯片發(fā)展，大算力不是最終挑戰(zhàn)

本屆峰會的開場主題報告嘉賓，是AI芯片學術(shù)研究的代表人物——清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍。他引用2017年圖靈獎得主John L. Hennessy和David A. Patterson的金句“現(xiàn)在是計算機架構(gòu)的新黃金年代”，談到步入泛在計算時代，計算無處不在，對智能計算的要求越來越緊迫。

經(jīng)演變，人工智能現(xiàn)在分成了兩大類別：類腦計算和深度學習。類腦計算，即模仿人腦的計算方式。沿著類似思路，漸有起色的是存算一體，比起傳統(tǒng)存算分離架構(gòu)，可將能效提升10倍，但這種架構(gòu)目前只能模仿到人腦機制的皮毛。另一個方向是深度學習，2018年獲得圖靈獎的“深度學習三巨頭”通過神經(jīng)網(wǎng)絡(luò)不斷運算來達到計算目標，構(gòu)成了深度神經(jīng)網(wǎng)絡(luò)。這促使今天的人工智能包含三要素：算法、數(shù)據(jù)、算力。算力的挑戰(zhàn)決定了我們需要找到新的計算架構(gòu)。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍

在參加GTIC 2019全球AI芯片創(chuàng)新峰會時，魏少軍教授曾分享過一張圖，將AI芯片（AI Chip）分為三個階段：0.5階段是利用已有芯片來實現(xiàn)，1.0階段開發(fā)面向應(yīng)用的領(lǐng)域?qū)Ｓ眯酒?.5階段更強調(diào)通用性、靈活性，2.0階段的最終結(jié)論是能不能真正實現(xiàn)智能。如今再看這張圖，他認為中間應(yīng)該加個階段——AI Chip 1.7。

在他看來，大算力可能是當前面臨的最大挑戰(zhàn)，但不是最終挑戰(zhàn)。1.7階段強調(diào)的是對通用性的理解，今天AI芯片的通用性已經(jīng)被異化成大算力，計算能力成為追求目標，但它只是演進過程的中間階段。找到AI Chip 2.0階段的完全智能化，那才是我們的終極目標。

通向這一目標，需要賦予芯片自學習和接受教育的能力，以不斷提升性能和效率。他提出要尋找到一個具備軟件和硬件雙可編程的體系，即軟件定義芯片，英偉達、英特爾及一些美國頂尖科研團隊都在研究這一技術(shù)。

“中國人在這方面做的是最快的，也是最好的，我們實現(xiàn)了芯片架構(gòu)和功能的納秒級重啟。”魏教授說，基于可重構(gòu)計算架構(gòu)的軟件定義芯片，計算效率永遠是最高的，功耗和成本都大幅下降，實現(xiàn)了應(yīng)用與芯片的最優(yōu)整合。目前，其團隊已在在線編程、訓練方面實現(xiàn)了相當一部分這樣的功能。

二、ChatGPT催生算力新機遇，云邊端AI芯片熱戰(zhàn)大模型

ChatGPT掀起生成式AI熱潮后，大算力芯片迎來前所未有的發(fā)展機遇，新的挑戰(zhàn)也接踵而來。

高通AI產(chǎn)品技術(shù)中國區(qū)負責人萬衛(wèi)星分享了高通對生成式AI未來發(fā)展趨勢的觀察：隨著云端處理生成式AI的成本不斷提升，未來云經(jīng)濟將難以支撐生成式AI的規(guī)模化發(fā)展。此外，基礎(chǔ)模型正在向多模態(tài)擴展，模型能力越來越強大，而垂直領(lǐng)域模型的參數(shù)量也正在變得越來越小。未來，豐富的生成式AI模型將在終端側(cè)運行，讓大眾享受到生成式AI帶給生活、工作、娛樂上的變革。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲高通AI產(chǎn)品技術(shù)中國區(qū)負責人萬衛(wèi)星

NVIDIA解決方案與架構(gòu)技術(shù)總監(jiān)張瑞華認為：“生成式AI和大模型是人工智能目前最重要的領(lǐng)域，也是對算力資源需求最高的人工智能應(yīng)用。由于模型的訓練和推理的計算范式都發(fā)生了變革，所以現(xiàn)實算力資源和模型發(fā)展所需要的理想算力資源之間還有很大的差距。隨著用戶空間的巨量增長，還需考慮成本、實時性等問題。這是生成式AI和大模型時代所面臨的計算挑戰(zhàn)。”

接下來以大模型GPT-3 175B為例，她分享了存儲空間、計算、網(wǎng)絡(luò)通信和系統(tǒng)設(shè)計方面模型訓練的需求和計算特點，繼而提出在GPU設(shè)計、AI服務(wù)器設(shè)計和AI集群設(shè)計方面需要關(guān)注的技術(shù)熱點，并分享了NVIDIA的參考架構(gòu)。軟件生態(tài)更是AI計算中心的靈魂，NVIDIA NeMo框架為生成式AI和大模型訓練提供全生命周期的支持，TensorRT-LLM為新計算范式下的推理提供支持。張瑞華總結(jié)到：在生成式AI和大模型的時代，NVIDIA新的技術(shù)生態(tài)端到端地賦能用戶的AI旅程。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲NVIDIA解決方案與架構(gòu)技術(shù)總監(jiān)張瑞華

芯片巨頭AMD在MI Instinct GPU方面擁有大量的技術(shù)積累以及基于CDNA3的架構(gòu)創(chuàng)新。AMD人工智能事業(yè)部高級總監(jiān)王宏強談道，AMD在單個GPU能做到上千T的浮點算力規(guī)模，通過多節(jié)點橫向擴展，更是能達到每秒百億億次浮點計算能力（EFLOPS），并提供額外的超大內(nèi)存容量及帶寬，可實現(xiàn)700億參數(shù)級大模型在單個GPU上的部署，并達到更高的TCO（總擁有成本）。

王宏強也特別強調(diào)了易用AI軟件以及強大的開放軟件生態(tài)的重要性，它是釋放這些創(chuàng)新硬件性能的關(guān)鍵。AMD通過統(tǒng)一AI軟件實現(xiàn)跨平臺AI部署，以開放和模塊化的方式構(gòu)建軟件解決方案，從而擁抱更高層次的抽象，并與最重要的生態(tài)系統(tǒng)（PyTorch, ONNX, Triton HuggingFace等）合作對接推動開箱即用的用戶體驗。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲AMD人工智能事業(yè)部高級總監(jiān)王宏強

云端AI芯片獨角獸企業(yè)燧原科技也在積極備戰(zhàn)大模型算力需求。其創(chuàng)始人兼COO張亞林談道，參數(shù)量高達數(shù)千億的大模型，依賴分布式計算、更大的內(nèi)存容量和帶寬、更高算力、更實惠的成本或性價比，對AI芯片生態(tài)提出更高要求。

他打了一個形象的比喻：Transformer正通過統(tǒng)一的大模型，濃縮出一個“大樹型”的AIGC平臺生態(tài)，算力是“樹根”，大模型是“樹干”，行業(yè)模型庫是“樹枝”，應(yīng)用是“樹葉”。相比原來碎片化的CV、NLP中小模型，大模型的“大樹型”生態(tài)的算力需求更加明確和聚焦。對此，他倡導(dǎo)聯(lián)合生態(tài)伙伴，通過統(tǒng)一的大模型技術(shù)生態(tài)棧解決算力瓶頸問題。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲燧原科技創(chuàng)始人兼COO張亞林

奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽談道，大模型推理的關(guān)鍵瓶頸在于內(nèi)存帶寬，目前主流的AI大算力芯片均采用HBM作為內(nèi)存首選，采用HBM離不開先進封裝，在散熱、工藝、產(chǎn)能等方面均受到一定限制。據(jù)他分享，采用基于UCle接口的AI大算力芯片架構(gòu)可突破HBM的互聯(lián)的局限。

作為存算一體AI大算力芯片企業(yè)的代表，億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬分享道，AI應(yīng)用進入2.0時代，一大突出問題是大模型帶來巨量數(shù)據(jù)搬運，大算力芯片的競爭核心會逐漸轉(zhuǎn)向破除“存儲墻”，存算一體超異構(gòu)成為“換道超車”的可行路徑。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬

端側(cè)和邊緣側(cè)的芯片企業(yè)同樣看到大模型的機遇與需求。面向日益增長的算力需求，在邊緣和中心側(cè)，鯤云科技用可重構(gòu)數(shù)據(jù)流技術(shù)路徑來解決大模型算力需求攀升的問題，通過芯片底層架構(gòu)革新，將芯片利用率大幅提升，這種方法能滿足架構(gòu)內(nèi)海量數(shù)據(jù)的計算需求，提供高性能、高性價比、低延時的實時處理。

高通萬衛(wèi)星談道，與云端相比，終端側(cè)跑大模型擁有諸多優(yōu)勢，包括成本、能耗、可靠性、時延和性能、隱私和安全，以及個性化等。而終端側(cè)AI與云端AI相互配合的混合AI架構(gòu)，是讓生成式AI實現(xiàn)全球規(guī)?；瘮U展的關(guān)鍵。“目前我們能夠支持參數(shù)超過10億的模型在終端上運行，未來幾個月內(nèi)超過100億參數(shù)的模型將有望在終端側(cè)運行。”他分享說，高通不斷提升端側(cè)AI能力，從而提高終端支持大模型的參數(shù)閾值，讓更多云端生成式AI用例向邊緣側(cè)和端側(cè)遷移，這將真正釋放生成式AI的潛力。

安謀科技產(chǎn)品總監(jiān)楊磊也同意這一觀點，認為大模型AI的未來將在云側(cè)和端側(cè)同時發(fā)展。“由于Tranformer計算結(jié)構(gòu)趨于穩(wěn)定，微架構(gòu)廠商迎來大模型時代的創(chuàng)新契機。”安謀科技推出了本土自研AI處理器“周易”X2 NPU，不僅在算力、精度、靈活性等方面進行了大幅提升，還針對車載、邊緣計算等應(yīng)用場景進行了專門優(yōu)化。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲安謀科技產(chǎn)品總監(jiān)楊磊

端側(cè)場景更多是中小算力場景，最在乎能效比和低成本。對此，清華電子系科技成果轉(zhuǎn)化企業(yè)每刻深思的CEO鄒天琦相信“模擬計算”大有可為，基于新型存儲技術(shù)的模擬計算能夠更有效率地發(fā)揮優(yōu)勢，降低Transformer大模型在端側(cè)完成推理的能耗。

芯至科技聯(lián)合創(chuàng)始人、首席芯片架構(gòu)師兼副總裁尹文認為，AI大模型落地到推理側(cè)的新機會與RISC-V架構(gòu)創(chuàng)新不謀而合，RISC-V不僅可以做標量通用計算，也可以做線程級并行的AI計算。Scaler小標量+SIMT大算力的指令集/微架構(gòu)融合將是未來RISC-V發(fā)力的重點，能以相對低的成本，為AI推理側(cè)應(yīng)用提供高效支持。

他提到WoW （Wafer on Wafer）混合鍵合在新型芯片工程技術(shù)領(lǐng)域有重大價值。WoW可將AI Die和Memory Die垂直堆疊，以低于HBM一個量級的成本提供數(shù)倍于HBM的帶寬；對于大模型推理來說，4~6GB的Memory Die完全滿足Transformer一層網(wǎng)絡(luò)權(quán)重的存儲和層內(nèi)高帶寬需求。

三、AI芯片繁榮與資本同頻共振，新型計算技術(shù)的局限性尚存

進入生成式AI時代，資深投資人們?nèi)绾慰创鼳I芯片產(chǎn)業(yè)的發(fā)展走向？智一科技聯(lián)合創(chuàng)始人、總編輯張國仁，與普華資本管理合伙人蔣純、和利資本合伙人王馥宇、華興資本集團華興證券董事總經(jīng)理阮孝莉進行了一場以“AI芯片的繁榮與資本的同頻共振”為主題的圓桌對話。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲圓桌對話環(huán)節(jié)，從左到右依次是智一科技聯(lián)合創(chuàng)始人、總編輯張國仁，普華資本管理合伙人蔣純，和利資本合伙人王馥宇，華興資本集團華興證券董事總經(jīng)理阮孝莉

大模型參數(shù)規(guī)模激增，對算力提出巨大需求，三位投資人都談到提高芯片效率與架構(gòu)創(chuàng)新的問題。阮孝莉談到資本投入已經(jīng)跟不上算力需求，需要能夠提高“硅效率”的架構(gòu)創(chuàng)新。蔣純和王馥宇均提及新型計算技術(shù)。王馥宇認為，可重構(gòu)計算、存算一體、類腦神經(jīng)擬態(tài)計算、光子計算、量子計算等新型計算技術(shù)的終點都會是很好的，都在結(jié)合各自應(yīng)用場景的需求，一步一步解決當前工程性問題，朝前迭代與進步。

蔣純認為，美國的“小院高墻”既是中國AI芯片企業(yè)得以崛起的機會，也是中國AI芯片企業(yè)發(fā)展中最大的威脅。中國AI芯片企業(yè)還是要爭取走出“國芯國造”的路子，擺脫始終存在的仰人鼻息的風險。同時，“換道超車”也是必須考慮的路徑。以存內(nèi)計算為代表的“本征計算”、3D封裝和堆疊技術(shù)都是非常重要的換道超車手段。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲普華資本管理合伙人蔣純

阮孝莉談道，以Fabless為例，其短期會形成帶有地方產(chǎn)業(yè)特色的形態(tài)，但遵循半導(dǎo)體產(chǎn)業(yè)特性來看，終局大概率是2-3家設(shè)計公司來服務(wù)國內(nèi)市場。她認為國內(nèi)在先進制程產(chǎn)線的突破對AI芯片有直接帶動作用，創(chuàng)新架構(gòu)依賴于全產(chǎn)業(yè)鏈的成熟，有一個過程，先進制程階段性進展可以為大家獲得一些緩沖時間。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲華興資本集團華興證券董事總經(jīng)理阮孝莉

從資本市場來看，一定程度上AI芯片產(chǎn)業(yè)、還有創(chuàng)新創(chuàng)業(yè)在一級市場和二級市場已經(jīng)形成比較好的同頻共振效應(yīng)。蔣純和阮孝莉的觀點一致，表面來看，一級市場的AI芯片創(chuàng)新創(chuàng)業(yè)氛圍與二級市場的炒作脫節(jié)。蔣純談道，雖然二級市場不乏寒武紀這樣的優(yōu)秀代表，但其就像冰山浮出海面的尖角，大量創(chuàng)新生態(tài)的企業(yè)都在二級市場水下，但是二級市場的炒作代表了全國上下的期望，可以起到“千金買馬骨”的作用。阮孝莉補充說，二級市場泡沫并不完全是壞事，蓬勃才能吸引更多資本來關(guān)注并投資。而從新的大模型背景下未來AI賽道的增長空間來看，估值繁榮也是一定程度上具有合理性。

據(jù)王馥宇分享，和利資本不會花太多精力去關(guān)注二級市場，在做創(chuàng)投時，更多關(guān)注客戶需求、市場空間、產(chǎn)品力、團隊組織力和執(zhí)行力、業(yè)績和利潤的成長情況等，因為滿足了客戶需求，才能真正創(chuàng)造價值。因此，和利資本做投資預(yù)判的參考點十分樸素——人的需求是什么，能不能通過技術(shù)和產(chǎn)品來滿足人的需求，能不能提供更高的社會生產(chǎn)力。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲和利資本合伙人王馥宇

四、創(chuàng)新架構(gòu)橫刀立馬，換道破解性能與功耗難題

面臨傳統(tǒng)馮·諾依曼體系帶來的內(nèi)存墻、功耗墻、通信墻等挑戰(zhàn)，依靠工藝技術(shù)進步來實現(xiàn)芯片性能、能效、成本等方面的改善變得愈發(fā)困難，架構(gòu)創(chuàng)新已是AI芯片面臨的一個不可回避的課題。圍繞架構(gòu)創(chuàng)新，國產(chǎn)AI芯片正從早期的百花齊放，向更深更多維的層面發(fā)展。

在峰會首日，主題演講分享的AI芯片架構(gòu)創(chuàng)新思路主要集中在兩類，一是通過縮短計算單元與存儲單元、傳感器的距離，來減少芯片內(nèi)不必要的數(shù)據(jù)傳輸所產(chǎn)生的時延和能耗；二是引入數(shù)據(jù)流驅(qū)動的可重構(gòu)計算，將硬件資源更多集中在計算上，兼具靈活性與高能效。芯至科技則提出了一種將RISC-V開源指令架構(gòu)、自研一致性總線、WoW 3DIC組合的架構(gòu)創(chuàng)新思路。

1、感存算一體：為數(shù)據(jù)搬運減負，大幅降低功耗

在大模型時代，技術(shù)“剪刀差”越來越大：算力摩爾定律終結(jié)，但數(shù)據(jù)量越來越大，算法越來越復(fù)雜，一大核心的痛點就是“存儲墻”。由于存儲和計算分離架構(gòu)，大模型開發(fā)的95%甚至更多時間花在數(shù)據(jù)搬運上，將導(dǎo)致能耗劇增和實際計算效率巨降。

億鑄科技熊大鵬認為，存算一體技術(shù)能夠從根本上解決“存儲墻”問題。面向數(shù)據(jù)中心、云計算、自動駕駛等場景，2023年8月，億鑄科技成功點亮存算一體AI大算力核心技術(shù)驗證芯片，可基于成熟工藝制程，實現(xiàn)單卡突破P級算力的極強性能與極高能效比。

后摩智能則首先瞄準汽車場景，于2023年5月推出的存算一體智駕芯片后摩鴻途H30，預(yù)計在2024年推出第二代產(chǎn)品后摩鴻途H50芯片。后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮稱，根據(jù)后摩實驗室及MLPerf公開測試結(jié)果，在ResNet50性能功耗對比上，采取12nm制程的H30相比某國際芯片巨頭的7nm同類芯片性能提升超2倍，功耗減少超50%。

陳亮談道，H30背后是后摩智能自研的IPU架構(gòu)，該架構(gòu)設(shè)計遵循“中庸之道”。如果將集中式計算架構(gòu)比作居住面積和擴展性有限的“中式庭院”，那么分布式計算架構(gòu)類似于“高層公寓”，容納性好但溝通性不足。后摩智能的IPU架構(gòu)選擇在兩者之間尋求平衡點：在計算方面，通過多核、多硬件線程實現(xiàn)計算效率與算力靈活擴展；在存儲方面，通過多級數(shù)據(jù)緩存實現(xiàn)高效數(shù)據(jù)搬運與復(fù)用；在數(shù)據(jù)傳輸方面，通過雙環(huán)拓撲專用總線實現(xiàn)靈活數(shù)據(jù)傳輸與共享。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮

與存算一體的思路類似，從清華電子系智能感知集成電路與系統(tǒng)實驗室孵化出的每刻深思，將計算部分與傳感器相連，直接用模擬數(shù)據(jù)做運算，省去ADC模數(shù)轉(zhuǎn)換過程，能夠大幅節(jié)省功耗。

每刻深思的智能感知芯片，基于創(chuàng)新的近傳感模擬計算架構(gòu)，可落地智能駕駛、VR/AR等多類應(yīng)用場景中。以汽車的哨兵模式應(yīng)用場景為例，這是一種通過硬件幫助車主在遠離車輛時監(jiān)控車輛安全的汽車模式，每刻深思的車載“感存算一體”協(xié)處理芯片能促進哨兵模式每晚耗電從5-8度下降到0.05度；待機功耗從原來的10W下降到14mW，從而大大提升用車體驗。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲每刻深思CEO鄒天琦

2、數(shù)據(jù)流驅(qū)動可重構(gòu)計算：顯著提升芯片利用率

可重構(gòu)計算架構(gòu)根據(jù)不同的應(yīng)用或算法來配置硬件資源，讓數(shù)據(jù)在計算單元之間流轉(zhuǎn)，減少了傳統(tǒng)的譯碼操作和對內(nèi)存的訪問，能夠大幅提升效率和節(jié)省功耗。除了在這一技術(shù)路線上研發(fā)十余年之久的魏少軍教授團隊外，一些AI芯片企業(yè)也已經(jīng)開始探索這一技術(shù)路線的落地商用價值。

AMD基于XDNA AI引擎的架構(gòu)創(chuàng)新，是數(shù)據(jù)流處理并行計算陣列的架構(gòu)，用于提供高速的、低延時、低功耗的實時推理?；赬DNA AI引擎的架構(gòu)構(gòu)建的Chiplet，與CPU、FPGA等構(gòu)建片上異構(gòu)計算平臺，可擴展至數(shù)據(jù)中心、端側(cè)（Ryzen AI）、邊緣/嵌入式等不同平臺來滿足多樣化的AI推理需求。

可重構(gòu)數(shù)據(jù)流架構(gòu)能并行進行數(shù)據(jù)訪問和數(shù)據(jù)計算。鯤云科技聯(lián)合創(chuàng)始人兼首席技術(shù)官蔡權(quán)雄提到一個公式：芯片的實測性能=芯片理論峰值算力x芯片利用率。而鯤云科技的可重構(gòu)數(shù)據(jù)流架構(gòu)，便是從芯片利用率找到突破點，最大化利用片上計算資源，提升芯片實測性能。相比于芯片利用率不足35%的指令集架構(gòu)，基于鯤云可重構(gòu)數(shù)據(jù)流架構(gòu)的CAISA芯片最高可實現(xiàn)95.4%的芯片利用率。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲鯤云科技聯(lián)合創(chuàng)始人兼首席技術(shù)官蔡權(quán)雄

蔡權(quán)雄說：“鯤云不追求先進制程，而是從架構(gòu)側(cè)創(chuàng)新為行業(yè)提供極致性價比AI算力。”通過自研芯片架構(gòu)CAISA 3.0和自研編譯器RainBuilder，據(jù)公開測試數(shù)據(jù)顯示，一顆28nm工藝的CAISA芯片相較于一顆16nm的GPU芯片，可實現(xiàn)最高4.12倍實測算力的提升。該芯片已實現(xiàn)量產(chǎn)和規(guī)?；涞兀瑸?0余個行業(yè)提供算力、算法、平臺一體化的AI視頻分析解決方案，成功落地1500多個智能化項目，覆蓋智慧安監(jiān)、智慧能源、工業(yè)制造等多個領(lǐng)域。

珠海芯動力專攻兼具通用性、高性能的RPP（可重構(gòu)并行處理器）架構(gòu)路徑。芯動力創(chuàng)始人&CEO李原透露說，RPP架構(gòu)是將PE陣列以流水線的方式排列，實測面積效率比可達到同類產(chǎn)品的7～10倍，能效比也超過3倍，也就是說，在相同算力下只需占用更小的芯片面積。

此外，RPP架構(gòu)還具備全方位兼容CUDA的特性，這意味著開發(fā)者可以直接使用CUDA編程語言編寫程序，無需進行復(fù)雜的代碼轉(zhuǎn)換。目前，芯動力首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8已經(jīng)流片成功，實現(xiàn)小規(guī)模量產(chǎn)。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲珠海芯動力創(chuàng)始人&CEO李原

3、重構(gòu)計算體系結(jié)構(gòu)：軟硬件全棧系統(tǒng)架構(gòu)創(chuàng)新

進入AI新時代，芯至科技尹文認為，算力創(chuàng)新不再僅僅是單個處理器微架構(gòu)和芯片工藝的創(chuàng)新，而需要軟硬件全棧的系統(tǒng)架構(gòu)全面創(chuàng)新，未來的創(chuàng)新機會來自以下方面：開放的通用指令架構(gòu)，高效的融合加速器，異構(gòu)互聯(lián)總線和芯片工程，開源算子庫、工具鏈和軟件。

基于此，芯至科技圍繞RISC-V開源指令架構(gòu)、自研一致性總線、WoW 3DIC的架構(gòu)創(chuàng)新，可以帶來10倍性價比的大模型AI推理芯片。展望更長期的未來，尹文相信基于RISC-V開源指令同構(gòu)和微架構(gòu)異構(gòu)，開源軟件工具鏈及自主一致性總線和芯片工程創(chuàng)新，未來有機會推進到算力統(tǒng)一場。算力統(tǒng)一場將更利于形成更大的自主可控軟件新生態(tài)，并符合計算架構(gòu)的原始特征，助力我國在計算體系方面換道超車。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲芯至科技聯(lián)合創(chuàng)始人、首席芯片架構(gòu)師兼副總裁尹文

五、為AI芯片錘煉精兵銳器，Chiplet助攻大算力芯片破局

隨著摩爾定律越發(fā)難以維系，如何在面臨逼近物理極限的情況下保持算力持續(xù)增長？基于先進封裝的Chiplet（芯粒）技術(shù)已成為后摩爾時代兼顧經(jīng)濟效益和提升芯片性能的一大有效路徑。

Chiplet的優(yōu)勢在于可以實現(xiàn)異構(gòu)集成。這種技術(shù)方案通過先進封裝技術(shù)將采用不同工藝制程、不同功能的各種Chiplet模塊組合到一起，能夠大幅提高大型芯片的良率，并能降低設(shè)計和制造環(huán)節(jié)的成本，同時減輕對先進制程產(chǎn)能的依賴。AMD MI300、特斯拉D1、蘋果M1 Ultra等經(jīng)典AI芯片產(chǎn)品均采用了先進的Chiplet架構(gòu)。

珠海GPGPU創(chuàng)企芯動力也十分認同Chiplet技術(shù)在產(chǎn)業(yè)發(fā)展中的價值，計劃將Chiplet和I/O Die連接形成邊緣端適合的芯片，以及使用類似技術(shù)將多顆核心進行連接，提供更高計算能力。”

今年2月，北極雄芯發(fā)布了國內(nèi)首款基于異構(gòu)Chiplet集成的智能處理芯片“啟明930”。該芯片由11塊Chiplets通過高速接口拼接而成，采用12nm工藝、2.5D封裝、全國產(chǎn)基板材料，可獨立用于AI加速卡，亦可通過D2D擴展多種功能型Side Die進行集成。

其創(chuàng)始人、清華大學交叉信息研究院助理教授馬愷聲經(jīng)常被問一個問題，能不能用兩個2N工藝的Wafer通過3D集成，做出N工藝的性能？答案是可以，用2塊14nm芯片拼出一塊7nm芯片是可能的。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲清華大學交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲

他列數(shù)了4種可能的解決方案：1）用一層晶圓做供電網(wǎng)絡(luò)解決IR drop（電源電壓降）問題；2）多層邏輯；3）內(nèi)存和邏輯混合；4）將內(nèi)存、邏輯、互聯(lián)與存儲、供電耦合到一起。

上?；ヂ?lián)IP產(chǎn)品及Chiplet產(chǎn)品供應(yīng)商奎芯科技專注于高速接口IP，同時致力于用Chiplet破解內(nèi)存墻與I/O墻。其副總裁王曉陽分享說，考慮到HBM的使用存在尺寸數(shù)量、對熱敏感、擺放方向和適配不靈活、工藝等限制，奎芯科技試圖將HBM HOST和SoC解耦，打造M2link互聯(lián)方案，將HBM和主SoC的距離拉到2.5厘米。采用這種方案，同等大小SoC可利用面積增大44%，內(nèi)存容量帶寬增長33%，最大芯片尺寸擴大2倍。

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

▲奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽

結(jié)語：產(chǎn)學研投前沿交鋒，全球AI芯片峰會沸騰深圳南山

從2018年舉辦第一屆開始，全球AI芯片峰會至今已連續(xù)舉辦五屆，成為國內(nèi)極少數(shù)專注在AI芯片領(lǐng)域且具有較大影響力的行業(yè)峰會。每一屆，你都能聽到頂級AI芯片產(chǎn)學研用及投融資領(lǐng)域?qū)＜覀兊乃枷虢讳h，多元的精彩觀點在這里碰撞，迸發(fā)出更多技術(shù)或產(chǎn)品創(chuàng)新的靈感火花。

這也是全球AI芯片峰會連續(xù)第二年落地深圳南山。據(jù)深圳市南?區(qū)科技創(chuàng)新局黨組書記、局?曹環(huán)分享，今年5月，深圳市發(fā)布推動新型人工智能高質(zhì)量發(fā)展方案，提出要聚焦通用大模型、智能算力芯片等領(lǐng)域，實施人工智能科技重大專項扶持計劃，推動AI產(chǎn)業(yè)高質(zhì)量發(fā)展。

當前，南山區(qū)正大力推動集成電路產(chǎn)業(yè)高質(zhì)量發(fā)展，已發(fā)布集成電路產(chǎn)業(yè)專項政策，在人才、研發(fā)、融資等方面大力支持芯片企業(yè)發(fā)展，先后落地了國家集成電路設(shè)計深圳產(chǎn)業(yè)化基地、粵港澳大灣區(qū)集成電路設(shè)計創(chuàng)新公共平臺等創(chuàng)新載體，集聚了英特爾、江波龍、中微半導(dǎo)等一批行業(yè)龍頭企業(yè)，芯片領(lǐng)域上游設(shè)計能力突出，下游應(yīng)用場景廣泛，成為了半導(dǎo)體精英企業(yè)聚集高地。

“接下來，南山區(qū)將認真做好服務(wù)，為更多業(yè)內(nèi)企業(yè)、優(yōu)秀人才提供更全面的政策指引和服務(wù)。”曹環(huán)談道，“我們也誠摯邀請廣大企業(yè)家、投資人和創(chuàng)業(yè)者朋友們，選擇南山、投資南山、扎根南山，在南山這片創(chuàng)新與創(chuàng)業(yè)的熱土，展現(xiàn)創(chuàng)新實力、開拓創(chuàng)新事業(yè)、實現(xiàn)創(chuàng)新夢想。”

9月15日，2023全球AI芯片峰會舉行的AI大算力芯片專場、高能效AI芯片專場，繼續(xù)帶來了更多攻克AI芯片技術(shù)壁壘和落地難關(guān)的思想碰撞，并公布2023年度「中國AI芯片企業(yè)」評選結(jié)果。芯東西將陸續(xù)輸出新鮮的干貨圖文，并放送多個精彩主題演講的圖文速記整理，具體請關(guān)注芯東西與智東西公眾號推送內(nèi)容。

THE END

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

相關(guān)閱讀

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！海康威視發(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
思特威推出4MP智能安防應(yīng)用圖像傳感器升級新品SC4336H
視頻監(jiān)控殺出合規(guī)黑馬：爍博科技靠的竟是這臺 "全能戰(zhàn)士"
大華股份與京東工業(yè)簽署戰(zhàn)略合作協(xié)議
犀靈視覺完成數(shù)千萬元Pre-A輪融資，盈富泰克投資
一文讀懂熵基科技全球三大智造基地

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨

云邊端AI芯片熱戰(zhàn)大模型！2023全球AI芯片峰會首日干貨