一区二区三区A片|Av不卡高清网址|精品久久不卡一本|一区二区三区绿色|五月黄色婷婷久久|综合 另类 一区|亚洲成人VA视频|久久国产特黄大片|成人无码激情亚洲|黄色字幕网址大全

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

芯東西9月18日報道,9月14日-15日,2023全球AI芯片峰會(GACS 2023)在深圳市南山區(qū)圓滿舉行。開幕首日現(xiàn)場人氣十分火爆,不僅全場座無虛席,連會場大門都里三層外三層擠滿了熱情聆聽的觀眾,許多觀眾甚至站著聽完了全程。峰會全程啟動云直播,全網(wǎng)觀看人數(shù)高達153萬人次。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

芯東西(公眾號:aichip001)

作者 | GACS

芯東西9月18日報道,9月14日-15日,2023全球AI芯片峰會(GACS 2023)在深圳市南山區(qū)圓滿舉行。開幕首日現(xiàn)場人氣十分火爆,不僅全場座無虛席,連會場大門都里三層外三層擠滿了熱情聆聽的觀眾,許多觀眾甚至站著聽完了全程。峰會全程啟動云直播,全網(wǎng)觀看人數(shù)高達153萬人次。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

這場高規(guī)格產(chǎn)業(yè)會議由智一科技旗下芯東西聯(lián)合智猩猩發(fā)起主辦,在南山區(qū)科技創(chuàng)新局的指導(dǎo)下以“AI大時代 逐鹿芯世界”為主題,設(shè)置七大板塊,主會場包括開幕式和AI芯片架構(gòu)創(chuàng)新、AI大算力芯片和高能效AI芯片三大專場,并公布2023中國AI芯片企業(yè)「先鋒企業(yè) TOP30」和「新銳企業(yè) TOP10」評選結(jié)果;分會場包括首次增設(shè)的集成電路政策交流會、AI芯片分析師論壇、智算中心算力與網(wǎng)絡(luò)高峰論壇。

本屆峰會針對行業(yè)變化,圍繞AI芯片的學術(shù)研究、GPGPU、ASIC、Chiplet、存算一體、智算中心等方向設(shè)置議程,邀請46+位嘉賓暢談生成式AI與大模型算力需求、投融資機遇、架構(gòu)創(chuàng)新、商用落地等AI芯片焦點議題。

在首日舉行的主會場上,清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍進行主題報告《再談人工智能芯片的發(fā)展》,來自英偉達、燧原科技、高通、億鑄科技、北極雄芯、AMD、奎芯科技、后摩智能、安謀科技、鯤云科技、珠海芯動力、芯至科技、每刻深思等12家國內(nèi)外頂尖AI芯片企業(yè)及新銳企業(yè)的創(chuàng)始人、技術(shù)決策者及高管分別發(fā)表主題演講,分享對AI芯片產(chǎn)業(yè)趨勢的前沿研判與最新實踐。

深圳市南?區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)代表深圳市南山區(qū)科創(chuàng)局,對峰會的召開表示熱烈祝賀,并為本屆峰會致辭。他表示,2023全球AI芯片峰會(GACS 2023)定位于集成電路與高科技產(chǎn)業(yè)政策的宣傳平臺、全球AI芯片產(chǎn)業(yè)的集聚與交流的平臺,嘉賓陣容強大,內(nèi)容豐富,并專設(shè)深圳集成電路政策交流會,對推動深圳AI芯片產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要的意義。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲深圳市南?區(qū)科技創(chuàng)新局黨組書記、局長曹環(huán)

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常作為主辦方發(fā)表致辭,宣布智一科技深圳總部正式落戶南山區(qū)西麗湖國際科教城,智東西公開課品牌正式升級為「智猩猩」,深圳總部將承擔西麗湖國際科教城的智猩猩AI產(chǎn)業(yè)服務(wù)平臺的建設(shè),未來希望與大灣區(qū)的企業(yè)有更多的合作。智猩猩由智東西公開課全新升級而來,定位于新科技服務(wù)平臺,聚焦人工智能與新興科技,面向企業(yè)側(cè)和用戶側(cè)提供價值服務(wù)。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常

通過峰會首日的AI芯片峰會嘉賓分享和觀點碰撞,我們探討了生成式AI與大模型帶來的算力壓力與機遇,看到了產(chǎn)學界如何通過越來越廣泛的創(chuàng)新思路來繞過摩爾定律瀕臨極限的瓶頸,見證了存算一體、可重構(gòu)計算、“算力統(tǒng)一場”等各路創(chuàng)新流派百家爭鳴。通過這場干貨滿滿的AI芯片產(chǎn)業(yè)盛宴,我們總結(jié)了以下五大趨勢:

1、生成式AI和大模型正在主導(dǎo)AI應(yīng)用,得算力者得天下,要求產(chǎn)業(yè)從芯片設(shè)計、通信、集群、軟件等多方面進行優(yōu)化AI芯片研發(fā)和落地,以實現(xiàn)更高性能、更低時延、更低成本。

2、現(xiàn)實算力資源和理想的算力資源存在鴻溝。一方面AI芯片產(chǎn)業(yè)繼續(xù)追求大算力,另一方面則通過架構(gòu)創(chuàng)新及軟件定義新方式突破算力瓶頸。

3、隨著芯片制程工藝觸碰天花板,架構(gòu)創(chuàng)新有望迎來“黃金十年”。比如感存算一體架構(gòu)有望通過破除“存儲墻”,降低海量數(shù)據(jù)搬運負擔;可重構(gòu)計算架構(gòu)通過提高芯片利用率,用設(shè)計換制程;Chiplet則通過拆分組合實現(xiàn)異構(gòu)集成,提高芯片性能,這些領(lǐng)域都已涌現(xiàn)出創(chuàng)業(yè)先行者。

4、Transformer正通過統(tǒng)一的大模型構(gòu)建一個“大樹型”的統(tǒng)一濃縮生態(tài),解決過去多個“小樹苗”AI生態(tài)的碎片化痛點。因此AI芯片企業(yè)可以通過硬件、軟件、系統(tǒng)、方案多產(chǎn)業(yè)聯(lián)動促進AI芯片商業(yè)化落地。

5、從資本市場來看,一級市場的監(jiān)管政策客觀上會促進AI芯片產(chǎn)業(yè)資源重新配置,IPO收縮或具有短期性;二級市場出現(xiàn)的“炒作”現(xiàn)象客觀上為一級市場吸引了投資。

一、魏少軍:大模型時代再談AI芯片發(fā)展,大算力不是最終挑戰(zhàn)

本屆峰會的開場主題報告嘉賓,是AI芯片學術(shù)研究的代表人物——清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍。他引用2017年圖靈獎得主John L. Hennessy和David A. Patterson的金句“現(xiàn)在是計算機架構(gòu)的新黃金年代”,談到步入泛在計算時代,計算無處不在,對智能計算的要求越來越緊迫。

經(jīng)演變,人工智能現(xiàn)在分成了兩大類別:類腦計算深度學習。類腦計算,即模仿人腦的計算方式。沿著類似思路,漸有起色的是存算一體,比起傳統(tǒng)存算分離架構(gòu),可將能效提升10倍,但這種架構(gòu)目前只能模仿到人腦機制的皮毛。另一個方向是深度學習,2018年獲得圖靈獎的“深度學習三巨頭”通過神經(jīng)網(wǎng)絡(luò)不斷運算來達到計算目標,構(gòu)成了深度神經(jīng)網(wǎng)絡(luò)。這促使今天的人工智能包含三要素:算法、數(shù)據(jù)、算力。算力的挑戰(zhàn)決定了我們需要找到新的計算架構(gòu)。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲清華大學教授、中國半導(dǎo)體行業(yè)協(xié)會副理事長、IEEE Fellow魏少軍

在參加GTIC 2019全球AI芯片創(chuàng)新峰會時,魏少軍教授曾分享過一張圖,將AI芯片(AI Chip)分為三個階段:0.5階段是利用已有芯片來實現(xiàn),1.0階段開發(fā)面向應(yīng)用的領(lǐng)域?qū)S眯酒?.5階段更強調(diào)通用性、靈活性,2.0階段的最終結(jié)論是能不能真正實現(xiàn)智能。如今再看這張圖,他認為中間應(yīng)該加個階段——AI Chip 1.7

在他看來,大算力可能是當前面臨的最大挑戰(zhàn),但不是最終挑戰(zhàn)。1.7階段強調(diào)的是對通用性的理解,今天AI芯片的通用性已經(jīng)被異化成大算力,計算能力成為追求目標,但它只是演進過程的中間階段。找到AI Chip 2.0階段的完全智能化,那才是我們的終極目標。

通向這一目標,需要賦予芯片自學習和接受教育的能力,以不斷提升性能和效率。他提出要尋找到一個具備軟件和硬件雙可編程的體系,即軟件定義芯片,英偉達、英特爾及一些美國頂尖科研團隊都在研究這一技術(shù)。

“中國人在這方面做的是最快的,也是最好的,我們實現(xiàn)了芯片架構(gòu)和功能的納秒級重啟。”魏教授說,基于可重構(gòu)計算架構(gòu)的軟件定義芯片,計算效率永遠是最高的,功耗和成本都大幅下降,實現(xiàn)了應(yīng)用與芯片的最優(yōu)整合。目前,其團隊已在在線編程、訓練方面實現(xiàn)了相當一部分這樣的功能。

二、ChatGPT催生算力新機遇,云邊端AI芯片熱戰(zhàn)大模型

ChatGPT掀起生成式AI熱潮后,大算力芯片迎來前所未有的發(fā)展機遇,新的挑戰(zhàn)也接踵而來。

高通AI產(chǎn)品技術(shù)中國區(qū)負責人萬衛(wèi)星分享了高通對生成式AI未來發(fā)展趨勢的觀察:隨著云端處理生成式AI的成本不斷提升,未來云經(jīng)濟將難以支撐生成式AI的規(guī)模化發(fā)展。此外,基礎(chǔ)模型正在向多模態(tài)擴展,模型能力越來越強大,而垂直領(lǐng)域模型的參數(shù)量也正在變得越來越小。未來,豐富的生成式AI模型將在終端側(cè)運行,讓大眾享受到生成式AI帶給生活、工作、娛樂上的變革。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲高通AI產(chǎn)品技術(shù)中國區(qū)負責人萬衛(wèi)星

NVIDIA解決方案與架構(gòu)技術(shù)總監(jiān)張瑞華認為:“生成式AI和大模型是人工智能目前最重要的領(lǐng)域,也是對算力資源需求最高的人工智能應(yīng)用。由于模型的訓練和推理的計算范式都發(fā)生了變革,所以現(xiàn)實算力資源和模型發(fā)展所需要的理想算力資源之間還有很大的差距。隨著用戶空間的巨量增長,還需考慮成本、實時性等問題。這是生成式AI和大模型時代所面臨的計算挑戰(zhàn)。”

接下來以大模型GPT-3 175B為例,她分享了存儲空間、計算、網(wǎng)絡(luò)通信和系統(tǒng)設(shè)計方面模型訓練的需求和計算特點,繼而提出在GPU設(shè)計、AI服務(wù)器設(shè)計和AI集群設(shè)計方面需要關(guān)注的技術(shù)熱點,并分享了NVIDIA的參考架構(gòu)。軟件生態(tài)更是AI計算中心的靈魂,NVIDIA NeMo框架為生成式AI和大模型訓練提供全生命周期的支持,TensorRT-LLM為新計算范式下的推理提供支持。張瑞華總結(jié)到:在生成式AI和大模型的時代,NVIDIA新的技術(shù)生態(tài)端到端地賦能用戶的AI旅程。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲NVIDIA解決方案與架構(gòu)技術(shù)總監(jiān)張瑞華

芯片巨頭AMD在MI Instinct GPU方面擁有大量的技術(shù)積累以及基于CDNA3的架構(gòu)創(chuàng)新。AMD人工智能事業(yè)部高級總監(jiān)王宏強談道,AMD在單個GPU能做到上千T的浮點算力規(guī)模,通過多節(jié)點橫向擴展,更是能達到每秒百億億次浮點計算能力(EFLOPS),并提供額外的超大內(nèi)存容量及帶寬,可實現(xiàn)700億參數(shù)級大模型在單個GPU上的部署,并達到更高的TCO(總擁有成本)。

王宏強也特別強調(diào)了易用AI軟件以及強大的開放軟件生態(tài)的重要性,它是釋放這些創(chuàng)新硬件性能的關(guān)鍵。AMD通過統(tǒng)一AI軟件實現(xiàn)跨平臺AI部署,以開放和模塊化的方式構(gòu)建軟件解決方案,從而擁抱更高層次的抽象,并與最重要的生態(tài)系統(tǒng)(PyTorch, ONNX, Triton HuggingFace等)合作對接推動開箱即用的用戶體驗。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲AMD人工智能事業(yè)部高級總監(jiān)王宏強

云端AI芯片獨角獸企業(yè)燧原科技也在積極備戰(zhàn)大模型算力需求。其創(chuàng)始人兼COO張亞林談道,參數(shù)量高達數(shù)千億的大模型,依賴分布式計算、更大的內(nèi)存容量和帶寬、更高算力、更實惠的成本或性價比,對AI芯片生態(tài)提出更高要求。

他打了一個形象的比喻:Transformer正通過統(tǒng)一的大模型,濃縮出一個“大樹型”的AIGC平臺生態(tài),算力是“樹根”,大模型是“樹干”,行業(yè)模型庫是“樹枝”,應(yīng)用是“樹葉”。相比原來碎片化的CV、NLP中小模型,大模型的“大樹型”生態(tài)的算力需求更加明確和聚焦。對此,他倡導(dǎo)聯(lián)合生態(tài)伙伴,通過統(tǒng)一的大模型技術(shù)生態(tài)棧解決算力瓶頸問題。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲燧原科技創(chuàng)始人兼COO張亞林

奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽談道,大模型推理的關(guān)鍵瓶頸在于內(nèi)存帶寬,目前主流的AI大算力芯片均采用HBM作為內(nèi)存首選,采用HBM離不開先進封裝,在散熱、工藝、產(chǎn)能等方面均受到一定限制。據(jù)他分享,采用基于UCle接口的AI大算力芯片架構(gòu)可突破HBM的互聯(lián)的局限。

作為存算一體AI大算力芯片企業(yè)的代表,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬分享道,AI應(yīng)用進入2.0時代, 一大突出問題是大模型帶來巨量數(shù)據(jù)搬運,大算力芯片的競爭核心會逐漸轉(zhuǎn)向破除“存儲墻”,存算一體超異構(gòu)成為“換道超車”的可行路徑。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬

端側(cè)和邊緣側(cè)的芯片企業(yè)同樣看到大模型的機遇與需求。面向日益增長的算力需求,在邊緣和中心側(cè),鯤云科技用可重構(gòu)數(shù)據(jù)流技術(shù)路徑來解決大模型算力需求攀升的問題,通過芯片底層架構(gòu)革新,將芯片利用率大幅提升,這種方法能滿足架構(gòu)內(nèi)海量數(shù)據(jù)的計算需求,提供高性能、高性價比、低延時的實時處理。

高通萬衛(wèi)星談道,與云端相比,終端側(cè)跑大模型擁有諸多優(yōu)勢,包括成本、能耗、可靠性、時延和性能、隱私和安全,以及個性化等。而終端側(cè)AI與云端AI相互配合的混合AI架構(gòu),是讓生成式AI實現(xiàn)全球規(guī)?;瘮U展的關(guān)鍵。“目前我們能夠支持參數(shù)超過10億的模型在終端上運行,未來幾個月內(nèi)超過100億參數(shù)的模型將有望在終端側(cè)運行。”他分享說,高通不斷提升端側(cè)AI能力,從而提高終端支持大模型的參數(shù)閾值,讓更多云端生成式AI用例向邊緣側(cè)和端側(cè)遷移,這將真正釋放生成式AI的潛力。

安謀科技產(chǎn)品總監(jiān)楊磊也同意這一觀點,認為大模型AI的未來將在云側(cè)和端側(cè)同時發(fā)展。“由于Tranformer計算結(jié)構(gòu)趨于穩(wěn)定,微架構(gòu)廠商迎來大模型時代的創(chuàng)新契機。”安謀科技推出了本土自研AI處理器“周易”X2 NPU,不僅在算力、精度、靈活性等方面進行了大幅提升,還針對車載、邊緣計算等應(yīng)用場景進行了專門優(yōu)化。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲安謀科技產(chǎn)品總監(jiān)楊磊

端側(cè)場景更多是中小算力場景,最在乎能效比和低成本。對此,清華電子系科技成果轉(zhuǎn)化企業(yè)每刻深思的CEO鄒天琦相信“模擬計算”大有可為,基于新型存儲技術(shù)的模擬計算能夠更有效率地發(fā)揮優(yōu)勢,降低Transformer大模型在端側(cè)完成推理的能耗。

芯至科技聯(lián)合創(chuàng)始人、首席芯片架構(gòu)師兼副總裁尹文認為,AI大模型落地到推理側(cè)的新機會與RISC-V架構(gòu)創(chuàng)新不謀而合,RISC-V不僅可以做標量通用計算,也可以做線程級并行的AI計算。Scaler小標量+SIMT大算力的指令集/微架構(gòu)融合將是未來RISC-V發(fā)力的重點,能以相對低的成本,為AI推理側(cè)應(yīng)用提供高效支持。

他提到WoW (Wafer on Wafer)混合鍵合在新型芯片工程技術(shù)領(lǐng)域有重大價值。WoW可將AI Die和Memory Die垂直堆疊,以低于HBM一個量級的成本提供數(shù)倍于HBM的帶寬;對于大模型推理來說,4~6GB的Memory Die完全滿足Transformer一層網(wǎng)絡(luò)權(quán)重的存儲和層內(nèi)高帶寬需求。

三、AI芯片繁榮與資本同頻共振,新型計算技術(shù)的局限性尚存

進入生成式AI時代,資深投資人們?nèi)绾慰创鼳I芯片產(chǎn)業(yè)的發(fā)展走向?智一科技聯(lián)合創(chuàng)始人、總編輯張國仁,與普華資本管理合伙人蔣純、和利資本合伙人王馥宇、華興資本集團華興證券董事總經(jīng)理阮孝莉進行了一場以“AI芯片的繁榮與資本的同頻共振”為主題的圓桌對話。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲圓桌對話環(huán)節(jié),從左到右依次是智一科技聯(lián)合創(chuàng)始人、總編輯張國仁,普華資本管理合伙人蔣純,和利資本合伙人王馥宇,華興資本集團華興證券董事總經(jīng)理阮孝莉

大模型參數(shù)規(guī)模激增,對算力提出巨大需求,三位投資人都談到提高芯片效率與架構(gòu)創(chuàng)新的問題。阮孝莉談到資本投入已經(jīng)跟不上算力需求,需要能夠提高“硅效率”的架構(gòu)創(chuàng)新。蔣純和王馥宇均提及新型計算技術(shù)。王馥宇認為,可重構(gòu)計算、存算一體、類腦神經(jīng)擬態(tài)計算、光子計算、量子計算等新型計算技術(shù)的終點都會是很好的,都在結(jié)合各自應(yīng)用場景的需求,一步一步解決當前工程性問題,朝前迭代與進步。

蔣純認為,美國的“小院高墻”既是中國AI芯片企業(yè)得以崛起的機會,也是中國AI芯片企業(yè)發(fā)展中最大的威脅。中國AI芯片企業(yè)還是要爭取走出“國芯國造”的路子,擺脫始終存在的仰人鼻息的風險。同時,“換道超車”也是必須考慮的路徑。以存內(nèi)計算為代表的“本征計算”、3D封裝和堆疊技術(shù)都是非常重要的換道超車手段。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲普華資本管理合伙人蔣純

阮孝莉談道,以Fabless為例,其短期會形成帶有地方產(chǎn)業(yè)特色的形態(tài),但遵循半導(dǎo)體產(chǎn)業(yè)特性來看,終局大概率是2-3家設(shè)計公司來服務(wù)國內(nèi)市場。她認為國內(nèi)在先進制程產(chǎn)線的突破對AI芯片有直接帶動作用,創(chuàng)新架構(gòu)依賴于全產(chǎn)業(yè)鏈的成熟,有一個過程,先進制程階段性進展可以為大家獲得一些緩沖時間。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲華興資本集團華興證券董事總經(jīng)理阮孝莉

從資本市場來看,一定程度上AI芯片產(chǎn)業(yè)、還有創(chuàng)新創(chuàng)業(yè)在一級市場和二級市場已經(jīng)形成比較好的同頻共振效應(yīng)。蔣純和阮孝莉的觀點一致,表面來看,一級市場的AI芯片創(chuàng)新創(chuàng)業(yè)氛圍與二級市場的炒作脫節(jié)。蔣純談道,雖然二級市場不乏寒武紀這樣的優(yōu)秀代表,但其就像冰山浮出海面的尖角,大量創(chuàng)新生態(tài)的企業(yè)都在二級市場水下,但是二級市場的炒作代表了全國上下的期望,可以起到“千金買馬骨”的作用。阮孝莉補充說,二級市場泡沫并不完全是壞事,蓬勃才能吸引更多資本來關(guān)注并投資。而從新的大模型背景下未來AI賽道的增長空間來看,估值繁榮也是一定程度上具有合理性

據(jù)王馥宇分享,和利資本不會花太多精力去關(guān)注二級市場,在做創(chuàng)投時,更多關(guān)注客戶需求、市場空間、產(chǎn)品力、團隊組織力和執(zhí)行力、業(yè)績和利潤的成長情況等,因為滿足了客戶需求,才能真正創(chuàng)造價值。因此,和利資本做投資預(yù)判的參考點十分樸素——人的需求是什么,能不能通過技術(shù)和產(chǎn)品來滿足人的需求,能不能提供更高的社會生產(chǎn)力。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲和利資本合伙人王馥宇

四、創(chuàng)新架構(gòu)橫刀立馬,換道破解性能與功耗難題

面臨傳統(tǒng)馮·諾依曼體系帶來的內(nèi)存墻、功耗墻、通信墻等挑戰(zhàn),依靠工藝技術(shù)進步來實現(xiàn)芯片性能、能效、成本等方面的改善變得愈發(fā)困難,架構(gòu)創(chuàng)新已是AI芯片面臨的一個不可回避的課題。圍繞架構(gòu)創(chuàng)新,國產(chǎn)AI芯片正從早期的百花齊放,向更深更多維的層面發(fā)展。

在峰會首日,主題演講分享的AI芯片架構(gòu)創(chuàng)新思路主要集中在兩類,一是通過縮短計算單元與存儲單元、傳感器的距離,來減少芯片內(nèi)不必要的數(shù)據(jù)傳輸所產(chǎn)生的時延和能耗;二是引入數(shù)據(jù)流驅(qū)動的可重構(gòu)計算,將硬件資源更多集中在計算上,兼具靈活性與高能效。芯至科技則提出了一種將RISC-V開源指令架構(gòu)、自研一致性總線、WoW 3DIC組合的架構(gòu)創(chuàng)新思路。

1、感存算一體:為數(shù)據(jù)搬運減負,大幅降低功耗

在大模型時代,技術(shù)“剪刀差”越來越大:算力摩爾定律終結(jié),但數(shù)據(jù)量越來越大,算法越來越復(fù)雜,一大核心的痛點就是“存儲墻”。由于存儲和計算分離架構(gòu),大模型開發(fā)的95%甚至更多時間花在數(shù)據(jù)搬運上,將導(dǎo)致能耗劇增和實際計算效率巨降。

億鑄科技熊大鵬認為,存算一體技術(shù)能夠從根本上解決“存儲墻”問題。面向數(shù)據(jù)中心、云計算、自動駕駛等場景,2023年8月,億鑄科技成功點亮存算一體AI大算力核心技術(shù)驗證芯片,可基于成熟工藝制程,實現(xiàn)單卡突破P級算力的極強性能與極高能效比。

后摩智能則首先瞄準汽車場景,于2023年5月推出的存算一體智駕芯片后摩鴻途H30,預(yù)計在2024年推出第二代產(chǎn)品后摩鴻途H50芯片。后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮稱,根據(jù)后摩實驗室及MLPerf公開測試結(jié)果,在ResNet50性能功耗對比上,采取12nm制程的H30相比某國際芯片巨頭的7nm同類芯片性能提升超2倍,功耗減少超50%。

陳亮談道,H30背后是后摩智能自研的IPU架構(gòu),該架構(gòu)設(shè)計遵循“中庸之道”。如果將集中式計算架構(gòu)比作居住面積和擴展性有限的“中式庭院”,那么分布式計算架構(gòu)類似于“高層公寓”,容納性好但溝通性不足。后摩智能的IPU架構(gòu)選擇在兩者之間尋求平衡點:在計算方面,通過多核、多硬件線程實現(xiàn)計算效率與算力靈活擴展;在存儲方面,通過多級數(shù)據(jù)緩存實現(xiàn)高效數(shù)據(jù)搬運與復(fù)用;在數(shù)據(jù)傳輸方面,通過雙環(huán)拓撲專用總線實現(xiàn)靈活數(shù)據(jù)傳輸與共享。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮

與存算一體的思路類似,從清華電子系智能感知集成電路與系統(tǒng)實驗室孵化出的每刻深思,將計算部分與傳感器相連,直接用模擬數(shù)據(jù)做運算,省去ADC模數(shù)轉(zhuǎn)換過程,能夠大幅節(jié)省功耗。

每刻深思的智能感知芯片,基于創(chuàng)新的近傳感模擬計算架構(gòu),可落地智能駕駛、VR/AR等多類應(yīng)用場景中。以汽車的哨兵模式應(yīng)用場景為例,這是一種通過硬件幫助車主在遠離車輛時監(jiān)控車輛安全的汽車模式,每刻深思的車載“感存算一體”協(xié)處理芯片能促進哨兵模式每晚耗電從5-8度下降到0.05度;待機功耗從原來的10W下降到14mW,從而大大提升用車體驗。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲每刻深思CEO鄒天琦

2、數(shù)據(jù)流驅(qū)動可重構(gòu)計算:顯著提升芯片利用率

可重構(gòu)計算架構(gòu)根據(jù)不同的應(yīng)用或算法來配置硬件資源,讓數(shù)據(jù)在計算單元之間流轉(zhuǎn),減少了傳統(tǒng)的譯碼操作和對內(nèi)存的訪問,能夠大幅提升效率和節(jié)省功耗。除了在這一技術(shù)路線上研發(fā)十余年之久的魏少軍教授團隊外,一些AI芯片企業(yè)也已經(jīng)開始探索這一技術(shù)路線的落地商用價值。

AMD基于XDNA AI引擎的架構(gòu)創(chuàng)新,是數(shù)據(jù)流處理并行計算陣列的架構(gòu),用于提供高速的、低延時、低功耗的實時推理?;赬DNA AI引擎的架構(gòu)構(gòu)建的Chiplet,與CPU、FPGA等構(gòu)建片上異構(gòu)計算平臺,可擴展至數(shù)據(jù)中心、端側(cè)(Ryzen AI)、邊緣/嵌入式等不同平臺來滿足多樣化的AI推理需求。

可重構(gòu)數(shù)據(jù)流架構(gòu)能并行進行數(shù)據(jù)訪問和數(shù)據(jù)計算。鯤云科技聯(lián)合創(chuàng)始人兼首席技術(shù)官蔡權(quán)雄提到一個公式:芯片的實測性能=芯片理論峰值算力x芯片利用率。而鯤云科技的可重構(gòu)數(shù)據(jù)流架構(gòu),便是從芯片利用率找到突破點,最大化利用片上計算資源,提升芯片實測性能。相比于芯片利用率不足35%的指令集架構(gòu),基于鯤云可重構(gòu)數(shù)據(jù)流架構(gòu)的CAISA芯片最高可實現(xiàn)95.4%的芯片利用率。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲鯤云科技聯(lián)合創(chuàng)始人兼首席技術(shù)官蔡權(quán)雄

蔡權(quán)雄說:“鯤云不追求先進制程,而是從架構(gòu)側(cè)創(chuàng)新為行業(yè)提供極致性價比AI算力。”通過自研芯片架構(gòu)CAISA 3.0和自研編譯器RainBuilder,據(jù)公開測試數(shù)據(jù)顯示,一顆28nm工藝的CAISA芯片相較于一顆16nm的GPU芯片,可實現(xiàn)最高4.12倍實測算力的提升。該芯片已實現(xiàn)量產(chǎn)和規(guī)?;涞兀瑸?0余個行業(yè)提供算力、算法、平臺一體化的AI視頻分析解決方案,成功落地1500多個智能化項目,覆蓋智慧安監(jiān)、智慧能源、工業(yè)制造等多個領(lǐng)域。

珠海芯動力專攻兼具通用性、高性能的RPP(可重構(gòu)并行處理器)架構(gòu)路徑。芯動力創(chuàng)始人&CEO李原透露說,RPP架構(gòu)是將PE陣列以流水線的方式排列,實測面積效率比可達到同類產(chǎn)品的7~10倍,能效比也超過3倍,也就是說,在相同算力下只需占用更小的芯片面積。

此外,RPP架構(gòu)還具備全方位兼容CUDA的特性,這意味著開發(fā)者可以直接使用CUDA編程語言編寫程序,無需進行復(fù)雜的代碼轉(zhuǎn)換。目前,芯動力首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8已經(jīng)流片成功,實現(xiàn)小規(guī)模量產(chǎn)。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲珠海芯動力創(chuàng)始人&CEO李原

3、重構(gòu)計算體系結(jié)構(gòu):軟硬件全棧系統(tǒng)架構(gòu)創(chuàng)新

進入AI新時代,芯至科技尹文認為,算力創(chuàng)新不再僅僅是單個處理器微架構(gòu)和芯片工藝的創(chuàng)新,而需要軟硬件全棧的系統(tǒng)架構(gòu)全面創(chuàng)新,未來的創(chuàng)新機會來自以下方面:開放的通用指令架構(gòu),高效的融合加速器,異構(gòu)互聯(lián)總線和芯片工程,開源算子庫、工具鏈和軟件。

基于此,芯至科技圍繞RISC-V開源指令架構(gòu)、自研一致性總線、WoW 3DIC的架構(gòu)創(chuàng)新,可以帶來10倍性價比的大模型AI推理芯片。展望更長期的未來,尹文相信基于RISC-V開源指令同構(gòu)和微架構(gòu)異構(gòu),開源軟件工具鏈及自主一致性總線和芯片工程創(chuàng)新,未來有機會推進到算力統(tǒng)一場。算力統(tǒng)一場將更利于形成更大的自主可控軟件新生態(tài),并符合計算架構(gòu)的原始特征,助力我國在計算體系方面換道超車。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲芯至科技聯(lián)合創(chuàng)始人、首席芯片架構(gòu)師兼副總裁尹文

五、為AI芯片錘煉精兵銳器,Chiplet助攻大算力芯片破局

隨著摩爾定律越發(fā)難以維系,如何在面臨逼近物理極限的情況下保持算力持續(xù)增長?基于先進封裝的Chiplet(芯粒)技術(shù)已成為后摩爾時代兼顧經(jīng)濟效益和提升芯片性能的一大有效路徑。

Chiplet的優(yōu)勢在于可以實現(xiàn)異構(gòu)集成。這種技術(shù)方案通過先進封裝技術(shù)將采用不同工藝制程、不同功能的各種Chiplet模塊組合到一起,能夠大幅提高大型芯片的良率,并能降低設(shè)計和制造環(huán)節(jié)的成本,同時減輕對先進制程產(chǎn)能的依賴。AMD MI300、特斯拉D1、蘋果M1 Ultra等經(jīng)典AI芯片產(chǎn)品均采用了先進的Chiplet架構(gòu)。

珠海GPGPU創(chuàng)企芯動力也十分認同Chiplet技術(shù)在產(chǎn)業(yè)發(fā)展中的價值,計劃將Chiplet和I/O Die連接形成邊緣端適合的芯片,以及使用類似技術(shù)將多顆核心進行連接,提供更高計算能力。”

今年2月,北極雄芯發(fā)布了國內(nèi)首款基于異構(gòu)Chiplet集成的智能處理芯片“啟明930”。該芯片由11塊Chiplets通過高速接口拼接而成,采用12nm工藝、2.5D封裝、全國產(chǎn)基板材料,可獨立用于AI加速卡,亦可通過D2D擴展多種功能型Side Die進行集成。

其創(chuàng)始人、清華大學交叉信息研究院助理教授馬愷聲經(jīng)常被問一個問題,能不能用兩個2N工藝的Wafer通過3D集成,做出N工藝的性能? 答案是可以,用2塊14nm芯片拼出一塊7nm芯片是可能的。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲清華大學交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲

他列數(shù)了4種可能的解決方案:1)用一層晶圓做供電網(wǎng)絡(luò)解決IR drop(電源電壓降)問題;2)多層邏輯;3)內(nèi)存和邏輯混合;4)將內(nèi)存、邏輯、互聯(lián)與存儲、供電耦合到一起。

上?;ヂ?lián)IP產(chǎn)品及Chiplet產(chǎn)品供應(yīng)商奎芯科技專注于高速接口IP,同時致力于用Chiplet破解內(nèi)存墻與I/O墻。其副總裁王曉陽分享說,考慮到HBM的使用存在尺寸數(shù)量、對熱敏感、擺放方向和適配不靈活、工藝等限制,奎芯科技試圖將HBM HOST和SoC解耦,打造M2link互聯(lián)方案,將HBM和主SoC的距離拉到2.5厘米。采用這種方案,同等大小SoC可利用面積增大44%,內(nèi)存容量帶寬增長33%,最大芯片尺寸擴大2倍。

云邊端AI芯片熱戰(zhàn)大模型!2023全球AI芯片峰會首日干貨

▲奎芯科技聯(lián)合創(chuàng)始人兼副總裁王曉陽

結(jié)語:產(chǎn)學研投前沿交鋒,全球AI芯片峰會沸騰深圳南山

從2018年舉辦第一屆開始,全球AI芯片峰會至今已連續(xù)舉辦五屆,成為國內(nèi)極少數(shù)專注在AI芯片領(lǐng)域且具有較大影響力的行業(yè)峰會。每一屆,你都能聽到頂級AI芯片產(chǎn)學研用及投融資領(lǐng)域?qū)<覀兊乃枷虢讳h,多元的精彩觀點在這里碰撞,迸發(fā)出更多技術(shù)或產(chǎn)品創(chuàng)新的靈感火花。

這也是全球AI芯片峰會連續(xù)第二年落地深圳南山。據(jù)深圳市南?區(qū)科技創(chuàng)新局黨組書記、局?曹環(huán)分享,今年5月,深圳市發(fā)布推動新型人工智能高質(zhì)量發(fā)展方案,提出要聚焦通用大模型、智能算力芯片等領(lǐng)域,實施人工智能科技重大專項扶持計劃,推動AI產(chǎn)業(yè)高質(zhì)量發(fā)展。

當前,南山區(qū)正大力推動集成電路產(chǎn)業(yè)高質(zhì)量發(fā)展,已發(fā)布集成電路產(chǎn)業(yè)專項政策,在人才、研發(fā)、融資等方面大力支持芯片企業(yè)發(fā)展,先后落地了國家集成電路設(shè)計深圳產(chǎn)業(yè)化基地、粵港澳大灣區(qū)集成電路設(shè)計創(chuàng)新公共平臺等創(chuàng)新載體,集聚了英特爾、江波龍、中微半導(dǎo)等一批行業(yè)龍頭企業(yè),芯片領(lǐng)域上游設(shè)計能力突出,下游應(yīng)用場景廣泛,成為了半導(dǎo)體精英企業(yè)聚集高地。

“接下來,南山區(qū)將認真做好服務(wù),為更多業(yè)內(nèi)企業(yè)、優(yōu)秀人才提供更全面的政策指引和服務(wù)。”曹環(huán)談道,“我們也誠摯邀請廣大企業(yè)家、投資人和創(chuàng)業(yè)者朋友們,選擇南山、投資南山、扎根南山,在南山這片創(chuàng)新與創(chuàng)業(yè)的熱土,展現(xiàn)創(chuàng)新實力、開拓創(chuàng)新事業(yè)、實現(xiàn)創(chuàng)新夢想。”

9月15日,2023全球AI芯片峰會舉行的AI大算力芯片專場、高能效AI芯片專場,繼續(xù)帶來了更多攻克AI芯片技術(shù)壁壘和落地難關(guān)的思想碰撞,并公布2023年度「中國AI芯片企業(yè)」評選結(jié)果。芯東西將陸續(xù)輸出新鮮的干貨圖文,并放送多個精彩主題演講的圖文速記整理,具體請關(guān)注芯東西與智東西公眾號推送內(nèi)容。

THE END
免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!