一区二区三区A片|Av不卡高清网址|精品久久不卡一本|一区二区三区绿色|五月黄色婷婷久久|综合 另类 一区|亚洲成人VA视频|久久国产特黄大片|成人无码激情亚洲|黄色字幕网址大全

英特爾第五代至強(qiáng)可擴(kuò)展處理器發(fā)布:AI推理性能提升42%!

12月15日下午,英特爾在中國(guó)北京召開(kāi)了主題為“AI無(wú)處不在,創(chuàng)芯無(wú)所不及”的2023英特爾新品發(fā)布會(huì)暨AI技術(shù)創(chuàng)新派對(duì),正式發(fā)布了代號(hào)為“Emerald Rapids”的面向服務(wù)器、數(shù)據(jù)中心的第五代至強(qiáng)可擴(kuò)展處理器,相比上代至強(qiáng)平均性能提升了21%,能效提升了36%,AI推理性能提升了42%,總擁有成本降低了77%!

12月15日下午,英特爾在中國(guó)北京召開(kāi)了主題為“AI無(wú)處不在,創(chuàng)芯無(wú)所不及”的2023英特爾新品發(fā)布會(huì)暨AI技術(shù)創(chuàng)新派對(duì),正式發(fā)布了代號(hào)為“Emerald Rapids”的面向服務(wù)器、數(shù)據(jù)中心的第五代至強(qiáng)可擴(kuò)展處理器,相比上代至強(qiáng)平均性能提升了21%,能效提升了36%,AI推理性能提升了42%,總擁有成本降低了77%!

最高64核心,整體性能提升21%、AI推理性能提升42%、總擁有成本降低77%!

據(jù)介紹,第五代至強(qiáng)(Xeon)延續(xù)了上代的Intel 7制造工藝、Raptor Cove P-Cove架構(gòu)、LGA4677封裝接口,但在布局設(shè)計(jì)、部分核心規(guī)格上做了升級(jí)和增強(qiáng)。

首先在布局設(shè)計(jì)上,相對(duì)于第四代至強(qiáng)的4 Tile Die設(shè)計(jì),64核旗艦級(jí)的第五代至強(qiáng)采用了2 Tile Die 設(shè)計(jì)(英特爾將其稱(chēng)之為XCC),這樣做有幾個(gè)好處,即更少的模塊意味著更少的數(shù)據(jù)移動(dòng),從而可以降低功耗。不過(guò),雖然Tile的數(shù)量更少了,但在物理面積上也更大了。通常情況下,更大的面積意味著更低的產(chǎn)量,但Sapphire Rapids和現(xiàn)在的Emerald Rapids中使用的Intel 7工藝技術(shù)在這一點(diǎn)上已經(jīng)相當(dāng)成熟。

64核旗艦級(jí)的第五代至強(qiáng)每個(gè)Tile都通過(guò)位于兩個(gè)核心和緩存陣列之間的模塊化裸片結(jié)合連接,每個(gè)Tile內(nèi)擁有35個(gè)核心(其中3個(gè)是禁用的),每個(gè)Tile上還擁有2個(gè)內(nèi)存控制器,支持高達(dá)5600 MT/s速度的DDR5 DIMM、3個(gè)PCIe控制器(共6個(gè))、2個(gè)UPI(共4個(gè))和2個(gè)加速器引擎(共4個(gè))。

對(duì)于較低核心數(shù)量的第五代至強(qiáng)處理器,英特爾則繼續(xù)采用單芯片結(jié)構(gòu),英特爾稱(chēng)之為中等核心數(shù)的芯片(MCC),最多可以有32個(gè)核心。還有一種名為EE-LCC的更小的芯片,適用于多達(dá)20個(gè)核心。

相比第四代至強(qiáng)來(lái)說(shuō),第五代至強(qiáng)核心數(shù)量由上代的最高60核提升到了64核,并且提供了高達(dá)320MB的緩存池,幾乎是上代112.5MB的三倍,相當(dāng)于每核心從1.875MB增至5MB。同時(shí),第五代至強(qiáng)還支持更快的DDR5-5600速度,單路最大容量還是4TB,連接通道則還是80條PCIe 5.0,還支持20 GT/s(千兆傳輸)帶寬的Intel UPI 2.0。

英特爾表示,與第四代至強(qiáng)相比,第五代至強(qiáng)CPU所能提供的平均性能提升了21%,每瓦平均性能提升36%,TCO(典型的5年刷新周期的總擁有成本)降低了77%。

在AI能力上,之前的第四代至強(qiáng)就有內(nèi)置了AMX AI加速器,第五代至強(qiáng)又進(jìn)一步提升了turbo頻率,在某些人工智能推理負(fù)載中性能達(dá)到了四代至強(qiáng)的高達(dá)1.42倍,同時(shí)至強(qiáng)目前仍然是唯一一款擁有MLPerf訓(xùn)練和推理基準(zhǔn)性能測(cè)試的通用CPU。

根據(jù)英特爾之前公布的數(shù)據(jù)顯示,旗艦級(jí)第五代64核的Xeon 8592+與前代56核第四代Xeon 8480+相比的AI基準(zhǔn)測(cè)試,Xeon 8592+在AI語(yǔ)音識(shí)別和LAMMPS基準(zhǔn)測(cè)試中獲得了1.4倍的增益,同時(shí)在FFMPEG媒體轉(zhuǎn)碼工作負(fù)載中也獲得了1.2倍的增益。

此外,第五代至強(qiáng)還能夠支持運(yùn)行200億參數(shù)的大語(yǔ)言模型(LLM)。隨著GPT-4、Meta的Llama 2和Stable Diffusion等大語(yǔ)言模型的興起,英特爾也在推動(dòng)其至強(qiáng)處理器對(duì)于相對(duì)較小規(guī)模的大模型的支持能力,對(duì)于這類(lèi)工作負(fù)載,內(nèi)存帶寬和延遲是主要因素。雖然第五代至強(qiáng)沒(méi)有整合HMB,但是其也有5600 MT/s DDR5的幫助,雖然速度要差一些,但是已經(jīng)可以滿(mǎn)足一些較小規(guī)模的大模型的性能需求,同時(shí)在成本上也是遠(yuǎn)低于那些高昂的AI加速卡。

英特爾表示,在使用2S 五代至強(qiáng)平臺(tái)上運(yùn)行GPT-J 6B模型(60億參數(shù)),它可以實(shí)現(xiàn)在大約25毫秒下完成一個(gè)Token的處理。不過(guò),對(duì)于運(yùn)行更大的Llama 2 13B模型時(shí),其平均需要的時(shí)間則要提升至62ms,但仍遠(yuǎn)低于100毫秒。另外,有報(bào)道顯示,目前五代至強(qiáng)已經(jīng)能夠在運(yùn)行200億個(gè)參數(shù)的大模型上實(shí)現(xiàn)可接受的延遲。

同時(shí),在第五代五代至強(qiáng)上,QAT快速助手、DLB動(dòng)態(tài)負(fù)載均衡器、DSA數(shù)據(jù)流加速器、IAA存內(nèi)分析加速器等也依然存在,并且都可以按需付費(fèi)開(kāi)啟。

客戶(hù)應(yīng)用實(shí)例方面,IBM watsonx.data平臺(tái)的網(wǎng)絡(luò)查詢(xún)吞吐量提高了2.7倍,Palo Alto Networks的基于深度學(xué)習(xí)模型的威脅檢測(cè)性能提升了2倍,Gallium Studios游戲工作室Numenta AI平臺(tái)的推理性能比GPU云實(shí)例提高了多達(dá)6.5倍。

擁有28款SKU

在SKU方面,英特爾第5代至強(qiáng)CPU僅可擴(kuò)展到1S和2S系統(tǒng),4S和8S配置不在產(chǎn)品陣容中。其中,旗艦級(jí)的Xeon Platinum 8592系列有三種版本,Xeon Platinum 8592+ 用于通用解決方案,Xeon Platinum 8592Q用于液冷和通用解決方案、Xeon Platinum 8592V用于云優(yōu)化系統(tǒng)。該芯片共有64個(gè)內(nèi)核、128個(gè)線(xiàn)程、高達(dá)3.90 GHz的睿頻、320 MB的L3緩存和385/350/330瓦的TDP。芯片的價(jià)格大約在11000美元到12000美元之間。

第五代Xeon Gold系列SKU當(dāng)中,Xeon Gold 6558Q是最快的SKU,因?yàn)樗?548Y+的液冷版本的變體。該芯片有32個(gè)內(nèi)核、64個(gè)線(xiàn)程、高達(dá)4.1 GHz的睿頻、60 MB的緩存和350W的TDP。Xeon Gold 6554S和6530仍然是Gold細(xì)分市場(chǎng)中僅有的緩存超過(guò)100MB(分別為180和160 MB)的SKU。陣容從8、16、24、28、32、36核不等。

第五代Xeon Silver系列,擁有五個(gè)SKU,其中Xeon Silver 4516+最強(qiáng),擁有24個(gè)內(nèi)核、48個(gè)線(xiàn)程、高達(dá)3.7 GHz的睿頻、45 MB的L3緩存和185W的TDP。所有第五代Xeon Silver SKU均支持DDR5-4400,擁有8、12、16和24核。

總體來(lái)說(shuō),五代至強(qiáng)擁有60、56、52、48、36、32、28、24、16、8核心等不同配置,相比四代至強(qiáng)取消了44、40、20、18、12、10核心版本,SKU型號(hào)總數(shù)也從55款之多精簡(jiǎn)到28款。第五代至強(qiáng)的最高加速頻率范圍從1.9-4.2GHz不等來(lái)到了3.4-4.1GHz,雖然極限頻率低了100MHz,但是總體大大提升,基準(zhǔn)頻率也從1.7-3.7GHz不等提高到了1.9-3.9GHz。隨著性能的提升,第五代至強(qiáng)的整體功耗范圍也提升到了150-385W,上代是115-350W。

下一代的Sierra Forest和Granite Rapids

需要指出的是,第五代至強(qiáng)“Emerald Rapids”系列將是為Eagle Stream平臺(tái)設(shè)計(jì)的最后一款芯片,之后英特爾便會(huì)將至強(qiáng)產(chǎn)品線(xiàn)拆分為與競(jìng)爭(zhēng)對(duì)手類(lèi)似的注重高性能的全P核和注重高能效的全E核兩條產(chǎn)品線(xiàn)。

明年上半年,英特爾將推出基于全新Intel 3制造工藝,純E核架構(gòu)的Sierra Forest,也是至強(qiáng)系列第一次引入E核,最多做到288核心288線(xiàn)程。緊隨其后的是同樣Intel 3制造工藝,純P核設(shè)計(jì)的Granite Rapids,但核心數(shù)量等規(guī)格未披露,將于2024年下半年推出。

根據(jù)英特爾的預(yù)告,其未來(lái)的Granite Rapids Xeons將在“Intel 3”節(jié)點(diǎn)上制造,這些芯片將添加更多的內(nèi)核、更高的頻率、硬件加速,并支持136個(gè)PCIe通道,12個(gè)8800 MT/s MCR DIMM內(nèi)存通道,內(nèi)存總帶寬可提高到大約845 GB/s,這將大大有助于LLM推理性能。英特爾聲稱(chēng)其人工智能工作負(fù)載提高了2-3倍,內(nèi)存吞吐量提高了2.8倍,DeepMD LAMMPS人工智能推理工作負(fù)載提升了2.9倍。

THE END
免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!