Posits，一種新的數(shù)字表示方法，改進(jìn)了人工智能的數(shù)學(xué)計(jì)算

2022-11-01 16:58 來(lái)源:Science AI

訓(xùn)練許多現(xiàn)代 AI 工具背后的大型神經(jīng)網(wǎng)絡(luò)需要真正的計(jì)算能力：例如，OpenAI 最先進(jìn)的語(yǔ)言模型 GPT-3 需要驚人的數(shù)億次操作來(lái)訓(xùn)練，并且花費(fèi)了大約 500 萬(wàn)美元的計(jì)算時(shí)間。工程師們認(rèn)為他們已經(jīng)找到了一種通過(guò)使用不同的數(shù)字表示方式來(lái)減輕負(fù)擔(dān)的方法。

本文約1500字，建議閱讀5分鐘

本文簡(jiǎn)單介紹第一個(gè)基于位置的處理器內(nèi)核。

早在 2017 年，當(dāng)時(shí)在 A*STAR 計(jì)算資源中心和新加坡國(guó)立大學(xué)聯(lián)合任命的 John Gustafson 和當(dāng)時(shí)在 Interplanetary Robot and Electric Brain Co. 任職的 Isaac Yonemoto 開(kāi)發(fā)了一種表示數(shù)字的新方法。這些數(shù)字，稱為 posits，被提議作為對(duì)當(dāng)今使用的標(biāo)準(zhǔn)浮點(diǎn)算術(shù)處理器的改進(jìn)。

現(xiàn)在，馬德里康普頓斯大學(xué)的一組研究人員開(kāi)發(fā)了第一個(gè)在硬件中實(shí)現(xiàn) posit 標(biāo)準(zhǔn)的處理器內(nèi)核，并表明，基本計(jì)算任務(wù)的精度逐位提高了四個(gè)數(shù)量級(jí)，與使用標(biāo)準(zhǔn)浮點(diǎn)數(shù)進(jìn)行計(jì)算相比。他們?cè)诘?9屆 IEEE 計(jì)算機(jī)算術(shù)研討會(huì)上展示了他們的結(jié)果。

論文鏈接：

https://spectrum.ieee.org/floating-point-numbers-posits-processor

「如今，摩爾定律似乎開(kāi)始消退。」康普頓斯公司 ArTeCS 小組的研究生研究員 David Mallasén Quintana 說(shuō)，「因此，我們需要找到一些其他方法來(lái)從同一臺(tái)機(jī)器中獲得更多性能。做到這一點(diǎn)的方法之一是改變我們對(duì)實(shí)數(shù)進(jìn)行編碼的方式，以及我們表示它們的方式?！?/p>

Complutense 團(tuán)隊(duì)并不是唯一一個(gè)用數(shù)字表示來(lái)挑戰(zhàn)極限的人。近期，英偉達(dá)、Arm 和英特爾就使用 8 位浮點(diǎn)數(shù)而不是通常的 32 位或 16 位機(jī)器學(xué)習(xí)應(yīng)用程序達(dá)成了一項(xiàng)規(guī)范。使用更小、更不精確的格式可以提高效率和內(nèi)存使用率，但代價(jià)是計(jì)算準(zhǔn)確性。

實(shí)數(shù)不能簡(jiǎn)單地用硬件完美地表示，因?yàn)樗鼈兊臄?shù)量是無(wú)限的。為了適應(yīng)指定的位數(shù)，許多實(shí)數(shù)必須四舍五入。Posits 的優(yōu)勢(shì)在于它們準(zhǔn)確代表的數(shù)字沿?cái)?shù)軸分布的方式。在數(shù)軸的中間，大約 1 和 -1，有比浮點(diǎn)更多的位置表示。在兩翼，對(duì)于大的負(fù)數(shù)和正數(shù)，定位精度比浮點(diǎn)數(shù)下降得更優(yōu)雅。

「它更適合計(jì)算中數(shù)字的自然分布?！笹ustafson 說(shuō)，「這是正確的動(dòng)態(tài)范圍，在您需要更高精度的情況下，它是正確的精度。浮點(diǎn)運(yùn)算中有大量的位模式，從來(lái)沒(méi)有人使用過(guò)。那是浪費(fèi)！」

由于表示中的一個(gè)額外組件，Posits 在 1 和 -1 左右實(shí)現(xiàn)了這種改進(jìn)的準(zhǔn)確性。浮點(diǎn)數(shù)由三部分組成：一個(gè)符號(hào)位（0 表示正數(shù)，1 表示負(fù)數(shù)），幾個(gè)「尾數(shù)」（分?jǐn)?shù)）位表示小數(shù)點(diǎn)的二進(jìn)制版本之后的內(nèi)容，其余位定義指數(shù)（2^exp）。

Posits 保留了浮點(diǎn)數(shù)的所有組件，但添加了一個(gè)額外的「制度」部分，即指數(shù)的指數(shù)。該制度的美妙之處在于它的位長(zhǎng)可以變化。對(duì)于小數(shù)字，它可能只需要兩位，為尾數(shù)留下更高的精度。這允許在 1 和 -1 附近的最佳位置中進(jìn)行更高的定位精度。

深度神經(jīng)網(wǎng)絡(luò)通常使用稱為權(quán)重的歸一化參數(shù)，使其成為受益于位置優(yōu)勢(shì)的完美候選者。大部分神經(jīng)網(wǎng)絡(luò)計(jì)算由乘法累加操作組成。每次執(zhí)行這樣的計(jì)算時(shí)，每個(gè)總和都必須重新截?cái)啵瑢?dǎo)致精度損失。使用 posits，稱為 quire 的特殊寄存器可以有效地執(zhí)行累加步驟以減少精度損失。但是今天的硬件實(shí)現(xiàn)了浮點(diǎn)數(shù)，到目前為止，在軟件中使用 posits 的計(jì)算收益在很大程度上被格式之間轉(zhuǎn)換的損失所掩蓋。

借助在現(xiàn)場(chǎng)可編程門陣列（FPGA）中合成的新硬件實(shí)現(xiàn)，Complutense 團(tuán)隊(duì)能夠并排比較使用 32 位浮點(diǎn)數(shù)和 32 位位置完成的計(jì)算。他們通過(guò)將它們與使用更準(zhǔn)確但計(jì)算成本更高的 64 位浮點(diǎn)格式的結(jié)果進(jìn)行比較來(lái)評(píng)估它們的準(zhǔn)確性。Posits 在矩陣乘法（神經(jīng)網(wǎng)絡(luò)訓(xùn)練中固有的一系列乘法累加）的準(zhǔn)確性方面顯示出驚人的四個(gè)數(shù)量級(jí)的提高。他們還發(fā)現(xiàn)，提高精度并沒(méi)有以計(jì)算時(shí)間為代價(jià)，只是稍微增加了芯片面積和功耗。

盡管數(shù)值精度的提高是不可否認(rèn)的，但這究竟會(huì)如何影響像 GPT-3 這樣的大型 AI 的訓(xùn)練還有待觀察。

「假設(shè)可能會(huì)加快訓(xùn)練速度，因?yàn)槟悴粫?huì)在途中丟失太多信息?！筂allasén 說(shuō)，「但這些都是我們不知道的事情。有些人已經(jīng)在軟件中進(jìn)行了嘗試，但我們現(xiàn)在也想在硬件中進(jìn)行嘗試?！?/p>

其他團(tuán)隊(duì)正在開(kāi)發(fā)他們自己的硬件實(shí)現(xiàn)以促進(jìn) posit 的使用。「它正在做我希望它會(huì)做的事情；它被瘋狂地采用了?！笹ustafson 說(shuō)，「位置編號(hào)格式引起了轟動(dòng)，有數(shù)十個(gè)團(tuán)體，包括公司和大學(xué)，都在使用它。」

https://spectrum.ieee.org/floating-point-numbers-posits-processor

THE END

責(zé)任編輯：趙龍

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請(qǐng)聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請(qǐng)諒解！

相關(guān)閱讀

展會(huì)預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲(chǔ)系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺(jué)AI SoC芯片A1
誤報(bào)率降低90%以上！海康威視發(fā)布視覺(jué)大模型周界攝像機(jī)
更準(zhǔn)！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺(jué)AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲(chǔ)系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》（以下簡(jiǎn)稱“報(bào)告”），該報(bào)告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來(lái)自市場(chǎng) “不確定性”因素的沖擊，市場(chǎng)…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場(chǎng)變革中逆風(fēng)飛揚(yáng)

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)暨品牌盛會(huì)，在深…

企業(yè)

來(lái)自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護(hù)航夏季達(dá)沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預(yù)案中針對(duì)特定突發(fā)情況的模擬處置演練…
應(yīng)用安全再升級(jí)！ Imperva Application Security平臺(tái)集成新功能
來(lái)自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護(hù)航夏季達(dá)沃斯論壇
熵基科技：用非侵入式腦機(jī)接口，重塑教育、醫(yī)療與養(yǎng)老的未來(lái)
華為開(kāi)發(fā)者大會(huì)2025官宣“鴻蒙智選”小豚當(dāng)家成為首批合作伙伴
深耕垂直物聯(lián)場(chǎng)景，螢石藍(lán)海大模型2.0 升級(jí)引領(lǐng)行業(yè)再躍遷

Posits，一種新的數(shù)字表示方法，改進(jìn)了人工智能的數(shù)學(xué)計(jì)算

Posits，一種新的數(shù)字表示方法，改進(jìn)了人工智能的數(shù)學(xué)計(jì)算