商湯發(fā)布日日新5.0大模型，全面對標GPT-4 Turbo

2024-04-25 15:50

4月24日晚，商湯官方發(fā)文介紹了公司發(fā)布的日日新5.0大模型，并表示這是“中國首個GPT-4 Turbo級別的大模型”，日日新5.0大模型具備更強的知識、數(shù)學(xué)、推理及代碼能力，綜合性能全面對標 GPT-4 Turbo，并在主流客觀評測上達到或超越 GPT-4 Turbo。

據(jù)商湯的測評，日日新 5.0在大部分核心測試集指標上都超過GPT-4 Turbo，也超過了OpenAI此前競爭對手Anthropic發(fā)布的Claude 3.0 Opus。

在實際使用中，商湯表示在自然語言能力方面，創(chuàng)意寫作、推理以及總結(jié)能力均大幅提升，文生圖能力也有較大提升，本次日日新5.0另一大核心指標是多模態(tài)能力，商湯提到其多模態(tài)大模型的圖文感知能力達到全球領(lǐng)先水平，在權(quán)威綜合基準測試MMBench中綜合得分排名首位。

日日新5.0模型能力提升一方面得益于采用混合專家架構(gòu)（MoE），激活少量參數(shù)就能完成推理，且推理時上下文窗口達 200K 左右，其次模型基于超過10TB tokens訓(xùn)練、覆蓋了數(shù)千億量級的邏輯型合成思維鏈數(shù)據(jù)，此外能力提升也在于商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計的聯(lián)合調(diào)優(yōu)。

翻譯

搜索

復(fù)制

THE END

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

展會預(yù)告

新品

多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品
近日，?？低暬谟^瀾大模型技術(shù)體系，將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合…
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
誤報率降低90%以上！?？低暟l(fā)布視覺大模型周界攝像機
更準！?？低暟l(fā)布大模型交通卡口抓拍系列產(chǎn)品
飛凌微推出AIoT應(yīng)用系列高性能端側(cè)視覺AI SoC芯片A1
多模態(tài)大模型產(chǎn)品亮相，?？低暟l(fā)布文搜存儲系列產(chǎn)品

訪談

做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇破解新挑戰(zhàn)

今年3月份，全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》（以下簡稱“報告”），該報告…
數(shù)字化浪潮下，安防廠商如何滿足行業(yè)客戶的定制化需求?

回顧近兩年，受疫情因素影響，包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊，市場…
博思高鄧紹昌：乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟，在市場變革中逆風(fēng)飛揚

11月24日，由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會，在深…

企業(yè)

來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
(電磁網(wǎng)捕器)提供了一種全新的、更高效的物理隔離和壓制手段。尤其在預(yù)案中針對特定突發(fā)情況的模擬處置演練…
應(yīng)用安全再升級！ Imperva Application Security平臺集成新功能
來自杰創(chuàng)智能的“黑科技”：電磁網(wǎng)捕器護航夏季達沃斯論壇
熵基科技：用非侵入式腦機接口，重塑教育、醫(yī)療與養(yǎng)老的未來
華為開發(fā)者大會2025官宣“鴻蒙智選”小豚當家成為首批合作伙伴
深耕垂直物聯(lián)場景，螢石藍海大模型2.0 升級引領(lǐng)行業(yè)再躍遷

商湯發(fā)布日日新5.0大模型，全面對標GPT-4 Turbo

商湯發(fā)布日日新5.0大模型，全面對標GPT-4 Turbo