4月24日晚,商湯官方發(fā)文介紹了公司發(fā)布的日日新5.0大模型,并表示這是“中國首個GPT-4 Turbo級別的大模型”,日日新5.0大模型具備更強的知識、數(shù)學(xué)、推理及代碼能力,綜合性能全面對標 GPT-4 Turbo,并在主流客觀評測上達到或超越 GPT-4 Turbo。
據(jù)商湯的測評,日日新 5.0在大部分核心測試集指標上都超過GPT-4 Turbo,也超過了OpenAI此前競爭對手Anthropic發(fā)布的Claude 3.0 Opus。
在實際使用中,商湯表示在自然語言能力方面,創(chuàng)意寫作、推理以及總結(jié)能力均大幅提升,文生圖能力也有較大提升,本次日日新5.0另一大核心指標是多模態(tài)能力,商湯提到其多模態(tài)大模型的圖文感知能力達到全球領(lǐng)先水平,在權(quán)威綜合基準測試MMBench中綜合得分排名首位。
日日新5.0模型能力提升一方面得益于采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理,且推理時上下文窗口達 200K 左右,其次模型基于超過10TB tokens訓(xùn)練、覆蓋了數(shù)千億量級的邏輯型合成思維鏈數(shù)據(jù),此外能力提升也在于商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計的聯(lián)合調(diào)優(yōu)。
翻譯
搜索
復(fù)制
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…