12月7日凌晨,谷歌宣布推出谷歌自己的人工智能模型Gemini。谷歌首席執(zhí)行官桑達爾·皮查伊表示,“這是谷歌人工智能新時代的開始”。
根據(jù)皮查伊和 Google DeepMind 首席執(zhí)行官 Demis Hassabis 的描述,這是人工智能模型的巨大飛躍,最終將影響幾乎所有的 Google 產(chǎn)品。據(jù)介紹,Gemini可以適配包括數(shù)據(jù)中心和移動設(shè)備等多種產(chǎn)品。Demini擁有三個版本:其一是Gemini Nano,負責 Android 設(shè)備上本地離線運行,是側(cè)端設(shè)備上最高效的模型;其二是Gemini Pro,它相比與Nano更強大,它將為許多 Google AI 服務(wù)提供支持,并且Bard宣布將使用Gemini Pro來進行新的升級;其三是Gemini UItra,它是 Google 迄今為止創(chuàng)建的最強大的模型,以大型語言模型(LLM)研究和開發(fā)中廣泛使用的 32 項學術(shù)為基準,Gemini Ultra 的性能有 30 項都超過了目前最先進的水平,它適用于完成高度復(fù)雜的任務(wù),主要是為數(shù)據(jù)中心和企業(yè)應(yīng)用程序設(shè)計的。
值得注意的是,據(jù)Demis Hassabis描述,Gemini從一開始就被創(chuàng)建為多模態(tài)的模型,這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。比如它經(jīng)過訓練,可以同時識別并理解文本、圖像、音頻等,因此它能更好地理解具有細微差別的信息,回答與復(fù)雜主題相關(guān)的問題。這就讓它尤其擅長解釋數(shù)學和物理等復(fù)雜科目中的推理。
據(jù)谷歌自己稱,“從自然圖像、音頻和視頻理解到數(shù)學推理,在被大型語言模型(LLM)研究和開發(fā)中廣泛使用的 32 項學術(shù)基準中,Gemini Ultra 的性能有 30 項都超過了目前最先進的水平。”
目前,Gemini1.0產(chǎn)品已在多種產(chǎn)品和平臺上推出。谷歌公司計劃通過 Google Cloud 將 Gemini 授權(quán)給客戶,供他們在自己的應(yīng)用程序中使用。從 12 月 13 日開始,開發(fā)者和企業(yè)客戶可以通過 Google AI Studio 或Google Cloud Vertex AI中的 Gemini API 訪問 Gemini Pro。Android 開發(fā)者也可以通過 AICore 使用端側(cè)任務(wù)最高效的模型 Gemini Nano進行構(gòu)建。
谷歌表示,它將在 170 多個國家和地區(qū)提供英語服務(wù),并且計劃在未來幾個月內(nèi)擴展不同的模態(tài),并支持新的語言和地區(qū)。下一步,谷歌將進一步擴展其未來版本的各種功能,包括在規(guī)劃和記憶方面取得進展,以及通過增加上下文窗口來處理更多信息并提供更好的響應(yīng)。明年年初,谷歌還將推出 Bard Advanced,這是一種全新的、前沿的 AI 體驗,讓用戶可以從 Gemini Ultra 開始使用模型和功能。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風飛揚
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…