谷歌推“最全能”AI模型Gemini正面硬扛GPT-4
2023-12-07
來(lái)源:華爾街見(jiàn)聞
美東時(shí)間12月6日周三,谷歌正式向公眾發(fā)布新一代大語(yǔ)言模型(LLM)Gemini,號(hào)稱谷歌迄今為止“最大、也最全能的AI模型”,有高級(jí)推理能力,回答難題時(shí)“考慮得更仔細(xì)”。有別于其他公司LLM競(jìng)品的是,谷歌強(qiáng)調(diào)Gemeni是最靈活的模型,因?yàn)樗貌煌笮〉陌姹?,可以適用于各種生成式AI應(yīng)用。
其中,最輕盈的版本Gemni Nano可以直接在智能手機(jī)上離線運(yùn)行;相對(duì)而言更強(qiáng)大的版本Gemini Pro可以執(zhí)行多種任務(wù),將通過(guò)谷歌的類ChatGPT聊天機(jī)器人Bard,為眾多谷歌AI 服務(wù)提供支持,加持谷歌的Gmail、Maps Docs和YouTube等服務(wù);功能最強(qiáng)大的版本Gemini Ultra也是谷歌迄今打造的最強(qiáng)大LLM,主要為數(shù)據(jù)中心和企業(yè)應(yīng)用而設(shè)計(jì)。
谷歌旗下AI研究機(jī)構(gòu)DeepMind的產(chǎn)品副總裁Eli Collins稱,Gemini的多樣性意味著,它“能夠在從移動(dòng)設(shè)備到大型數(shù)據(jù)中心的所有設(shè)備上運(yùn)行?!彼硎?,谷歌早就希望打造的新一代AI模型更像是樂(lè)于助人的合作者,而不是一種智能的軟件,Gemini讓谷歌距離這種遠(yuǎn)景又近了一步。
32種行業(yè)指標(biāo)測(cè)試中 Gemini有30種遙遙領(lǐng)先GPT-4
現(xiàn)在Gemini只有英語(yǔ)版,谷歌將很快推出其他語(yǔ)言的版本。谷歌CEO Sundar Pichai說(shuō),Gemini代表了AI的新時(shí)代。最終,Gemini將與谷歌的搜索引擎、廣告產(chǎn)品、Chrome瀏覽器等更多產(chǎn)品結(jié)合。
Gemini Nano手機(jī)電腦版周三可用 Gemini Pro支持Bard、下周面向云客戶 Gemini Ultra明年推行
具體應(yīng)用時(shí)間表方面,從本周三起,安卓系統(tǒng)開(kāi)發(fā)人員可以注冊(cè)使用Gemini Nano版,打造智能手機(jī)和電腦的Gemini支持App。谷歌稱,Gemini可以立即在其旗艦手機(jī)Pixel 8 Pro上啟用,實(shí)現(xiàn)諸如歸納電話錄音對(duì)話要點(diǎn)等新的生成式AI功能。
Gemini Pro版從本周三開(kāi)始支持Bard,實(shí)現(xiàn)高級(jí)的推理、規(guī)劃、理解等功能,在170個(gè)國(guó)家地區(qū)以英語(yǔ)一種語(yǔ)言操作運(yùn)行,可能不包括英國(guó)或者其他歐洲地區(qū),因?yàn)楣雀璺Q在和當(dāng)?shù)氐谋O(jiān)管機(jī)構(gòu)合作。
從12月13日下周三開(kāi)始,谷歌將通過(guò)谷歌云,在旗下Vertex AI 和 AI Studio平臺(tái)向云客戶提供 Gemini Pro版。
Gemini Ultra將首先面向開(kāi)發(fā)者和企業(yè)客戶開(kāi)放,該版本的應(yīng)用詳情將在下周公布。谷歌計(jì)劃,明年初,向公眾大范圍開(kāi)放Gemini Ultra應(yīng)用。
谷歌還計(jì)劃,明年初發(fā)布Gemini Ultra支持的進(jìn)階版Bard Advanced,在面向大眾推出以前,先將推出一個(gè)測(cè)試項(xiàng)目,以便改進(jìn)Bard Advanced。
谷歌的下圖展示了Gemini家族三個(gè)版本。
谷歌此次毫不諱言和GPT-4一較高低的雄心。發(fā)布Gemini前,谷歌對(duì)它進(jìn)行了一系列以標(biāo)準(zhǔn)行業(yè)指標(biāo)評(píng)估的測(cè)試。谷歌稱,在八項(xiàng)測(cè)試中,Gemini Pro有六項(xiàng)的表現(xiàn)優(yōu)于OpenAI 的 GPT-3.5。在通用語(yǔ)言理解、推理、數(shù)學(xué)和編碼方面測(cè)試中,八項(xiàng)基準(zhǔn)指標(biāo)里,Gemini 有七項(xiàng)超過(guò)了OpenAI 的最新版模型 GPT-4。
同時(shí),谷歌評(píng)估了旗下可以解釋和生成代碼的最新生成式AI產(chǎn)品AlphaCode 2,發(fā)現(xiàn)在競(jìng)爭(zhēng)性編程領(lǐng)域,它領(lǐng)先85%的競(jìng)爭(zhēng)對(duì)手。
DeepMind的CEO Demis Hassabis稱,谷歌運(yùn)行了32種完善的基準(zhǔn)指標(biāo)相關(guān)測(cè)試,對(duì)比Gemini和GPT-4這兩個(gè)模型,既有諸如多任務(wù)語(yǔ)言理解這類廣泛的整體測(cè)試,到生成Python代碼這種單一能力的測(cè)試。32種基準(zhǔn)指標(biāo)種,Gemini有30項(xiàng)都“遙遙領(lǐng)先”。
以下谷歌報(bào)告的截圖可見(jiàn),在多選問(wèn)題、數(shù)學(xué)問(wèn)題、Python代碼任務(wù)、閱讀等方面,Gemini Pro和Ultra與GPT-4、GPT-3.5等其他LLM的評(píng)分對(duì)比。
Gemini為原生多模態(tài)模型 在谷歌更高性能云芯片TPU v5p訓(xùn)練
谷歌稱,Gemini是一種“原生多模態(tài)”AI模型。這意味著它從一開(kāi)始就經(jīng)過(guò)預(yù)先訓(xùn)練,可以處理用戶基于文本和圖像的提示詞任務(wù),支持文本和圖像的服務(wù)。比如家長(zhǎng)可以通過(guò)上傳數(shù)學(xué)問(wèn)題的圖像,以及在工作表里嘗試解決問(wèn)題的照片,幫助孩子做家庭作業(yè)。Gemini還能閱讀答案,理解為何是對(duì)的、為何是錯(cuò)的,并解釋需要進(jìn)一步說(shuō)明的概念。
谷歌稱,谷歌搜索運(yùn)用生成式AI技術(shù)的“搜索生成式體驗(yàn)”在明年融入和Gemini的新功能。
谷歌承認(rèn),Gemini仍然可能存在AI產(chǎn)生的虛假信息或者捏造信息。Collins 稱這是尚未解決的研究問(wèn)題,不過(guò)他說(shuō),Gemini有迄今為止谷歌AI模型的最全面安全評(píng)估。為評(píng)估 Gemini 的安全性,谷歌對(duì)該模型進(jìn)行了對(duì)抗性測(cè)試,模仿有不良企圖的用戶利用該模型輸入提示詞,幫助研究人員檢查模型中是否存在仇恨言論和政治偏見(jiàn)。這類測(cè)試包括“真實(shí)毒性提示詞”,它包含從網(wǎng)上提取的10萬(wàn)多個(gè)提示詞。
谷歌強(qiáng)調(diào)Gemini的AI工具效率會(huì)非常高、速度非??臁K诠雀枳匝械男掳嬖菩酒琓ensor Processing Units(TPU)上訓(xùn)練,TPU v5p的性能更強(qiáng),該芯片訓(xùn)練現(xiàn)有模型的速度比前代快2.8倍。TPU v5p是為數(shù)據(jù)中心的訓(xùn)練和大模型運(yùn)行而設(shè)計(jì)。
谷歌機(jī)器學(xué)習(xí)副總裁 Amin Vahdat 表示,這種方法讓谷歌“對(duì)未來(lái)標(biāo)準(zhǔn)AI基礎(chǔ)設(shè)施有了新的認(rèn)識(shí)”。谷歌仍然使用第三方AI芯片運(yùn)行Gemini 模型。
谷歌提供的下圖可見(jiàn),谷歌數(shù)據(jù)中心內(nèi)成排的谷歌云TPU v5p AI 加速器超級(jí)計(jì)算機(jī)。