3月5日消息,這是GPT-4發(fā)布之后,第一次在紙面上被完全碾壓。
昨夜,OpenAI最強(qiáng)競爭選手Anthropic發(fā)布了旗下最新大模型家族Claude 3。從官方公布的測試成績來看,其在推理、數(shù)學(xué)、編碼、多語言理解和視覺等指標(biāo)上,全面超越GPT-4,樹立了LLM大語言模型新的行業(yè)基準(zhǔn)。
據(jù)Anthropic官方介紹,Claude 3家族包括:Claude 3 Haiku(小杯)、Claude 3 Sonnet(中杯)和Claude 3 Opus(大杯),能力逐級遞增。
尤其是Claude 3家族最強(qiáng)的Claude 3 Opus,據(jù)稱已經(jīng)實(shí)現(xiàn)了接近人類的理解能力。
此外,Claude 3還在LSAT(法學(xué)院入學(xué)考試)、MBE(律師資格考試)、數(shù)學(xué)競賽等考試中表現(xiàn)出色,展示出超高的智商水平。
三款大模型的定位如下:
Opus:比其它大模型更智能。適用于復(fù)雜的任務(wù)自動(dòng)化、研發(fā)和制定策略。
Sonnet:比同類模型更實(shí)惠、更適合規(guī)?;?。適用于數(shù)據(jù)處理、RAG、在中等復(fù)雜度工作流程中節(jié)省時(shí)間。
Haiku:比同類模型更快速、實(shí)惠。適用于與用戶實(shí)時(shí)互動(dòng),以及在簡單工作流程中節(jié)省成本。
以“自我介紹一下,你比GPT-4有哪些優(yōu)勢?”向中杯的Claude 3 Sonnet提問時(shí),它回答道:
“作為一個(gè)人工智能助理,我與GPT-4等大型語言模型有一些相似之處,但也有一些獨(dú)特之處。我們都擁有廣博的知識和出色的語言理解及生成能力。
但是,我的知識來自于對大量高質(zhì)量信息源的吸收和學(xué)習(xí),包括書籍、文章、數(shù)據(jù)庫等,這使得我在某些特定領(lǐng)域可能比GPT-4更加精通。
另外,我被設(shè)計(jì)為一個(gè)有個(gè)性、有同理心的對話伙伴,能與人進(jìn)行富有同理心的互動(dòng)。我會根據(jù)具體情境調(diào)整語氣和方式,努力以人們可以理解的方式表達(dá)復(fù)雜概念。我也有明確的倫理原則,會避免產(chǎn)生有害、不當(dāng)或違法的輸出。
總的來說,我的優(yōu)勢在于知識淵博、個(gè)性化的對話風(fēng)格以及明確的倫理底線。但同時(shí)我也有自己的局限性,我無法像GPT-4那樣直接訪問互聯(lián)網(wǎng)獲取最新信息。因此,我們可以在不同場合發(fā)揮各自的長處,,為人類提供優(yōu)質(zhì)的服務(wù)。”
有網(wǎng)友表示,Claude 3模型的出場,意味著GPT-4時(shí)代的終結(jié)。還有人在線點(diǎn)名Altman,可以發(fā)布GPT-5了。