无码中文av有码中文av,96在线精品视频免费观看,A级成人毛片免费视

Meta發(fā)布Llama 4系列AI模型

引入“混合專家架構(gòu)”提升效率

日期： 2025-04-07

來(lái)源：IT之家

關(guān)鍵詞： META Llama4 AI模型

4 月 6 日消息，Meta 現(xiàn)已發(fā)布旗下最新 Llama 4 系列 AI 模型，包含 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth，Meta 透露相應(yīng)模型都經(jīng)過(guò)了“大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)”的訓(xùn)練，以使它們具備“廣泛的視覺理解能力”。

目前，Meta 已將系列模型中的 Scout 和 Maverick 上架到 Hugging Face（點(diǎn)此訪問(wèn)），而 Behemoth 模型則還在訓(xùn)練中。其中 Scout 可以在單個(gè)英偉達(dá) H100 GPU 上運(yùn)行，而 Maverick 則需要英偉達(dá) H100 DGX AI 平臺(tái)或“同等性能的設(shè)備”。

Meta 表示，Llama 4 系列模型是該公司旗下首批采用混合專家（MoE）架構(gòu)的模型，這種架構(gòu)在訓(xùn)練和回答用戶查詢時(shí)的效率更高，所謂“混合專家架構(gòu)”基本上是將數(shù)據(jù)處理任務(wù)分解為子任務(wù)，然后將它們委派給更小的、專門的“專家”模型。

例如，Maverick 總共有 4000 億個(gè)參數(shù)，但在 128 個(gè)“專家”模型中只有 170 億個(gè)活躍參數(shù)（參數(shù)數(shù)量大致與模型的問(wèn)題解決能力相對(duì)應(yīng)）。Scout 有 170 億個(gè)活躍參數(shù)、16 個(gè)“專家”模型以及總計(jì) 1090 億個(gè)參數(shù)。

不過(guò)值得注意的是，Llama 4 系列中沒(méi)有一個(gè)模型是像 OpenAI 的 o1 和 o3-mini 那樣真正意義上的“推理模型”。作為比較，“推理模型”會(huì)對(duì)其答案進(jìn)行事實(shí)核查，并且通常能更可靠地回答問(wèn)題，但因此也比傳統(tǒng)的“非推理”模型花費(fèi)更長(zhǎng)的時(shí)間來(lái)給出答案。

Meta 內(nèi)部測(cè)試顯示，Maverick 模型最適合用于“通用 AI 助手和聊天”等應(yīng)用場(chǎng)景，該模型在創(chuàng)意寫作、代碼生成、翻譯、推理、長(zhǎng)文本上下文總結(jié)和圖像基準(zhǔn)測(cè)試中表現(xiàn)超過(guò)了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而 Maverick 與谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更強(qiáng)大的最新模型相比仍有一定進(jìn)步空間。

而 Scout 的優(yōu)勢(shì)則是總結(jié)文檔、基于大型代碼庫(kù)進(jìn)行推理。該模型支持 1000 萬(wàn)個(gè)詞元（“詞元”代表原始文本的片段，例如單詞“fantastic”可拆分為“fan”、“tas”和“tic”），因此一次可以處理“多達(dá)數(shù)百萬(wàn)字的文本”。

Meta 還進(jìn)一步預(yù)告了其 Behemoth 模型，據(jù)該公司稱，Behemoth 有 2880 億個(gè)活躍參數(shù)、16 個(gè)“專家”模型，總參數(shù)數(shù)量接近 2 萬(wàn)億個(gè)。Meta 的內(nèi)部基準(zhǔn)測(cè)試顯示，在一些衡量解決數(shù)學(xué)問(wèn)題等科學(xué)、技術(shù)、工程和數(shù)學(xué)（STEM）技能的評(píng)估中，Behemoth 的表現(xiàn)優(yōu)于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro，但不如 Gemini 2.5 Pro。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

Meta發(fā)布Llama 4系列AI模型

日期： 2025-04-07

來(lái)源：IT之家

相關(guān)內(nèi)容