Meta 推出 Llama 4:終極多模態法學碩士
系列包含三個版本:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
2025 年 4 月初,Meta 推出了 Llama 4,這是旨在將公司提升到新水平的最新系列 AI 模型。每款新 Llama 4 車型都比其前代車型有顯著的改進,以下是值得嘗試的突出新功能。
3.混合專家(MoE)架構
Llama 4 型號最顯著的特點之一是全新的 MoE 架構,這是 Llama 系列的首創,它採用了與之前型號不同的方法。在新架構中,每個標記僅啟動一小部分模型參數,這與 Llama 3 及以下的傳統密集 Transformer 模型不同,在這些模型中,每個任務都會啟動所有參數。
例如,Llama 4 Maverick 僅使用 4000 億個活動參數中的 170 億個,擁有 128 個路由專家和 1 個共享專家。系列中最小的 Llama 4 Scout 共有 1,090 億個參數,16 位專家僅啟動了 170 億個。
該三人組中最大的版本 Llama 4 Behemoth 使用了總共近兩萬億個參數中的 2880 億個活躍參數(擁有 16 位專家)。由於這種新架構,每個任務僅分配兩名專家。
由於架構的變化,Llama 4系列中的模型在訓練和推理過程中計算效率更高。僅啟用一小部分參數可降低服務成本和延遲。 Meta 聲稱,由於 MoE 架構,Llama 可以在單一 Nvidia H100 GPU 上運行,考慮到參數數量,這是一項令人印象深刻的成就。雖然沒有具體的指標,但人們認為對ChatGPT的每個查詢都使用多個 Nvidia GPU,這會在幾乎每個可測量的指標中產生更大的開銷。
2. 原生多模態處理能力
Llama 4 AI 模型的另一個重要更新是原生多模式處理,這意味著這三種模型可以同時理解文字和圖像。
這要歸功於初始訓練階段所進行的組合,其中文字和視覺標記被整合到統一的架構中。使用大量未標記的文字、圖像和影片資料來訓練模型。
沒有比這更好的了。如果你還記得的話,Meta 的Llama 3.2升級版於 2024 年 9 月發布,引入了許多新模型(總共 10 個),其中包括 5 個多模式視覺模型和 5 個文字模型。隨著這一代產品的推出,由於原生的多模式處理能力,該公司不需要發佈單獨的文字和視覺模型。
此外,Llama 4 使用了改進的視覺編碼器,允許模型處理複雜的視覺推理任務和多圖像輸入,使其能夠處理需要高級理解文字和圖像的應用程式。多模式處理還允許 LLama 4 模型用於各種應用程式。
1. 業界領先的脈絡窗口
Llama 4 的 AI 模型擁有前所未有的高達 1000 萬個標記的上下文視窗。雖然 Llama 4 Behemoth 在發佈時仍處於開發階段,但 Llama 4 Scout 已經樹立了新的行業標桿,它能夠支援長達 1000 萬個上下文標記,讓您輸入長度超過 500 萬個單字的文字。
這個擴展的上下文長度與 Llama 3 首次推出時的 8k 個令牌相比有顯著增加,甚至與 Llama 3.2 升級後擴展到 128k 相比也有顯著增加。有趣的不僅是 Llama 4 Scout 的 1000 萬個上下文長度;即使是 Llama 4 Maverick,其上下文長度達一百萬,這也是一項令人印象深刻的成就。
Llama 3.2 是目前最好的用於擴展對話的 AI 聊天機器人之一。然而,Llama 4 擴展的上下文視窗使 Llama 處於領先地位,超過了 Gemini 之前的前 200 萬個令牌上下文視窗、Claude 3.7 Sonnet 的 20 萬個令牌上下文視窗和 GPT-4.5 的 12.8 萬個令牌上下文視窗。
憑藉大型上下文窗口,Llama 4 系列可以處理需要輸入大量資訊的任務。這個大視窗對於分析長篇、多篇文件、詳細分析大型程式碼庫以及推理大型資料集等任務很有用。
與先前的 Llama 型號和其他 AI 公司的模型不同,它還允許 Llama 4 進行擴展對話。如果說 Gemini 2.5 Pro 成為最佳推理模型的原因之一是其巨大的上下文窗口,那麼可以想像 5 倍或 10 倍的上下文窗口有多強大。
Meta 的 3 系列 Llama 型號一直是市場上最好的 LLM 之一。但隨著 Llama 4 系列的發布,Meta 更進一步,不僅專注於提高推理性能(得益於新的業界領先的上下文視窗),而且還透過在訓練和推理過程中使用新的 MoE 架構來確保最高效的模型。
Llama 4 的原生多模態處理能力、高效的 MoE 架構和大上下文視窗使其成為開放、高效能、靈活的權重加權 AI 模型,可以在推理、編碼和許多其他任務方面與領先模型競爭或超越它們。
祖卡是一名刺客,以讓生命值低的英雄感到恐懼而聞名。了解如何在第 23 季中有效地使用 Zuka。
透過英雄時代禮品碼接收禮物是幾乎所有新玩家加入遊戲時都會做的事情。
讓我們來看看最便宜的線上雲端儲存選項。本文將從絕對價格和每千兆位元組(每月)兩個角度來探討定價,以便您選擇最適合自己的價格。
Excel 中的 #### 是一個常見的 Excel 錯誤,當我們在 Excel 中輸入資料、在 Excel 中輸入函數、在 Excel 中輸入公式時,它會出現在許多不同的情況下。
剛買了三星 Galaxy 手機並需要對其進行配置?以下是您應該更改的 10 個設置,以使您的三星手機運行得更好。
《Code Murder Mystery 2》幫助玩家為他們的角色選擇更多的刀皮,或獲得更多的錢來用於服務和購買遊戲中的其他東西。
愛人、父母、朋友、兄弟姊妹、同事……生日的時候,除了禮物,別忘了送上生日卡,表達祝福。
這些有趣的測驗將幫助你給你暗戀的人留下深刻的印象并快速而愉快地征服他的心。
如果 Corki DTCL 第 7 季想要自由摧毀敵方隊伍,他需要保護或支持來控制。同時,科奇的裝備也必須是標準的,才能造成更有效的傷害。
這是 Mini World Royale 的下載連結和遊戲說明,我們將有兩個版本:Mini World Royale APK 和 Mini World Royale iOS。
1314是年輕人常用來作為愛情暗號的數字。然而,並不是所有人都知道1314是什麼以及它意味著什麼?
處理有害情況可能極為困難。這裡有一些技巧可以幫助您巧妙地處理有毒環境並保持內心的平靜。
大多數人都知道音樂不僅僅用於娛樂,它還有更多的好處。以下是音樂刺激我們大腦發育的一些方式。
飲食對我們的健康非常重要。然而,我們大多數的飲食往往缺乏這六種重要營養素。
想要最快獲得 Circle K 的促銷訊息,您應該安裝 CK Club 應用程式。該應用程式可保存在 Circle K 購物或付款時的付款金額以及收集的印章數量。