Meta 推出 Llama 4:終極多模態法學碩士
系列包含三個版本:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
2025 年 4 月初,Meta 推出了 Llama 4,這是旨在將公司提升到新水平的最新系列 AI 模型。每款新 Llama 4 車型都比其前代車型有顯著的改進,以下是值得嘗試的突出新功能。
3.混合專家(MoE)架構
Llama 4 型號最顯著的特點之一是全新的 MoE 架構,這是 Llama 系列的首創,它採用了與之前型號不同的方法。在新架構中,每個標記僅啟動一小部分模型參數,這與 Llama 3 及以下的傳統密集 Transformer 模型不同,在這些模型中,每個任務都會啟動所有參數。
例如,Llama 4 Maverick 僅使用 4000 億個活動參數中的 170 億個,擁有 128 個路由專家和 1 個共享專家。系列中最小的 Llama 4 Scout 共有 1,090 億個參數,16 位專家僅啟動了 170 億個。
該三人組中最大的版本 Llama 4 Behemoth 使用了總共近兩萬億個參數中的 2880 億個活躍參數(擁有 16 位專家)。由於這種新架構,每個任務僅分配兩名專家。
由於架構的變化,Llama 4系列中的模型在訓練和推理過程中計算效率更高。僅啟用一小部分參數可降低服務成本和延遲。 Meta 聲稱,由於 MoE 架構,Llama 可以在單一 Nvidia H100 GPU 上運行,考慮到參數數量,這是一項令人印象深刻的成就。雖然沒有具體的指標,但人們認為對ChatGPT的每個查詢都使用多個 Nvidia GPU,這會在幾乎每個可測量的指標中產生更大的開銷。
2. 原生多模態處理能力
Llama 4 AI 模型的另一個重要更新是原生多模式處理,這意味著這三種模型可以同時理解文字和圖像。
這要歸功於初始訓練階段所進行的組合,其中文字和視覺標記被整合到統一的架構中。使用大量未標記的文字、圖像和影片資料來訓練模型。
沒有比這更好的了。如果你還記得的話,Meta 的Llama 3.2升級版於 2024 年 9 月發布,引入了許多新模型(總共 10 個),其中包括 5 個多模式視覺模型和 5 個文字模型。隨著這一代產品的推出,由於原生的多模式處理能力,該公司不需要發佈單獨的文字和視覺模型。
此外,Llama 4 使用了改進的視覺編碼器,允許模型處理複雜的視覺推理任務和多圖像輸入,使其能夠處理需要高級理解文字和圖像的應用程式。多模式處理還允許 LLama 4 模型用於各種應用程式。
1. 業界領先的脈絡窗口
Llama 4 的 AI 模型擁有前所未有的高達 1000 萬個標記的上下文視窗。雖然 Llama 4 Behemoth 在發佈時仍處於開發階段,但 Llama 4 Scout 已經樹立了新的行業標桿,它能夠支援長達 1000 萬個上下文標記,讓您輸入長度超過 500 萬個單字的文字。
這個擴展的上下文長度與 Llama 3 首次推出時的 8k 個令牌相比有顯著增加,甚至與 Llama 3.2 升級後擴展到 128k 相比也有顯著增加。有趣的不僅是 Llama 4 Scout 的 1000 萬個上下文長度;即使是 Llama 4 Maverick,其上下文長度達一百萬,這也是一項令人印象深刻的成就。
Llama 3.2 是目前最好的用於擴展對話的 AI 聊天機器人之一。然而,Llama 4 擴展的上下文視窗使 Llama 處於領先地位,超過了 Gemini 之前的前 200 萬個令牌上下文視窗、Claude 3.7 Sonnet 的 20 萬個令牌上下文視窗和 GPT-4.5 的 12.8 萬個令牌上下文視窗。
憑藉大型上下文窗口,Llama 4 系列可以處理需要輸入大量資訊的任務。這個大視窗對於分析長篇、多篇文件、詳細分析大型程式碼庫以及推理大型資料集等任務很有用。
與先前的 Llama 型號和其他 AI 公司的模型不同,它還允許 Llama 4 進行擴展對話。如果說 Gemini 2.5 Pro 成為最佳推理模型的原因之一是其巨大的上下文窗口,那麼可以想像 5 倍或 10 倍的上下文窗口有多強大。
Meta 的 3 系列 Llama 型號一直是市場上最好的 LLM 之一。但隨著 Llama 4 系列的發布,Meta 更進一步,不僅專注於提高推理性能(得益於新的業界領先的上下文視窗),而且還透過在訓練和推理過程中使用新的 MoE 架構來確保最高效的模型。
Llama 4 的原生多模態處理能力、高效的 MoE 架構和大上下文視窗使其成為開放、高效能、靈活的權重加權 AI 模型,可以在推理、編碼和許多其他任務方面與領先模型競爭或超越它們。
智慧電視確實風靡全球。憑藉如此多的強大功能和互聯網連接,科技改變了我們觀看電視的方式。
冰箱是家庭中常見的家用電器。冰箱通常有 2 個隔間,冷藏室寬敞,並且每次使用者打開時都會自動亮燈,而冷凍室狹窄且沒有燈。
除了路由器、頻寬和乾擾之外,Wi-Fi 網路還受到許多因素的影響,但也有一些智慧的方法可以增強您的網路效能。
如果您想在手機上恢復穩定的 iOS 16,這裡是卸載 iOS 17 並從 iOS 17 降級到 16 的基本指南。
酸奶是一種美妙的食物。每天吃優格好嗎?每天吃酸奶,你的身體會發生怎樣的變化?讓我們一起來了解一下吧!
本文討論了最有營養的米種類以及如何最大限度地發揮所選米的健康益處。
制定睡眠時間表和就寢習慣、更改鬧鐘以及調整飲食都是可以幫助您睡得更好、早上準時起床的一些措施。
請租用! Landlord Sim 是一款適用於 iOS 和 Android 的模擬手機遊戲。您將扮演一個公寓大樓的房東,開始出租公寓,目標是升級公寓的內部並為租戶做好準備。
取得浴室塔防 Roblox 遊戲代碼並兌換令人興奮的獎勵。它們將幫助您升級或解鎖具有更高傷害的塔。
讓我們以最準確的方式了解變壓器的結構、符號和運作原理。
從更好的影像和聲音品質到語音控制等等,這些人工智慧功能讓智慧電視變得更好!
最初,人們對DeepSeek寄予厚望。作為 ChatGPT 強勁競爭對手的 AI 聊天機器人,它承諾提供智慧聊天功能和體驗。
在記下其他重要事項時很容易錯過重要細節,而在聊天時記筆記可能會分散注意力。 Fireflies.ai 就是解決方案。
如果玩家知道如何使用 Axolot Minecraft,它將成為玩家在水下操作時的絕佳助手。
《寂靜之地:前路》的配置評價相當高,因此您需要在決定下載之前考慮其配置。