Meta 推出 Llama 4:終極多模態法學碩士
系列包含三個版本:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
2025 年 4 月初,Meta 推出了 Llama 4,這是旨在將公司提升到新水平的最新系列 AI 模型。每款新 Llama 4 車型都比其前代車型有顯著的改進,以下是值得嘗試的突出新功能。
3.混合專家(MoE)架構
Llama 4 型號最顯著的特點之一是全新的 MoE 架構,這是 Llama 系列的首創,它採用了與之前型號不同的方法。在新架構中,每個標記僅啟動一小部分模型參數,這與 Llama 3 及以下的傳統密集 Transformer 模型不同,在這些模型中,每個任務都會啟動所有參數。
例如,Llama 4 Maverick 僅使用 4000 億個活動參數中的 170 億個,擁有 128 個路由專家和 1 個共享專家。系列中最小的 Llama 4 Scout 共有 1,090 億個參數,16 位專家僅啟動了 170 億個。
該三人組中最大的版本 Llama 4 Behemoth 使用了總共近兩萬億個參數中的 2880 億個活躍參數(擁有 16 位專家)。由於這種新架構,每個任務僅分配兩名專家。
由於架構的變化,Llama 4系列中的模型在訓練和推理過程中計算效率更高。僅啟用一小部分參數可降低服務成本和延遲。 Meta 聲稱,由於 MoE 架構,Llama 可以在單一 Nvidia H100 GPU 上運行,考慮到參數數量,這是一項令人印象深刻的成就。雖然沒有具體的指標,但人們認為對ChatGPT的每個查詢都使用多個 Nvidia GPU,這會在幾乎每個可測量的指標中產生更大的開銷。
2. 原生多模態處理能力
Llama 4 AI 模型的另一個重要更新是原生多模式處理,這意味著這三種模型可以同時理解文字和圖像。
這要歸功於初始訓練階段所進行的組合,其中文字和視覺標記被整合到統一的架構中。使用大量未標記的文字、圖像和影片資料來訓練模型。
沒有比這更好的了。如果你還記得的話,Meta 的Llama 3.2升級版於 2024 年 9 月發布,引入了許多新模型(總共 10 個),其中包括 5 個多模式視覺模型和 5 個文字模型。隨著這一代產品的推出,由於原生的多模式處理能力,該公司不需要發佈單獨的文字和視覺模型。
此外,Llama 4 使用了改進的視覺編碼器,允許模型處理複雜的視覺推理任務和多圖像輸入,使其能夠處理需要高級理解文字和圖像的應用程式。多模式處理還允許 LLama 4 模型用於各種應用程式。
1. 業界領先的脈絡窗口
Llama 4 的 AI 模型擁有前所未有的高達 1000 萬個標記的上下文視窗。雖然 Llama 4 Behemoth 在發佈時仍處於開發階段,但 Llama 4 Scout 已經樹立了新的行業標桿,它能夠支援長達 1000 萬個上下文標記,讓您輸入長度超過 500 萬個單字的文字。
這個擴展的上下文長度與 Llama 3 首次推出時的 8k 個令牌相比有顯著增加,甚至與 Llama 3.2 升級後擴展到 128k 相比也有顯著增加。有趣的不僅是 Llama 4 Scout 的 1000 萬個上下文長度;即使是 Llama 4 Maverick,其上下文長度達一百萬,這也是一項令人印象深刻的成就。
Llama 3.2 是目前最好的用於擴展對話的 AI 聊天機器人之一。然而,Llama 4 擴展的上下文視窗使 Llama 處於領先地位,超過了 Gemini 之前的前 200 萬個令牌上下文視窗、Claude 3.7 Sonnet 的 20 萬個令牌上下文視窗和 GPT-4.5 的 12.8 萬個令牌上下文視窗。
憑藉大型上下文窗口,Llama 4 系列可以處理需要輸入大量資訊的任務。這個大視窗對於分析長篇、多篇文件、詳細分析大型程式碼庫以及推理大型資料集等任務很有用。
與先前的 Llama 型號和其他 AI 公司的模型不同,它還允許 Llama 4 進行擴展對話。如果說 Gemini 2.5 Pro 成為最佳推理模型的原因之一是其巨大的上下文窗口,那麼可以想像 5 倍或 10 倍的上下文窗口有多強大。
Meta 的 3 系列 Llama 型號一直是市場上最好的 LLM 之一。但隨著 Llama 4 系列的發布,Meta 更進一步,不僅專注於提高推理性能(得益於新的業界領先的上下文視窗),而且還透過在訓練和推理過程中使用新的 MoE 架構來確保最高效的模型。
Llama 4 的原生多模態處理能力、高效的 MoE 架構和大上下文視窗使其成為開放、高效能、靈活的權重加權 AI 模型,可以在推理、編碼和許多其他任務方面與領先模型競爭或超越它們。
身份驗證器應用程式增加了另一層安全性,並且是一種確認個人身份的簡單便捷的方式。 Duo Mobile 是同類應用程式中最受歡迎的之一。
早安圖片,帶有正面訊息的早安圖片將幫助我們擁有更多的精力和動力,從而更有效地度過一天。
Reno 5 Pro 5G與前代產品差別不大,依然保留了相同的6.5吋AMOLED曲面螢幕。
混合數是整數和分數的組合。混合數的小數部分始終小於 1。
您在旅行時預算有限嗎?別擔心,以下一位著名旅遊顧問分享的技巧將幫助您像富人一樣旅行。
當今流行的男性和女性符號的含義可能並不為人所知。讓我們進一步了解男性和女性的符號!
關於黑洞的一個常見誤解是,它們不僅吞噬物質,也吞噬物質的歷史。關於黑洞歷史的真相終於被解開了。
Adobe 在手機上提供了 4 多個特定的照片編輯應用程式 - 它們都非常相似,很難分辨出您真正需要哪一個。
普通電視仍然可以透過一些小工具學習新技巧,並在幾分鐘內變得比昂貴的智慧電視更好。
正確使用松下空調遙控器將幫助我們充分利用空調的功能。
Gemini Live 增加了「即時討論」功能,現在該功能將在 Android 裝置上更廣泛地推廣。先前,Gemini Live 只接受語音輸入,但「Talk Live about」擴展了內容上傳
微軟終於將深度研究功能引入了其 Copilot AI。它允許使用者對任何主題進行徹底的、多步驟的研究。
本教學將向您展示如何使用 Adobe Photoshop 輕鬆地將照片轉換為鉛筆素描。
Go 中的可變函數可讓您向函數傳遞可變數量的參數。以下是您需要了解的有關 Golang 中的易失性函數的所有資訊。
若要在 Lien Quan Mobile 中輸入彩色文本,請按照本文中的說明進行操作。 LQ Mobile 彩色字元將更加引人注目。