Meta AI Llama 4 模型的 3 大新功能

2025 年 4 月初,Meta 推出了 Llama 4,這是旨在將公司提升到新水平的最新系列 AI 模型。每款新 Llama 4 車型都比其前代車型有顯著的改進,以下是值得嘗試的突出新功能。

3.混合專家(MoE)架構

Llama 4 型號最顯著的特點之一是全新的 MoE 架構,這是 Llama 系列的首創,它採用了與之前型號不同的方法。在新架構中,每個標記僅啟動一小部分模型參數,這與 Llama 3 及以下的傳統密集 Transformer 模型不同,在這些模型中,每個任務都會啟動所有參數。

例如,Llama 4 Maverick 僅使用 4000 億個活動參數中的 170 億個,擁有 128 個路由專家和 1 個共享專家。系列中最小的 Llama 4 Scout 共有 1,090 億個參數,16 位專家僅啟動了 170 億個。

該三人組中最大的版本 Llama 4 Behemoth 使用了總共近兩萬億個參數中的 2880 億個活躍參數(擁有 16 位專家)。由於這種新架構,每個任務僅分配兩名專家。

由於架構的變化,Llama 4系列中的模型在訓練和推理過程中計算效率更高。僅啟用一小部分參數可降低服務成本和延遲。 Meta 聲稱,由於 MoE 架構,Llama 可以在單一 Nvidia H100 GPU 上運行,考慮到參數數量,這是一項令人印象深刻的成就。雖然沒有具體的指標,但人們認為對ChatGPT的每個查詢都使用多個 Nvidia GPU,這會在幾乎每個可測量的指標中產生更大的開銷。

2. 原生多模態處理能力

Llama 4 AI 模型的另一個重要更新是原生多模式處理,這意味著這三種模型可以同時理解文字和圖像。

這要歸功於初始訓練階段所進行的組合,其中文字和視覺標記被整合到統一的架構中。使用大量未標記的文字、圖像和影片資料來訓練模型。

Meta AI Llama 4 模型的 3 大新功能

沒有比這更好的了。如果你還記得的話,Meta 的Llama 3.2升級版於 2024 年 9 月發布,引入了許多新模型(總共 10 個),其中包括 5 個多模式視覺模型和 5 個文字模型。隨著這一代產品的推出,由於原生的多模式處理能力,該公司不需要發佈單獨的文字和視覺模型。

此外,Llama 4 使用了改進的視覺編碼器,允許模型處理複雜的視覺推理任務和多圖像輸入,使其能夠處理需要高級理解文字和圖像的應用程式。多模式處理還允許 LLama 4 模型用於各種應用程式。

1. 業界領先的脈絡窗口

Llama 4 的 AI 模型擁有前所未有的高達 1000 萬個標記的上下文視窗。雖然 Llama 4 Behemoth 在發佈時仍處於開發階段,但 Llama 4 Scout 已經樹立了新的行業標桿,它能夠支援長達 1000 萬個上下文標記,讓您輸入長度超過 500 萬個單字的文字。

這個擴展的上下文長度與 Llama 3 首次推出時的 8k 個令牌相比有顯著增加,甚至與 Llama 3.2 升級後擴展到 128k 相比也有顯著增加。有趣的不僅是 Llama 4 Scout 的 1000 萬個上下文長度;即使是 Llama 4 Maverick,其上下文長度達一百萬,這也是一項令人印象深刻的成就。

Llama 3.2 是目前最好的用於擴展對話的 AI 聊天機器人之一。然而,Llama 4 擴展的上下文視窗使 Llama 處於領先地位,超過了 Gemini 之前的前 200 萬個令牌上下文視窗、Claude 3.7 Sonnet 的 20 萬個令牌上下文視窗和 GPT-4.5 的 12.8 萬個令牌上下文視窗。

Meta AI Llama 4 模型的 3 大新功能

憑藉大型上下文窗口,Llama 4 系列可以處理需要輸入大量資訊的任務。這個大視窗對於分析長篇、多篇文件、詳細分析大型程式碼庫以及推理大型資料集等任務很有用。

與先前的 Llama 型號和其他 AI 公司的模型不同,它還允許 Llama 4 進行擴展對話。如果說 Gemini 2.5 Pro 成為最佳推理模型的原因之一是其巨大的上下文窗口,那麼可以想像 5 倍或 10 倍的上下文窗口有多強大。

Meta 的 3 系列 Llama 型號一直是市場上最好的 LLM 之一。但隨著 Llama 4 系列的發布,Meta 更進一步,不僅專注於提高推理性能(得益於新的業界領先的上下文視窗),而且還透過在訓練和推理過程中使用新的 MoE 架構來確保最高效的模型。

Llama 4 的原生多模態處理能力、高效的 MoE 架構和大上下文視窗使其成為開放、高效能、靈活的權重加權 AI 模型,可以在推理、編碼和許多其他任務方面與領先模型競爭或超越它們。

Sign up and earn $1000 a day ⋙

Leave a Comment

Duo Mobile 是什麼? Duo Mobile 使用安全嗎?

Duo Mobile 是什麼? Duo Mobile 使用安全嗎?

身份驗證器應用程式增加了另一層安全性,並且是一種確認個人身份的簡單便捷的方式。 Duo Mobile 是同類應用程式中最受歡迎的之一。

早安圖片,美麗的新一天圖片

早安圖片,美麗的新一天圖片

早安圖片,帶有正面訊息的早安圖片將幫助我們擁有更多的精力和動力,從而更有效地度過一天。

OPPO Reno 5 Pro 5G 評測:其他競爭對手需謹慎

OPPO Reno 5 Pro 5G 評測:其他競爭對手需謹慎

Reno 5 Pro 5G與前代產品差別不大,依然保留了相同的6.5吋AMOLED曲面螢幕。

什麼是混合數?

什麼是混合數?

混合數是整數和分數的組合。混合數的小數部分始終小於 1。

像富人一樣旅行的秘訣

像富人一樣旅行的秘訣

您在旅行時預算有限嗎?別擔心,以下一位著名旅遊顧問分享的技巧將幫助您像富人一樣旅行。

男性和女性的象徵從何而來?

男性和女性的象徵從何而來?

當今流行的男性和女性符號的含義可能並不為人所知。讓我們進一步了解男性和女性的符號!

科學家破解了黑洞的神秘歷史

科學家破解了黑洞的神秘歷史

關於黑洞的一個常見誤解是,它們不僅吞噬物質,也吞噬物質的歷史。關於黑洞歷史的真相終於被解開了。

無需多個 Adob​​e Mobile 應用程序,Adobe Express 就是您唯一需要的應用程式!

無需多個 Adob​​e Mobile 應用程序,Adobe Express 就是您唯一需要的應用程式!

Adobe 在手機上提供了 4 多個特定的照片編輯應用程式 - 它們都非常相似,很難分辨出您真正需要哪一個。

5個小工具讓普通電視變智慧電視

5個小工具讓普通電視變智慧電視

普通電視仍然可以透過一些小工具學習新技巧,並在幾分鐘內變得比昂貴的智慧電視更好。

松下空調遙控器使用方法

松下空調遙控器使用方法

正確使用松下空調遙控器將幫助我們充分利用空調的功能。

Gemini 推出 Talk Live 功能,用於照片、檔案和 YouTube

Gemini 推出 Talk Live 功能,用於照片、檔案和 YouTube

Gemini Live 增加了「即時討論」功能,現在該功能將在 Android 裝置上更廣泛地推廣。先前,Gemini Live 只接受語音輸入,但「Talk Live about」擴展了內容上傳

Microsoft Copilot 經過深入研究升級

Microsoft Copilot 經過深入研究升級

微軟終於將深度研究功能引入了其 Copilot AI。它允許使用者對任何主題進行徹底的、多步驟的研究。

如何在 Photoshop 中將照片變成鉛筆素描

如何在 Photoshop 中將照片變成鉛筆素描

本教學將向您展示如何使用 Adob​​e Photoshop 輕鬆地將照片轉換為鉛筆素描。

Golang 中的 Volatile 函數

Golang 中的 Volatile 函數

Go 中的可變函數可讓您向函數傳遞可變數量的參數。以下是您需要了解的有關 Golang 中的易失性函數的所有資訊。

如何在 Lien Quan Mobile 中書寫彩色字母

如何在 Lien Quan Mobile 中書寫彩色字母

若要在 Lien Quan Mobile 中輸入彩色文本,請按照本文中的說明進行操作。 LQ Mobile 彩色字元將更加引人注目。