Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

中國人工智慧新創公司 DeepSeek 剛正式發布其最新的大型語言模型 (LLM) DeepSeek-V3-0324。該款機型容量高達 641GB,在 AI Hugging Face平台上發布,並未透露太多信息,符合該公司迄今為止對新產品一貫採取的保密風格。

該模型的特別之處在於 MIT 許可證,允許免費用於商業目的。初步基準測試結果顯示,DeepSeek-V3-0324 能夠在主流硬體配置上運行,例如搭載 M3 Ultra 晶片的 Apple Mac Studio。人工智慧科學家 Awni Hannun 報告稱,使用這種配置可以實現每秒超過 20 個代幣的處理速度。這種在本地商用硬體上運行大型語言模型的能力與使用海量資料中心基礎設施支援高級 AI 模型的傳統方法形成了鮮明對比。

Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

據DeepSeek透露,初步測試顯示,該版本與先前的版本相比有顯著的改進。該模型已經過內部利益相關者的嚴格測試,並表現出色,甚至超越了所有其他競爭模型,並在不需要深度思考的任務中擊敗了 Anthropic 的 Claude Sonnet 3.5。然而,與需要付費訂閱的 Sonnet 風格模型不同,DeepSeek-V3-0324 完全可以免費下載和使用。

從技術上講,DeepSeek-V3-0324 採用混合專家 (MoE) 架構。它因能夠在每個任務中選擇性地使用 6850 億個參數中的約 370 億個參數而脫穎而出,透過減少運算需求來提高效率,同時保持效能。該模型還應用了多頭潛在註意力(MLA)和多標記預測(MTP)技術,有助於提高情境記憶,並加快輸出速度。

使用者可以透過 Hugging Face、OpenRouter 的聊天介面和 API 以及 DeepSeek 的聊天平台(如果需要)存取 DeepSeek-V3-0324。推理服務提供者 Hyperbolic Labs 也提供對該模型的存取權限。

隨著DeepSeek-V3-0324的發布,該公司繼續在開發大型語言模型的競賽中確立自己的地位,同時為AI研發社群提供了強大且易於存取的選項。在商品硬體上運行的能力加上免費許可證必定會在不久的將來為該模型開闢許多實際應用機會。

Sign up and earn $1000 a day ⋙

Leave a Comment

微軟將 DeepSeek 整合到 PC Copilot+ 平台

微軟將 DeepSeek 整合到 PC Copilot+ 平台

今年 1 月,微軟宣布計劃將針對 NPU 優化的 DeepSeek-R1 模型版本直接引入運行 Qualcomm Snapdragon X 處理器的 Copilot+ 電腦。

如何快速註冊DeepSeek帳號

如何快速註冊DeepSeek帳號

中國人工智慧應用DeepSeek目前在應用程式商店排行榜上名列前茅。

詐騙者正在利用 Deepseek 竊取用戶數據

詐騙者正在利用 Deepseek 竊取用戶數據

不法分子正在創建數千個類似 DeepSeek 的網站,希望毫無戒心的用戶向他們提供個人資訊。

軟銀計劃超越微軟成為 OpenAI 最大投資者

軟銀計劃超越微軟成為 OpenAI 最大投資者

日本投資巨頭軟銀計畫向 OpenAI 投資 150 億至 250 億美元。如果交易成功,軟銀將成為 OpenAI 的最大投資者,取代目前的微軟。

這些虛假的 DeepSeek 廣告正在傳播危險的惡意軟體

這些虛假的 DeepSeek 廣告正在傳播危險的惡意軟體

谷歌上的一系列 DeepSeek 詐騙廣告正在向毫無戒心的 DeepSeek 用戶投放危險的資訊竊取惡意軟體。

DeepSeek 邀請用戶探索公司開源 AI 的幕後故事

DeepSeek 邀請用戶探索公司開源 AI 的幕後故事

中國人工智慧新創公司 DeepSeek 計劃更加「透明」地展示其開源人工智慧模型(例如 R1 推理模型)背後的技術。

華為推出搭載 DeepSeek AI 助理的可折疊手機 Pura X

華為推出搭載 DeepSeek AI 助理的可折疊手機 Pura X

華為正透過 Pura X 開啟一個完全擺脫 Android 系統的時代,這是一款新型可折疊手機,運行該公司的 HarmonyOS 5 軟體,並且不提供使用Google作業系統的選項。

你應該放棄 ChatGPT 並開始使用 DeepSeek 的 4 個理由

你應該放棄 ChatGPT 並開始使用 DeepSeek 的 4 個理由

DeepSeek 是一家中國人工智慧公司及其同名聊天機器人的名稱。該公司的旗艦模型 DeepSeek-V3 和 DeepSeek-R1 之所以引起轟動,是因為它們的訓練和使用成本比同類車型更低。

忘掉 RTX 5070 吧,連 RTX 5080 也無法擊敗 RTX 4090

忘掉 RTX 5070 吧,連 RTX 5080 也無法擊敗 RTX 4090

過去一周對 Nvidia 的投資者和粉絲來說並不是愉快的一周。

美國考慮調查 Nvidia GPU 走私到中國用於運行 DeepSeek 的行為

美國考慮調查 Nvidia GPU 走私到中國用於運行 DeepSeek 的行為

DeepSeek 是一家中國公司,其開發的免費人工智慧模型正在震撼科技界,目前該公司正面臨多項負面指控,包括使用走私的 Nvidia GPU 來訓練和運行其同名人工智慧模型。

你意想不到的折疊螢幕手機8大缺點

你意想不到的折疊螢幕手機8大缺點

無可否認,可折疊手機非常酷。但使用一段時間後,發現該設備有不少問題。折疊螢幕手機5大你意想不到的缺點!

Adobe 將 AI 影片創作技術引入 Premiere Pro

Adobe 將 AI 影片創作技術引入 Premiere Pro

Adobe 以新的方式將 AI 影片創作技術帶給了大眾,儘管目前尚未使用該技術製作完整的電影。

2025年4月最新原神代碼

2025年4月最新原神代碼

原神 5.5 代碼可幫助您兌換原始石、魔法礦物、經驗和許多其他獎勵。

如何將 iPad 變成額外的 Mac 顯示器

如何將 iPad 變成額外的 Mac 顯示器

macOS Catalina 和 iPadOS 支援一項名為 Sidecar 的新功能,旨在讓您將 iPad 用作 Mac 的輔助顯示器。

桌布1280,漂亮的諾基亞1280手機桌布

桌布1280,漂亮的諾基亞1280手機桌布

這是一組諾基亞 1280 壁紙,如果您曾經發短信獲取 1280 壁紙、磚塊手機壁紙,那麼請嘗試看看這些壁紙。

高超音速太空飛機速度達11115公里/小時

高超音速太空飛機速度達11115公里/小時

維納斯航空航太公司公佈了其新型高超音速飛機 Stargazer 的首批影像,該機最高時速可達 11,115 公里/小時,相當於 9 馬赫。

早餐吃香蕉有助於減少腹脹

早餐吃香蕉有助於減少腹脹

任何人都可能出現腹脹。好消息是,早餐是為您的餐點添加一些有助於減少腹脹的食材的最佳時機。那個成分是香蕉。

OpenAI 宣布對 ChatGPT 中的 AI 影像生成進行重大更新

OpenAI 宣布對 ChatGPT 中的 AI 影像生成進行重大更新

OpenAI 剛剛正式介紹了 ChatGPT 中 AI 影像生成能力的顯著升級,這是一個重要的進步,而不是像之前的 DALL-E 那樣使用單獨的影像生成模型。

Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

中國人工智慧新創公司 DeepSeek 剛正式發布其最新的大型語言模型 (LLM) DeepSeek-V3-0324。

放棄 Gboard 並改用三星鍵盤的理由

放棄 Gboard 並改用三星鍵盤的理由

Gboard 長期以來一直是 Android 手機上的首選鍵盤。然而,最近許多人已經轉而使用三星鍵盤並且不再後悔。

給情侶們甜蜜浪漫的週末祝福

給情侶們甜蜜浪漫的週末祝福

向您的愛人送去甜蜜浪漫的週末祝福。雖然它們只是文字或訊息,但它們將是有意義的精神禮物,有助於加強你們的關係。

哈利波特電視劇需要以下元素才能成功

哈利波特電視劇需要以下元素才能成功

HBO 的《哈利波特》重拍版預計將於 2026 年首播。以下是電視劇《哈利波特》成功的原因。

來自世界各地的令人驚嘆的超級月亮照片

來自世界各地的令人驚嘆的超級月亮照片

美麗的月亮圖片在網路上並不罕見。本文將為您總結世界上最美麗的月球照片。

AMD Ryzen 用戶應安裝此 BIOS 更新以免費提升效能

AMD Ryzen 用戶應安裝此 BIOS 更新以免費提升效能

現在,AMD 已針對其旗艦 CPU 系列效能不佳的問題推出了新更新,每秒可提供更多幀數。

X 的價值從 440 億美元跌至 100 億美元以下

X 的價值從 440 億美元跌至 100 億美元以下

2022 年 10 月,馬斯克斥資 440 億美元收購了 X,但迄今為止該平台的價值已下跌 78.6%,至約 94 億美元。