Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

中國人工智慧新創公司 DeepSeek 剛正式發布其最新的大型語言模型 (LLM) DeepSeek-V3-0324。該款機型容量高達 641GB,在 AI Hugging Face平台上發布,並未透露太多信息,符合該公司迄今為止對新產品一貫採取的保密風格。

該模型的特別之處在於 MIT 許可證,允許免費用於商業目的。初步基準測試結果顯示,DeepSeek-V3-0324 能夠在主流硬體配置上運行,例如搭載 M3 Ultra 晶片的 Apple Mac Studio。人工智慧科學家 Awni Hannun 報告稱,使用這種配置可以實現每秒超過 20 個代幣的處理速度。這種在本地商用硬體上運行大型語言模型的能力與使用海量資料中心基礎設施支援高級 AI 模型的傳統方法形成了鮮明對比。

Deepseek 發布免費語言模型 v3,可在常見硬體配置上運作良好

據DeepSeek透露,初步測試顯示,該版本與先前的版本相比有顯著的改進。該模型已經過內部利益相關者的嚴格測試,並表現出色,甚至超越了所有其他競爭模型,並在不需要深度思考的任務中擊敗了 Anthropic 的 Claude Sonnet 3.5。然而,與需要付費訂閱的 Sonnet 風格模型不同,DeepSeek-V3-0324 完全可以免費下載和使用。

從技術上講,DeepSeek-V3-0324 採用混合專家 (MoE) 架構。它因能夠在每個任務中選擇性地使用 6850 億個參數中的約 370 億個參數而脫穎而出,透過減少運算需求來提高效率,同時保持效能。該模型還應用了多頭潛在註意力(MLA)和多標記預測(MTP)技術,有助於提高情境記憶,並加快輸出速度。

使用者可以透過 Hugging Face、OpenRouter 的聊天介面和 API 以及 DeepSeek 的聊天平台(如果需要)存取 DeepSeek-V3-0324。推理服務提供者 Hyperbolic Labs 也提供對該模型的存取權限。

隨著DeepSeek-V3-0324的發布,該公司繼續在開發大型語言模型的競賽中確立自己的地位,同時為AI研發社群提供了強大且易於存取的選項。在商品硬體上運行的能力加上免費許可證必定會在不久的將來為該模型開闢許多實際應用機會。

Sign up and earn $1000 a day ⋙

Leave a Comment

為什麼 ChatGPT 比 DeepSeek 更好

為什麼 ChatGPT 比 DeepSeek 更好

最初,人們對DeepSeek寄予厚望。作為 ChatGPT 強勁競爭對手的 AI 聊天機器人,它承諾提供智慧聊天功能和體驗。

阿里巴巴推出 QwQ-32b,DeepSeek 的有力競爭對手

阿里巴巴推出 QwQ-32b,DeepSeek 的有力競爭對手

阿里巴巴的言論是否會成真還有待觀察,但看起來 ChatGPT 和 DeepSeek 現在有了一位強大的新競爭對手。

微軟將 DeepSeek 整合到 PC Copilot+ 平台

微軟將 DeepSeek 整合到 PC Copilot+ 平台

今年 1 月,微軟宣布計劃將針對 NPU 優化的 DeepSeek-R1 模型版本直接引入運行 Qualcomm Snapdragon X 處理器的 Copilot+ 電腦。

如何快速註冊DeepSeek帳號

如何快速註冊DeepSeek帳號

中國人工智慧應用DeepSeek目前在應用程式商店排行榜上名列前茅。

詐騙者正在利用 Deepseek 竊取用戶數據

詐騙者正在利用 Deepseek 竊取用戶數據

不法分子正在創建數千個類似 DeepSeek 的網站,希望毫無戒心的用戶向他們提供個人資訊。

軟銀計劃超越微軟成為 OpenAI 最大投資者

軟銀計劃超越微軟成為 OpenAI 最大投資者

日本投資巨頭軟銀計畫向 OpenAI 投資 150 億至 250 億美元。如果交易成功,軟銀將成為 OpenAI 的最大投資者,取代目前的微軟。

這些虛假的 DeepSeek 廣告正在傳播危險的惡意軟體

這些虛假的 DeepSeek 廣告正在傳播危險的惡意軟體

谷歌上的一系列 DeepSeek 詐騙廣告正在向毫無戒心的 DeepSeek 用戶投放危險的資訊竊取惡意軟體。

DeepSeek 邀請用戶探索公司開源 AI 的幕後故事

DeepSeek 邀請用戶探索公司開源 AI 的幕後故事

中國人工智慧新創公司 DeepSeek 計劃更加「透明」地展示其開源人工智慧模型(例如 R1 推理模型)背後的技術。

華為推出搭載 DeepSeek AI 助理的可折疊手機 Pura X

華為推出搭載 DeepSeek AI 助理的可折疊手機 Pura X

華為正透過 Pura X 開啟一個完全擺脫 Android 系統的時代,這是一款新型可折疊手機,運行該公司的 HarmonyOS 5 軟體,並且不提供使用Google作業系統的選項。

你應該放棄 ChatGPT 並開始使用 DeepSeek 的 4 個理由

你應該放棄 ChatGPT 並開始使用 DeepSeek 的 4 個理由

DeepSeek 是一家中國人工智慧公司及其同名聊天機器人的名稱。該公司的旗艦模型 DeepSeek-V3 和 DeepSeek-R1 之所以引起轟動,是因為它們的訓練和使用成本比同類車型更低。

忘掉 RTX 5070 吧,連 RTX 5080 也無法擊敗 RTX 4090

忘掉 RTX 5070 吧,連 RTX 5080 也無法擊敗 RTX 4090

過去一周對 Nvidia 的投資者和粉絲來說並不是愉快的一周。

美國考慮調查 Nvidia GPU 走私到中國用於運行 DeepSeek 的行為

美國考慮調查 Nvidia GPU 走私到中國用於運行 DeepSeek 的行為

DeepSeek 是一家中國公司,其開發的免費人工智慧模型正在震撼科技界,目前該公司正面臨多項負面指控,包括使用走私的 Nvidia GPU 來訓練和運行其同名人工智慧模型。

普通電視和智慧電視的差別

普通電視和智慧電視的差別

智慧電視確實風靡全球。憑藉如此多的強大功能和互聯網連接,科技改變了我們觀看電視的方式。

為什麼冷凍室沒有燈,冷藏室有燈?

為什麼冷凍室沒有燈,冷藏室有燈?

冰箱是家庭中常見的家用電器。冰箱通常有 2 個隔間,冷藏室寬敞,並且每次使用者打開時都會自動亮燈,而冷凍室狹窄且沒有燈。

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

除了路由器、頻寬和乾擾之外,Wi-Fi 網路還受到許多因素的影響,但也有一些智慧的方法可以增強您的網路效能。

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如果您想在手機上恢復穩定的 iOS 16,這裡是卸載 iOS 17 並從 iOS 17 降級到 16 的基本指南。

每天吃優​​格會對身體產生什麼影響?

每天吃優​​格會對身體產生什麼影響?

酸奶是一種美妙的食物。每天吃優​​格好嗎?每天吃酸奶,你的身體會發生怎樣的變化?讓我們一起來了解一下吧!

哪種米最有益於健康?

哪種米最有益於健康?

本文討論了最有營養的米種類以及如何最大限度地發揮所選米的健康益處。

如何早上準時起床

如何早上準時起床

制定睡眠時間表和就寢習慣、更改鬧鐘以及調整飲食都是可以幫助您睡得更好、早上準時起床的一些措施。

玩 Rent Please! 的提示新手模擬房東

玩 Rent Please! 的提示新手模擬房東

請租用! Landlord Sim 是一款適用於 iOS 和 Android 的模擬手機遊戲。您將扮演一個公寓大樓的房東,開始出租公寓,目標是升級公寓的內部並為租戶做好準備。

最新浴室塔防代碼及代碼輸入方法

最新浴室塔防代碼及代碼輸入方法

取得浴室塔防 Roblox 遊戲代碼並兌換令人興奮的獎勵。它們將幫助您升級或解鎖具有更高傷害的塔。

變壓器的結構、符號和工作原理

變壓器的結構、符號和工作原理

讓我們以最準確的方式了解變壓器的結構、符號和運作原理。

人工智慧讓智慧電視更上一層樓的四種方式

人工智慧讓智慧電視更上一層樓的四種方式

從更好的影像和聲音品質到語音控制等等,這些人工智慧功能讓智慧電視變得更好!

為什麼 ChatGPT 比 DeepSeek 更好

為什麼 ChatGPT 比 DeepSeek 更好

最初,人們對DeepSeek寄予厚望。作為 ChatGPT 強勁競爭對手的 AI 聊天機器人,它承諾提供智慧聊天功能和體驗。

認識 Fireflies.ai:免費的 AI 秘書,幫你節省大量工作時間

認識 Fireflies.ai:免費的 AI 秘書,幫你節省大量工作時間

在記下其他重要事項時很容易錯過重要細節,而在聊天時記筆記可能會分散注意力。 Fireflies.ai 就是解決方案。

如何飼養 Minecraft 中的美西蠑螈,馴服 Minecraft 中的蠑螈

如何飼養 Minecraft 中的美西蠑螈,馴服 Minecraft 中的蠑螈

如果玩家知道如何使用 Axolot Minecraft,它將成為玩家在水下操作時的絕佳助手。

《噤界:前路》PC遊戲配置

《噤界:前路》PC遊戲配置

《寂靜之地:前路》的配置評價相當高,因此您需要在決定下載之前考慮其配置。