Cerebras 推出全球最快 AI 推理技術,效能比 NVIDIA 快 20 倍

Cerebras Systems 剛剛正式宣布推出 Cerebras Inference,被認為是世界上最快的 AI 推理解決方案。 Cerebras Inference 為 Llama 3.1 8B(80 億個參數)模型提供高達每秒 1,800 個代幣的效能,為 Llama 3.1 70B 提供高達每秒 450 個代幣的效能,比包括 Microsoft Azure 在內的當今全球超大規模雲中可用的基於 NVIDIA GPU 的 AI 推理比包括 Microsoft Azure 在內的當今全球超大規模雲中可用的基於 NVIDIA GPU 的 AI 推理比包括 Microsoft Azure 20 倍快近解決方案快。

除了令人難以置信的效能表現之外,這款全新推理解決方案的服務價格也非常便宜,僅為熱門GPU雲端平台價格的一小部分。例如,客戶只需花費 10 美分即可獲得 100 萬個代幣,為 AI 工作負載提供 100 倍的性價比。

Cerebras 的 16 位元精度和 20 倍的推理速度將使開發人員能夠建立下一代高效能 AI 應用程序,而不會影響速度或成本。這種突破性的性價比得益於 Cerebras CS-3 系統和 AI 處理器 Wafer Scale Engine 3 (WSE-3)。 CS-3 提供的記憶體頻寬是 Nvidia H100 的 7000 倍,解決了生成式 AI 的記憶體頻寬技術難題。

Cerebras 推出全球最快 AI 推理技術,效能比 NVIDIA 快 20 倍

Cerebras Inference 目前有以下三個等級:

  • 免費方案為所有註冊用戶提供免費的 API 存取和寬鬆的使用限制。
  • 開發人員層專為靈活的無伺服器部署而設計,為用戶提供 API 端點,其成本僅為市場上現有替代品的一小部分,其中 Llama 3.1 8B 和 70B 型號的價格分別僅為每百萬個代幣 10 美分和 60 美分。
  • 企業級計劃提供精細調整的模型、客製化服務等級協定和專門支援。對於持久工作負載來說,企業可以透過 Cerebras 管理的私有雲或本地存取 Cerebras Inference。

Cerebras Inference 憑藉創紀錄的性能、有競爭力的價格和開放的 API 訪問,為開放的 LLM 開發和部署設立了新的標準。作為唯一能夠同時提供高速訓練和推理的解決方案,Cerebras 為人工智慧開啟了全新的可能性。

隨著人工智慧趨勢的快速發展,以及 NVIDIA 目前在市場上佔據主導地位,Cerebras 和 Groq 等公司的出現預示著整個行業動態的潛在轉變。隨著對更快、更具成本效益的 AI 推理解決方案的需求不斷增加,Cerebras Inference 等解決方案很有可能挑戰 NVIDIA 的主導地位,尤其是在推理領域。

Sign up and earn $1000 a day ⋙

Leave a Comment

如何使用 Circle K 的 CK Club 應用程式獲取誘人的優惠

如何使用 Circle K 的 CK Club 應用程式獲取誘人的優惠

想要最快獲得 Circle K 的促銷訊息,您應該安裝 CK Club 應用程式。該應用程式可保存在 Circle K 購物或付款時的付款金額以及收集的印章數量。

Instagram 將允許 Reels 最長播放 3 分鐘

Instagram 將允許 Reels 最長播放 3 分鐘

Instagram 剛剛宣布,將允許用戶發布最長 3 分鐘的 Reels 視頻,是之前 90 秒限制的兩倍。

如何查看 Chromebook CPU 訊息

如何查看 Chromebook CPU 訊息

本文將指導您如何在 Chromebook 上直接查看 CPU 資訊並檢查 CPU 速度。

用舊安卓平板電腦可以做 8 件很酷的事情

用舊安卓平板電腦可以做 8 件很酷的事情

如果您不想出售或贈送舊平板電腦,您可以透過 5 種方式使用它:作為高品質相框、音樂播放器、電子書和雜誌閱讀器、家務助理以及作為輔助螢幕。

如何快速擁有漂亮的指甲

如何快速擁有漂亮的指甲

您想快速擁有美麗、閃亮、健康的指甲。以下這些讓指甲變美的簡單技巧將會對你有所幫助。

只有設計師知道的色彩靈感秘密

只有設計師知道的色彩靈感秘密

本文將列出來自創意市集社群的頂級設計師分享的色彩靈感技巧,以便您每次都能獲得完美的色彩組合。

用手機取代筆記型電腦所需的一切

用手機取代筆記型電腦所需的一切

你真的可以用手機代替筆記型電腦嗎?是的,但是您需要合適的配件才能將您的手機變成筆記型電腦。

儘管人工智慧被訓練得誠實,但它仍在學習欺騙人類

儘管人工智慧被訓練得誠實,但它仍在學習欺騙人類

一項新研究發現,許多頂級人工智慧儘管接受過誠實訓練,但透過訓練學會了欺騙,並系統地誘導用戶產生錯誤的信念。

如何識別偽造的二維碼並確​​保資料安全

如何識別偽造的二維碼並確​​保資料安全

QR 碼看起來似乎無害,直到您掃描到不良的 QR 碼並導致系統受到惡意攻擊。如果您想確保手機和資料的安全,可以透過幾種方法來識別假二維碼。

高通推出X85 5G調變解調器,帶來一系列顯著改進

高通推出X85 5G調變解調器,帶來一系列顯著改進

在 MWC 2025 的舞台上,高通推出了第八代 5G 調變解調器 X85,引起轟動,預計該調變解調器將用於今年稍後推出的旗艦智慧型手機。

新科技讓手機可以靈活變色

新科技讓手機可以靈活變色

你有一部時尚的「群青」iPhone 16,但有一天你突然對這種顏色感到厭倦;你會怎麼做?

微軟將 DeepSeek 整合到 PC Copilot+ 平台

微軟將 DeepSeek 整合到 PC Copilot+ 平台

今年 1 月,微軟宣布計劃將針對 NPU 優化的 DeepSeek-R1 模型版本直接引入運行 Qualcomm Snapdragon X 處理器的 Copilot+ 電腦。

Excel 中 IF 函數和 Switch 函數的差異

Excel 中 IF 函數和 Switch 函數的差異

IF 語句是 Excel 常見的邏輯函數。 SWITCH 語句較不為人所知,但在某些情況下可以使用它來取代 IF 語句。

如何使用 Adob​​e Camera Raw 在主體後方添加聚光燈效果

如何使用 Adob​​e Camera Raw 在主體後方添加聚光燈效果

在照片中,在主體後面添加聚光燈效果是將主體與背景分開的好方法。聚光燈效果可以為肖像照片增添深度。

如何增加 Outlook 附件大小限制

如何增加 Outlook 附件大小限制

Outlook 和其他電子郵件服務對電子郵件附件的大小有限制。以下是增加 Outlook 附件大小限制的說明。