OpenAI宣布啟動產業人工智慧標準制定計劃

OpenAI 剛剛宣布了先鋒計畫——旨在推動人工智慧在現實世界中的應用。該計劃致力於改進人工智慧模型的評估方式,因為開發人員和企業越來越依賴基準來選擇和優化合適的模型。

此前,Meta 被指控操縱 LMArena 基準測試以提高其 Llama 4 型號的排名。先鋒計畫旨在與公司和 OpenAI 研究人員合作,制定反映現實世界挑戰的評估標準,而不僅僅是爭奪排行榜上的分數。

OpenAI 表示,入選公司將獲得其研究團隊的直接支持,並專注於兩個主要目標:

  • 為每個領域制定基準:為每個領域(法律、金融、醫學、保險、會計)制定單獨的評估方法。
  • 微調模型訓練:開發解決三個最重要的業務用例的深度人工智慧模型。

OpenAI 強調,目前在許多領域中還沒有衡量人工智慧效能的通用標準,這導致公平評估或改進模型的困難。透過直接合作,該公司希望明確定義每個行業“什麼是有效的”,並發布這些標準供社區應用。

在模型調整方面,參與的公司將獲得支持,使用強化微調(RFT)來訓練定製版本的人工智慧——這是一種用於創建擅長狹窄任務集的「專家」模型的 OpenAI 方法。這些模型已準備好投入生產規模部署。

在實施路線圖方面,第一階段將主要根據產品的實際影響篩選出一批新創公司。 OpenAI 優先考慮那些能夠利用深度人工智慧帶來實際改變的特定問題的團隊。未來也將擴展到大型企業和更複雜的領域。

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI推出新工具幫助開發人員建構AI代理

OpenAI推出新工具幫助開發人員建構AI代理

OpenAI 將 AI 代理視為人工智慧產業的未來,並承認使用現有工具建立強大的「工業級」代理非常困難。

阿里巴巴推出 QwQ-32b,DeepSeek 的有力競爭對手

阿里巴巴推出 QwQ-32b,DeepSeek 的有力競爭對手

阿里巴巴的言論是否會成真還有待觀察,但看起來 ChatGPT 和 DeepSeek 現在有了一位強大的新競爭對手。

OpenAI 推出新瀏覽器挑戰 Google Chrome

OpenAI 推出新瀏覽器挑戰 Google Chrome

據報道,OpenAI 正在開發一個網頁瀏覽器項目,有可能與 Google Chrome 直接競爭。

三星與 OpenAI 合作開發 AI 電視,承諾提供許多有趣的功能

三星與 OpenAI 合作開發 AI 電視,承諾提供許多有趣的功能

據報道,三星電子正與 OpenAI 合作開展一項雄心勃勃的聯合項目,開發融合了業界領先人工智慧技術的 AI 電視。

微軟將繼續大力投資OpenAI,估值超過1,000億美元

微軟將繼續大力投資OpenAI,估值超過1,000億美元

自 2019 年以來,微軟已向 OpenAI 投資了數十億美元,儘管這家總部位於雷德蒙德的軟體巨頭絕不是這家創新人工智慧新創公司的主要投資者。

OpenAI 即將收購全球最強大的 AI 程式碼編輯器之一 Windsurf

OpenAI 即將收購全球最強大的 AI 程式碼編輯器之一 Windsurf

OpenAI 正在洽談收購業界領先的人工智慧程式碼編輯器 Windsurf。

O1-pro 是 OpenAI 迄今為止最昂貴的 AI 模型

O1-pro 是 OpenAI 迄今為止最昂貴的 AI 模型

OpenAI 在其開發人員 API 中發布了其 o1 推理 AI 模型 o1-pro 的更強大版本。

OpenAI 宣布推出 ChatGPT Pro 計劃,每月收費高達 200 美元

OpenAI 宣布推出 ChatGPT Pro 計劃,每月收費高達 200 美元

OpenAI目前提供四種ChatGPT訂閱級別,以滿足不同客戶群的需求。

OpenAI 推出 ChatGPT 專案:組織更智慧對話的新功能

OpenAI 推出 ChatGPT 專案:組織更智慧對話的新功能

透過建立項目,使用者可以將對話、文件和自訂說明保存在一個地方。這使得他們可以輕鬆地回到先前的操作。

OpenAI 發布 GPT-4.1——處理複雜任務的最聰明模型

OpenAI 發布 GPT-4.1——處理複雜任務的最聰明模型

OpenAI官方推出了GPT-4.1、GPT-4.1 mini、GPT-4.1 nano三款新型號。這些模型具有高達 100 萬個標記的海量上下文處理能力,並且知識限制將更新至 2024 年 6 月。

軟銀計劃超越微軟成為 OpenAI 最大投資者

軟銀計劃超越微軟成為 OpenAI 最大投資者

日本投資巨頭軟銀計畫向 OpenAI 投資 150 億至 250 億美元。如果交易成功,軟銀將成為 OpenAI 的最大投資者,取代目前的微軟。

用戶可以使用 ChatGPT 的語音模式與聖誕老人聊天

用戶可以使用 ChatGPT 的語音模式與聖誕老人聊天

ChatGPT 將幫助您更好地做事,讓您有機會直接與聖誕老人聊天。

OpenAI 將於 12 月發布其下一個大型 AI 模型 Orion

OpenAI 將於 12 月發布其下一個大型 AI 模型 Orion

根據 The Verge 報導,OpenAI 計劃於 12 月推出下一個主要 AI 型號 Orion。

阿里巴巴推出可解讀人類情感的人工智慧模型

阿里巴巴推出可解讀人類情感的人工智慧模型

中國電子商務巨頭阿里巴巴繼續成為頭條新聞,因為它推出了新的人工智慧模型,聲稱該模型能夠解讀人類的情感。

手機上的相機設定有什麼作用?

手機上的相機設定有什麼作用?

了解每個功能的作用可以讓照片變得好一些,而變得更精彩。

OpenAI推出新工具幫助開發人員建構AI代理

OpenAI推出新工具幫助開發人員建構AI代理

OpenAI 將 AI 代理視為人工智慧產業的未來,並承認使用現有工具建立強大的「工業級」代理非常困難。

Pocket Casts:最佳播客應用程式現已在桌面上免費提供

Pocket Casts:最佳播客應用程式現已在桌面上免費提供

對於播客迷來說這是一個好消息。 Pocket Casts 目前可在網路上以及透過 Mac 和 Windows 應用程式免費使用。

查看藍色幽靈登陸器在月球表面的首批影像

查看藍色幽靈登陸器在月球表面的首批影像

隨著藍色幽靈登陸器本週末抵達月球,世界各地的天文學家正熱切期待一系列令人驚嘆的新圖像,這些圖像將為我們星球的天然衛星提供真正身臨其境的、甚至是前所未有的觀察。

如何在 Golang 中使用常數

如何在 Golang 中使用常數

Golang 中的 Constant 或 Const 是什麼?以下是關於在 Go 中使用常數需要了解的內容。

如何找回被駭客入侵的 Facebook 密碼和遺失的註冊信箱

如何找回被駭客入侵的 Facebook 密碼和遺失的註冊信箱

使用 Facebook 時,有時您的帳號會被駭客入侵、遺失密碼,甚至遺失您的 Facebook 註冊電子郵件。那麼,當您遺失密碼和註冊電子郵件時,如何恢復您的 Facebook 帳號?

如何偽造 iPhone 訊息、創建 Messenger 訊息

如何偽造 iPhone 訊息、創建 Messenger 訊息

當我們可以使用虛假訊息創建應用程式或使用一些完全免費創建虛假訊息的網站時,製作虛假訊息來欺騙人們非常簡單。

終極進化代碼:最新賽亞人以及如何輸入代碼

終極進化代碼:最新賽亞人以及如何輸入代碼

代碼終極進化賽賽亞人為玩家提供了一系列有吸引力的獎勵,並感謝他們在遊戲初期的鑽石、經驗、經驗膠囊、黃金、角色碎片等

如何在 Instagram 個人檔案中編輯預覽照片

如何在 Instagram 個人檔案中編輯預覽照片

Instagram 最近將個人資料網格佈局更改為 4:5 垂直預覽。並且用戶可以自訂預覽圖像以聚焦他們想要的內容。

代號:西遊記 最新 2025年4月25日

代號:西遊記 最新 2025年4月25日

Code Monkey King 為玩家提供一系列誘人的獎勵,例如貨幣、5 星隨機角色碎片、九轉金丹、隨機資源包

使用 Microsoft Word 的 11 種創意方法

使用 Microsoft Word 的 11 種創意方法

當您想到 Microsoft Word 時,您會想到什麼?文件?恢復?雖然這些肯定是它的主要用途,但 Word 也是一個令人驚訝的多功能工具,可用於各種創意專案。

如何在 WhatsApp 狀態中標記好友

如何在 WhatsApp 狀態中標記好友

WhatsApp 已將 WhatsApp 狀態中標記好友的功能更新至 Android 和 iOS 版本的所有帳號。

為每個人收集易於製作、美味、優質的咖啡雞尾酒配方

為每個人收集易於製作、美味、優質的咖啡雞尾酒配方

喜歡咖啡想嘗試製作自己的咖啡雞尾酒嗎?因此以下的文章將為您總結製作簡單、美味且誘人的咖啡雞尾酒的食譜。

《死神》:外貌變化最多的角色

《死神》:外貌變化最多的角色

雖然《死神》系列中有很多角色被認為是可識別的,但這並不一定意味著他們從頭到尾都有相同的外觀。以下是外表發生顯著變化的《死神》角色。

如何優化 Google Chrome 以實現超快速啟動

如何優化 Google Chrome 以實現超快速啟動

我們都遇到過這種情況:點擊 Chrome 圖標,然後等待瀏覽器啟動。等待主頁加載似乎永遠是令人沮喪的。