為什麼你不應該相信人工智慧聊天機器人的新聞簡報

在使用人工智慧聊天機器人提供快速新聞摘要之前,您一定要三思而後行。 BBC 的一份新報告發現,流行的聊天機器人在摘要結果中存在重大錯誤。

Google Gemini 的問題摘要率最高

測試包括ChatGPTGoogle GeminiMicrosoft CopilotPerplexity AI。首先,BBC 向每個聊天機器人提出 100 個新聞問題,要求它們盡可能使用 BBC 新聞來源。

為什麼你不應該相信人工智慧聊天機器人的新聞簡報

隨後,BBC 的專家對這些摘要的品質進行了評估。在這些摘要中,51%包含某種類型的錯誤,可能是事實不準確、錯誤引用或過時的資訊。

其中,19%存在某種事實錯誤,例如日期不正確。摘要中歸於 BBC 的引言有 13% 要么與原文有出入,要么在聊天機器人收到的文章中並不存在。

經過聊天機器人的分析,Google的 Gemini 表現最為糟糕,超過 60% 的摘要包含有問題的資訊。 Microsoft Copilot 則位居第二,佔 50%,而 ChatGPT 和 Perplexity 的問題回應佔比約為 40%。

BBC 在結論中表示,許多問題不僅僅是錯誤訊息:

研究也發現,人工智慧助理所犯的錯誤範圍不僅限於事實上的不準確。我們測試的人工智慧助理很難區分觀點和事實,經常發表社論,並且無法包含必要的背景資訊。即使回饋中的每個陳述都是準確的,這些類型的問題也可能導致誤導或偏見的回饋。

許多人從未嘗試使用人工智慧聊天機器人來總結新聞,因為他們不相信這項技術的可靠性。但考慮到大量存在問題的結果,研究結果仍然令人驚訝。人工智慧要成為了解新聞的可靠方式還有很長的路要走。

AI 功能仍在開發中

人工智慧技術,尤其是聊天機器人,正在持續快速進步。但正如 BBC 的研究表明,期待獲得準確的新聞資訊是一個極其困難的領域。

BBC 抱怨了另一個人工智慧功能:Apple Intelligence Notification Summary。 2024 年 12 月,該頻道的一則新聞摘要錯誤地稱 Luigi Mangione 開槍自殺。他被指控槍殺醫療保健公司執行長布萊恩湯普森。

為了回應 BBC 等機構的投訴,蘋果從 iOS 18.3 開始暫時禁用了新聞和娛樂應用程式的摘要功能。

因此,當您想要關注新聞時,請保持簡單:跳過 AI 的摘要並自己閱讀。

Sign up and earn $1000 a day ⋙

Leave a Comment

如何重新獲得對硬碟的存取權限,修復無法開啟硬碟的錯誤

如何重新獲得對硬碟的存取權限,修復無法開啟硬碟的錯誤

在本文中,我們將指導您如何在硬碟發生故障時重新造訪硬碟。讓我們一起來看看吧!

如何在 AirPods 上使用對話感知和即時監聽功能

如何在 AirPods 上使用對話感知和即時監聽功能

乍一看,AirPods 和其他真無線耳機沒什麼兩樣。但當一些鮮為人知的功能被發現後,一切都改變了。

關於 iOS 26

關於 iOS 26

蘋果推出了 iOS 26,這是一個重大更新,具有全新的磨砂玻璃設計、更聰明的體驗以及對熟悉應用程式的改進。

2025 年最適合學生的筆記型電腦

2025 年最適合學生的筆記型電腦

學生需要一台特定類型的筆記型電腦來學習。它不僅要性能強大,能夠出色地完成所選專業,還要小巧輕便,方便全天攜帶。

如何在 Windows 10 中新增印表機

如何在 Windows 10 中新增印表機

在 Windows 10 中新增印表機很簡單,儘管有線設備的過程與無線設備的過程不同。

如何以最高的準確率檢查電腦上的 RAM 和 RAM 錯誤

如何以最高的準確率檢查電腦上的 RAM 和 RAM 錯誤

眾所周知,RAM 是電腦中非常重要的硬體部件,它充當處理資料的內存,並且是決定筆記型電腦或 PC 速度的關鍵因素。在下面的文章中,WebTech360 將向您介紹一些在 Windows 上使用軟體檢查 RAM 錯誤的方法。

普通電視和智慧電視的差別

普通電視和智慧電視的差別

智慧電視確實風靡全球。憑藉如此多的強大功能和互聯網連接,科技改變了我們觀看電視的方式。

為什麼冷凍室沒有燈,冷藏室有燈?

為什麼冷凍室沒有燈,冷藏室有燈?

冰箱是家庭中常見的家用電器。冰箱通常有 2 個隔間,冷藏室寬敞,並且每次使用者打開時都會自動亮燈,而冷凍室狹窄且沒有燈。

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

解決 Wi-Fi 速度變慢的網路擁塞問題的 2 種方法

除了路由器、頻寬和乾擾之外,Wi-Fi 網路還受到許多因素的影響,但也有一些智慧的方法可以增強您的網路效能。

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如何使用 Tenorshare Reiboot 將 iOS 17 降級到 iOS 16 且不遺失數據

如果您想在手機上恢復穩定的 iOS 16,這裡是卸載 iOS 17 並從 iOS 17 降級到 16 的基本指南。

每天吃優​​格會對身體產生什麼影響?

每天吃優​​格會對身體產生什麼影響?

酸奶是一種美妙的食物。每天吃優​​格好嗎?每天吃酸奶,你的身體會發生怎樣的變化?讓我們一起來了解一下吧!

哪種米最有益於健康?

哪種米最有益於健康?

本文討論了最有營養的米種類以及如何最大限度地發揮所選米的健康益處。

如何早上準時起床

如何早上準時起床

制定睡眠時間表和就寢習慣、更改鬧鐘以及調整飲食都是可以幫助您睡得更好、早上準時起床的一些措施。

玩 Rent Please! 的提示新手模擬房東

玩 Rent Please! 的提示新手模擬房東

請租用! Landlord Sim 是一款適用於 iOS 和 Android 的模擬手機遊戲。您將扮演一個公寓大樓的房東,開始出租公寓,目標是升級公寓的內部並為租戶做好準備。

最新浴室塔防代碼及代碼輸入方法

最新浴室塔防代碼及代碼輸入方法

取得浴室塔防 Roblox 遊戲代碼並兌換令人興奮的獎勵。它們將幫助您升級或解鎖具有更高傷害的塔。