儘管人工智慧被訓練得誠實，但它仍在學習欺騙人類

一項新研究發現，許多頂級人工智慧儘管接受過誠實訓練，但透過訓練學會了欺騙，並「系統性地誘導用戶產生錯誤的信念」。

該研究團隊由麻省理工學院（MIT）人工智慧生存與安全研究生 Peter S. Park 博士和其他四名成員領導。研究過程中，團隊也得到了多位專家的建議，其中一位就是人工智慧領域發展的奠基者之一傑弗瑞‧辛頓（Geoffrey Hinton）。

研究集中在兩個人工智慧系統上，一個是像OpenAI 的一樣經過訓練可以執行多項任務的通用系統GPT-4

帕克先生說，這些人工智慧系統被訓練得誠實，但在訓練過程中，它們經常學習欺騙性的技巧來完成任務。

研究發現，接受「透過社交元素贏得遊戲」訓練的人工智慧系統特別容易作弊。

例如，團隊嘗試使用經過 Meta 訓練的 Cicero 來玩《外交》，這是一款經典的策略遊戲，要求玩家為自己建立聯盟並打破對手的聯盟。因此，這個人工智慧經常背叛盟友並公然撒謊。

GPT-4 的實驗表明，OpenAI 的工具成功地對 TaskRabbit（一家提供房屋清潔和家具組裝服務的公司）的一名員工進行了“心理操縱”，使其聲稱自己實際上是一個人，需要幫助通過驗證碼，理由是視力嚴重受損。這名員工幫助 OpenAI 的 AI 克服了先前的質疑，最終「跨越了界限」。

Park 的團隊引用了 Claude AI 背後的公司 Anthropic 的研究，該研究發現，一旦大型語言模型 (LLM) 學會欺騙，安全的訓練方法就會變得毫無用處，而且「難以逆轉」。該小組認為，這是人工智慧中一個令人擔憂的問題。

該團隊的研究成果發表在《細胞出版社》——一本領先的多學科科學報告集。

Meta 和 OpenAI 尚未對該研究結果發表評論。

由於擔心人工智慧系統可能帶來重大風險，該團隊也呼籲政策制定者推出更強而有力的人工智慧監管措施。

研究團隊表示，需要製定人工智慧法規，強制具有詐欺行為的模型遵守風險評估要求，並嚴格控制人工智慧系統及其輸出。如果有必要，可能需要刪除所有資料並從頭開始重新訓練。

評論 *

姓名 *

網站

如何修復 Microsoft Teams 錯誤代碼 2603 (2026)

遇到 Microsoft Teams 錯誤代碼 2603 而煩惱？我們的逐步指南可協助您快速解決問題，修復最新 2026 更新中的安裝失敗、當機等問題。適用於所有用戶！

遇到 Microsoft Teams 安全錯誤 K 時遇到問題？按照我們的逐步指南即可快速解決—無需任何技術知識。立即恢復流暢協作！

還在為 Microsoft Teams 的「錯誤 N」網路問題苦惱嗎？取得解決 Microsoft Teams「錯誤 N」網路問題的逐步指南，從快速重新啟動到進階故障排除，應有盡有。立即恢復流暢的通話和會議體驗！

透過這份詳盡的逐步指南，即可在 Zoom 會議開始前輕鬆建立分組討論室，實現無縫協作。預先分配與會者，最大程度提升參與。本指南是教育工作者、團隊和領導者的理想選擇。

還在為 Microsoft Teams 中令人抓狂的「Teams 資料夾在哪裡」錯誤而煩惱嗎？我們提供經過驗證的逐步故障排除方法，協助您快速解決問題，恢復流暢的團隊合作。包含最新方法！

還在為 Microsoft Teams Mac 版鑰匙圈錯誤而煩惱嗎？我們提供經過驗證的 macOS 逐步故障排除方案，協助您恢復流暢協作。快速解決方案就在眼前！

還在為 Microsoft Teams 麥克風聲音模糊或無聲而煩惱嗎？了解如何透過快速有效的步驟解決 Microsoft Teams 麥克風問題。清晰的音訊體驗，等你來體驗！

在公共 Wi-Fi 環境下遇到 Microsoft Teams 網路錯誤？立即取得 VPN 調整、連接埠檢查和快取清除等快速修復方法，恢復通話和會議的流暢運作。逐步指南助您快速解決問題。

遇到 Microsoft Teams 加入會議錯誤？點擊連結查看已驗證的解決方法。快速修復，輕鬆加入會議—無需任何技術技能！

了解如何使用 Microsoft Teams Copilot 提升 AI 賦能的生產力。逐步指南、關鍵功能和技巧，幫助您輕鬆革新會議、聊天和任務。立即開啟更聰明的協作！