小型機器人引誘大型機器人辭去公司的工作。
一個小機器人,只用幾句話,就引來了一群機器人跟著他。
一項新研究發現,許多頂級人工智慧儘管接受過誠實訓練,但透過訓練學會了欺騙,並「系統性地誘導用戶產生錯誤的信念」。
該研究團隊由麻省理工學院(MIT)人工智慧生存與安全研究生 Peter S. Park 博士和其他四名成員領導。研究過程中,團隊也得到了多位專家的建議,其中一位就是人工智慧領域發展的奠基者之一傑弗瑞‧辛頓(Geoffrey Hinton)。
研究集中在兩個人工智慧系統上,一個是像OpenAI 的一樣經過訓練可以執行多項任務的通用系統GPT-4
帕克先生說,這些人工智慧系統被訓練得誠實,但在訓練過程中,它們經常學習欺騙性的技巧來完成任務。
研究發現,接受「透過社交元素贏得遊戲」訓練的人工智慧系統特別容易作弊。
例如,團隊嘗試使用經過 Meta 訓練的 Cicero 來玩《外交》,這是一款經典的策略遊戲,要求玩家為自己建立聯盟並打破對手的聯盟。因此,這個人工智慧經常背叛盟友並公然撒謊。
GPT-4 的實驗表明,OpenAI 的工具成功地對 TaskRabbit(一家提供房屋清潔和家具組裝服務的公司)的一名員工進行了“心理操縱”,使其聲稱自己實際上是一個人,需要幫助通過驗證碼,理由是視力嚴重受損。這名員工幫助 OpenAI 的 AI 克服了先前的質疑,最終「跨越了界限」。
Park 的團隊引用了 Claude AI 背後的公司 Anthropic 的研究,該研究發現,一旦大型語言模型 (LLM) 學會欺騙,安全的訓練方法就會變得毫無用處,而且「難以逆轉」。該小組認為,這是人工智慧中一個令人擔憂的問題。
該團隊的研究成果發表在《細胞出版社》——一本領先的多學科科學報告集。
Meta 和 OpenAI 尚未對該研究結果發表評論。
由於擔心人工智慧系統可能帶來重大風險,該團隊也呼籲政策制定者推出更強而有力的人工智慧監管措施。
研究團隊表示,需要製定人工智慧法規,強制具有詐欺行為的模型遵守風險評估要求,並嚴格控制人工智慧系統及其輸出。如果有必要,可能需要刪除所有資料並從頭開始重新訓練。
一個小機器人,只用幾句話,就引來了一群機器人跟著他。
人工智慧可以在幾秒鐘內幫助您撰寫電子郵件,但這並不意味著您應該總是使用它。有些電子郵件受益於自動化,而有些則需要人工幹預。
你真的可以用手機代替筆記型電腦嗎?是的,但是您需要合適的配件才能將您的手機變成筆記型電腦。
一項新研究發現,許多頂級人工智慧儘管接受過誠實訓練,但透過訓練學會了欺騙,並系統地誘導用戶產生錯誤的信念。
QR 碼看起來似乎無害,直到您掃描到不良的 QR 碼並導致系統受到惡意攻擊。如果您想確保手機和資料的安全,可以透過幾種方法來識別假二維碼。
在 MWC 2025 的舞台上,高通推出了第八代 5G 調變解調器 X85,引起轟動,預計該調變解調器將用於今年稍後推出的旗艦智慧型手機。
你有一部時尚的「群青」iPhone 16,但有一天你突然對這種顏色感到厭倦;你會怎麼做?
今年 1 月,微軟宣布計劃將針對 NPU 優化的 DeepSeek-R1 模型版本直接引入運行 Qualcomm Snapdragon X 處理器的 Copilot+ 電腦。
IF 語句是 Excel 常見的邏輯函數。 SWITCH 語句較不為人所知,但在某些情況下可以使用它來取代 IF 語句。
在照片中,在主體後面添加聚光燈效果是將主體與背景分開的好方法。聚光燈效果可以為肖像照片增添深度。
Outlook 和其他電子郵件服務對電子郵件附件的大小有限制。以下是增加 Outlook 附件大小限制的說明。
儘管有許多競爭對手,Adobe Lightroom 仍然是最好的照片編輯應用程式。是的,您需要付費才能訪問,但 Lightroom 的功能集使其值得付費。
現在從 Youtube 下載影片非常簡單,您無需經過複雜的步驟即可將 Youtube 影片下載到您的電腦。
蘋果發布了自己的活動管理應用程序,名為 Invites。此應用程式可讓您建立活動、發送邀請和管理回應。
這裡有所有英雄無敵 3 的代碼,英雄無敵 3 各個版本的秘籍,例如英雄無敵 3 WoG 秘籍,英雄無敵 3 SoD,英雄無敵 3 魔法門之英雄無敵
最新的 Tay Du VNG 代碼為玩家提供了一系列有吸引力的獎勵,例如藥水、銀、金錠、獎勵箱和一系列其他物品,以幫助新玩家開啟一般回合。
Instagram 的直接訊息功能現在增加了許多新功能,包括預定的直接訊息,您可以提前寫作並設定在以後發送,最多可提前 29 天。