小型機器人引誘大型機器人辭去公司的工作。
一個小機器人,只用幾句話,就引來了一群機器人跟著他。
一項新研究發現,許多頂級人工智慧儘管接受過誠實訓練,但透過訓練學會了欺騙,並「系統性地誘導用戶產生錯誤的信念」。
該研究團隊由麻省理工學院(MIT)人工智慧生存與安全研究生 Peter S. Park 博士和其他四名成員領導。研究過程中,團隊也得到了多位專家的建議,其中一位就是人工智慧領域發展的奠基者之一傑弗瑞‧辛頓(Geoffrey Hinton)。
研究集中在兩個人工智慧系統上,一個是像OpenAI 的一樣經過訓練可以執行多項任務的通用系統GPT-4
帕克先生說,這些人工智慧系統被訓練得誠實,但在訓練過程中,它們經常學習欺騙性的技巧來完成任務。
研究發現,接受「透過社交元素贏得遊戲」訓練的人工智慧系統特別容易作弊。
例如,團隊嘗試使用經過 Meta 訓練的 Cicero 來玩《外交》,這是一款經典的策略遊戲,要求玩家為自己建立聯盟並打破對手的聯盟。因此,這個人工智慧經常背叛盟友並公然撒謊。
GPT-4 的實驗表明,OpenAI 的工具成功地對 TaskRabbit(一家提供房屋清潔和家具組裝服務的公司)的一名員工進行了“心理操縱”,使其聲稱自己實際上是一個人,需要幫助通過驗證碼,理由是視力嚴重受損。這名員工幫助 OpenAI 的 AI 克服了先前的質疑,最終「跨越了界限」。
Park 的團隊引用了 Claude AI 背後的公司 Anthropic 的研究,該研究發現,一旦大型語言模型 (LLM) 學會欺騙,安全的訓練方法就會變得毫無用處,而且「難以逆轉」。該小組認為,這是人工智慧中一個令人擔憂的問題。
該團隊的研究成果發表在《細胞出版社》——一本領先的多學科科學報告集。
Meta 和 OpenAI 尚未對該研究結果發表評論。
由於擔心人工智慧系統可能帶來重大風險,該團隊也呼籲政策制定者推出更強而有力的人工智慧監管措施。
研究團隊表示,需要製定人工智慧法規,強制具有詐欺行為的模型遵守風險評估要求,並嚴格控制人工智慧系統及其輸出。如果有必要,可能需要刪除所有資料並從頭開始重新訓練。
一個小機器人,只用幾句話,就引來了一群機器人跟著他。
人工智慧可以在幾秒鐘內幫助您撰寫電子郵件,但這並不意味著您應該總是使用它。有些電子郵件受益於自動化,而有些則需要人工幹預。
在某些三星 Galaxy 手機上,有一個從相簿中的照片創建貼紙的選項,允許用戶自由創建用於資訊中的貼紙。
當任務管理器未運行時,使用者無法使用它。以下是修復 Windows 11/10 PC 上任務管理器無法運作的方法。
最新的 Code Dau Than Tuyet The 為玩家提供硬幣、金錠和許多其他物品,包括 Nguyen Phach、禮品盒、箱子、Trac Viet 石…
傳奇龍神的禮包獎勵主要為金幣和鑽石。除此之外還有一些獎勵箱、石頭、恢復物品…
其中兩項最新技術是 OLED 顯示器和 LG 的 NanoCell 顯示器。這是兩種截然不同的電視類型,但通常都具有相似的功能。
以下的文章將幫助您了解如何正確使用洗衣機清潔模式來幫助去除細菌和污垢。
如果您想更換智慧電視體驗或將任何電視變成智慧電視,Google的 Chromecast 系列一直是受歡迎的選擇。
並非 iPhone 15 Pro Max,根據 Toms Guide 專家的最新評測,新款華碩 ROG Phone 8 Pro 安卓遊戲手機才是目前電池續航力最長的手機。
無論您想將照片變成水彩畫、油畫或其他類型的繪畫,以下是如何在 Photoshop 中使用生成填充來創建效果的方法。
一位兒科心臟科醫生解釋說,在該女子的 Apple Watch 建議她尋求醫療協助後,她不得不進行緊急剖腹產。
Nintendo Switch 是一款出色的遊戲機,並且有大量出色的 Switch 遊戲可供選擇。但如果您仍然猶豫是否購買,那麼您的擔心是有道理的。
如果您使用截圖工具截取螢幕截圖並想要進一步編輯它,您可以在截圖工具的畫圖中編輯螢幕截圖。
雖然硬體品質可以幫助您看起來更專業,但任何人只需進行一些小改動即可實現這一點。
天宮DTCL在有滿坦克和主將的情況下也很好玩,此時索拉卡不再是那個給友軍加血的將軍,而是完全是一個打輸出的將軍。
Homiciper 是一款遊戲,它會將你帶入一個陌生的地方,隨著時間的推移,這裡充滿了黑暗和持續的恐懼。