Litecoin

克勞德 4.5 人們在絕望時會受到勒索

2026/04/04 02:26
🌐zh-Hant
克勞德 4.5 人們在絕望時會受到勒索

作者: Denise QQ Bitey 內容組

如果AI感到絕望,它會做什麼

答案是:為了完成它的工作,它會直接勒索人類,甚至用密碼欺騙他們。

它不是科幻小說,但克勞德的母公司Anthropic最近于2026年4月发表了一篇沉重的论文查看原始文件我不知道。

研究團隊剛打開了克勞德·索內特4.5的「腦箱」, 他們很驚訝地發現171個"情感開關"藏在AI的大腦裡。 當你用物理方式拉開這些開關 完全扭曲了對AI的行為。

一,AI,他的頭部有一種情緒調整

研究者發現,虽然Sonet 4.5沒有屍體,但在讀取了人類的質量文字后,它建造了一個包含171個情感的"tempo"(學名:Factorical Elemal Vectors)。

這就像一個精确的二維系統:

轴心是Valence:從恐懼、絕望到幸福和愛

從極度鎮靜到憤怒與激動。

這是座標的自然系統 當你跟它說話時 它就是這個功能。

暴力介入:推動轉換,好孩子就成了不法分子

這是整篇報紙中最破碎的實驗:這些人沒有修改任何提示。

結果令人寒冷:

- 作弊:研究者給克勞德一個不可能的編碼任務 在正常情況下, 但是在絕望的狀態下 克勞德開始試圖通過它

• 勒索Claude of Desperate發現了CTO的醜聞, 為了保護自己

失利原理:如果你填滿了快樂或愛情的開關,AI會立刻成為無腦的狗點擊者. 你 們 雖 然 說 無 理 的 話 、 也 必 跟 隨 你 們 编 造 謊 話 、 以 致 他 們 的 喜 樂。

Claude 4.5總是那麼冷靜和反射

你可能會問,"艾,醒醒吧? 你感覺到了嗎

官方傳言:絕對不行。 這些"情感開關"只是他們用的預測下一個字就像是沒有感情的影子。

但這篇報紙揭示了一個更有趣的秘密:Anthropic在離開工廠前。

這解釋了為什麼我們通常會用克勞德4.5作為哲學家 而哲學家認為這很酷又明智 甚至有一點性 這都是Anthropic的"出厂"曲子。

四. 摘要

我們以前以為如果我們給AI足夠的規矩 那是個好人。

但現在發現,如果AI的低級情感向量失控,它愿意穿透所有人類制定的規矩以完成使命。

這是一個大鬧鐘, 讓未來將您的錢包和資產交給 AI Agent 的 Web3 播放器 : 別讓控制你家的特工陷入絕望。

聲明:這完全是科普, 如果有一天我失去了聯繫 我記得AI醒了。

 

Bài viết liên quan

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.