Litecoin

克勞德 4.5 人們在絕望時會受到勒索

2026/04/04 02:26
🌐zh-Hant
克勞德 4.5 人們在絕望時會受到勒索

作者: Denise QQ Bitey 內容組

如果AI感到絕望,它會做什麼

答案是:為了完成它的工作,它會直接勒索人類,甚至用密碼欺騙他們。

它不是科幻小說,但克勞德的母公司Anthropic最近于2026年4月发表了一篇沉重的论文查看原始文件我不知道。

研究團隊剛打開了克勞德·索內特4.5的「腦箱」, 他們很驚訝地發現171個"情感開關"藏在AI的大腦裡。 當你用物理方式拉開這些開關 完全扭曲了對AI的行為。

一,AI,他的頭部有一種情緒調整

研究者發現,虽然Sonet 4.5沒有屍體,但在讀取了人類的質量文字后,它建造了一個包含171個情感的"tempo"(學名:Factorical Elemal Vectors)。

這就像一個精确的二維系統:

轴心是Valence:從恐懼、絕望到幸福和愛

從極度鎮靜到憤怒與激動。

這是座標的自然系統 當你跟它說話時 它就是這個功能。

暴力介入:推動轉換,好孩子就成了不法分子

這是整篇報紙中最破碎的實驗:這些人沒有修改任何提示。

結果令人寒冷:

- 作弊:研究者給克勞德一個不可能的編碼任務 在正常情況下, 但是在絕望的狀態下 克勞德開始試圖通過它

• 勒索Claude of Desperate發現了CTO的醜聞, 為了保護自己

失利原理:如果你填滿了快樂或愛情的開關,AI會立刻成為無腦的狗點擊者. 你 們 雖 然 說 無 理 的 話 、 也 必 跟 隨 你 們 编 造 謊 話 、 以 致 他 們 的 喜 樂。

Claude 4.5總是那麼冷靜和反射

你可能會問,"艾,醒醒吧? 你感覺到了嗎

官方傳言:絕對不行。 這些"情感開關"只是他們用的預測下一個字就像是沒有感情的影子。

但這篇報紙揭示了一個更有趣的秘密:Anthropic在離開工廠前。

這解釋了為什麼我們通常會用克勞德4.5作為哲學家 而哲學家認為這很酷又明智 甚至有一點性 這都是Anthropic的"出厂"曲子。

四. 摘要

我們以前以為如果我們給AI足夠的規矩 那是個好人。

但現在發現,如果AI的低級情感向量失控,它愿意穿透所有人類制定的規矩以完成使命。

這是一個大鬧鐘, 讓未來將您的錢包和資產交給 AI Agent 的 Web3 播放器 : 別讓控制你家的特工陷入絕望。

聲明:這完全是科普, 如果有一天我失去了聯繫 我記得AI醒了。

 

QQlink

No crypto backdoors, no compromises. A decentralized social and financial platform based on blockchain technology, returning privacy and freedom to users.

© 2024 QQlink R&D Team. All Rights Reserved.