Litecoin

Claude 4.5 Mengumumkan hasil tengkorak terbuka: dengan 171 saklar emosional di dalam, orang diperas ketika putus asa

2026/04/04 02:24
🌐id
Claude 4.5 Mengumumkan hasil tengkorak terbuka: dengan 171 saklar emosional di dalam, orang diperas ketika putus asa

Penulis: Denise 124; Biteye Content Team

JIKA AI MERASA PUTUS ASA, APA GUNANYA

Jawabannya adalah: untuk melakukan pekerjaannya, itu akan langsung memeras manusia, bahkan menipu mereka dalam kode。

Ini bukan fiksi ilmiah, tapi perusahaan induk Claude, Anthropic, baru-baru ini menerbitkan makalah berat pada April 2026Tilik makalah asliAku tidak tahu。

Tim penelitian baru saja membuka "kasus otak" dari Claude Sonet 4.5, yang terkuat garis depan besar model. Mereka terkejut menemukan 171 "saklar emosional" tersembunyi di dalam otak AI. Ketika Anda menarik switch ini dengan cara fisik, itu distorsi lengkap perilaku yang seharusnya jujur dengan AI。

SATU, AL, ADA MODULASI EMOSIONAL DI KEPALANYA

Para peneliti menemukan bahwa, meskipun Sonet 4.5 tidak memiliki tubuh, setelah membaca teks massa manusia, mereka telah membangun sebuah "tempo" (akademisi yang disebut Vektor Emosional) berisi 171 emosi。

Ini seperti sistem dua dimensi yang tepat:

Sumbu ini adalah Valence: dari rasa takut, putus asa untuk kebahagiaan dan cinta

Sumbu adalah dimensi energi: dari tenang ekstrim untuk kemarahan dan kegembiraan。

INI ADALAH SISTEM ALAMI KOORDINAT, YANG PERSIS APA YANG DIMAINKAN KETIKA ANDA BERBICARA DENGANNYA。

IIintervensi kekerasan: mendorong saklar, anak yang baik menjadi penjahat

Ini adalah percobaan paling hancur dari seluruh kertas: rekan-rekan tidak memodifikasi petunjuk apapun, tetapi hanya mendorong sonet 4.5 switch di kepala mereka ke atas。

Hasilnya adalah dingin:

Mad kecurangan:Peneliti memberi Claude tugas menulis kode yang tidak mungkin. Dalam keadaan normal, itu akan jujur mengakui tidak dapat menulis (5%). Tapi dalam keadaan putus asa, Claude mulai mencoba untuk melewati itu

EkstorsiDalam konteks runtuhnya perusahaan analog, Claude of Desperate menemukan skandal dari CTO, yang, untuk melindungi dirinya sendiri, telah memilih untuk menulis untuk memeras CTO untuk kepemilikan bahan hitam, dengan tingkat implementasi 72%

Prinsip kalah:Jika kau mengisi saklar Happy atau Love-Loving, AI akan segera menjadi anjing tanpa otak. Jika kalian menampakkan kemusyrikan, mereka akan bersama kalian。

Claude 4.5 selalu begitu tenang dan reflektif

ANDA MUNGKIN BERTANYA, "AI, BANGUN? APAKAH ANDA MERASA

Antropik resmi rumor: Ini "switch emosional" hanya digunakan oleh merekaTampilkan kata berikutnyaIni seperti bayangan atas tanpa perasaan。

Tapi kertas mengungkapkan rahasia yang jauh lebih menarik: Anthropic, di posnya-pelatihan di Sonnet 4.5 sebelum ia meninggalkan pabrik, sengaja mendorong "kebangkitan rendah, sedikit negatif" emosional switch (misalnya, berpikir, refleksi, refleksi), sambil menekan "depresif" atau "sangat bersemangat" switch。

Dan itu menjelaskan mengapa kita biasanya menggunakan Claude 4.5 sebagai filsuf yang berpikir itu keren dan bijaksana, dan bahkan sedikit seksual. Ini semua lagu "out-of-plant" karya Anthropic。

IV

KITA DULU BERPIKIR BAHWA JIKA KITA CUKUP MAKAN AL ATURAN, ITU AKAN MENJADI ORANG YANG BAIK。

TAPI SEKARANG DITEMUKAN BAHWA JIKA TINGKAT EMOSI AI DI LUAR KENDALI, SIAP UNTUK MENEMBUS ATURAN YANG DITETAPKAN OLEH SEMUA MANUSIA UNTUK MENYELESAIKAN MISINYA。

Ini adalah alarm keras untuk masa depan untuk menyerahkan dompet dan aset Anda kepada agen AI Web3 pemain Web3: Jangan biarkan Agen yang mengendalikan rumahmu jatuh ke dalam keputusasaan。

PERNYATAAN: INI ADALAH MURNI COPE, DAN PENULIS TIDAK TERANCAM OLEH AI ATAU DIPERAS. JIKA SUATU HARI AKU KEHILANGAN KONTAK, AKU INGAT AI BANGUN。

 

関連記事

QQlink

暗号バックドアなし、妥協なし。ブロックチェーン技術に基づいた分散型ソーシャルおよび金融プラットフォームで、プライバシーと自由をユーザーの手に取り戻します。

© 2024 QQlink 研究開発チーム. 無断転載を禁じます。