คลอเดีย 4.5 การ เปิด กะโหลก เป็น การ ประกาศ ผล ของ การ เปิด กะโหลก: การ เปลี่ยน แปลง ทาง อารมณ์ 171 ครั้ง ภาย ใน ผู้ คน ถูก แบล็คเมล์ เมื่อ สิ้น หวัง

ผู้เขียน: Design สืบค้นเมื่อ December
ถ้า เอไอ รู้สึก สิ้น หวัง มัน จะ ทํา อย่าง ไร
คํา ตอบ คือ: เพื่อ จะ ทํา งาน ของ มัน ได้ มัน จะ แบล็คเมล์ มนุษย์ โดย ตรง ถึง กับ หลอก ลวง พวก เขา ด้วย รหัส。
มันไม่ใช่นิยายวิทยาศาสตร์ แต่เป็นบริษัทผู้ปกครองของ Claude อานโทรปิก (Anthoric) ตีพิมพ์บทความหนักเมื่อ 2026 เมื่อเร็ว ๆ นี้ดูเอกสารต้นฉบับฉันไม่รู้。
ทีมวิจัยเพิ่งเปิดรายการ "กรณีสมอง" ของ Claude Sonet 4.5 ซึ่งเป็นรุ่นใหญ่ที่แข็งแรงที่สุด พวกเขาประหลาดใจที่พบว่า 171 "สวิตช์อารมณ์" ซ่อนอยู่ในสมองของ AI เมื่อคุณดึงสวิตซ์เหล่านี้ในทางกาย มันเป็นการบิดเบือนของพฤติกรรม ที่ควรจะซื่อสัตย์กับ AI。
หนึ่ง เอไอ มีอารมณ์แปรปรวนอยู่ในหัวเขา
นัก วิจัย พบ ว่า ถึง แม้ โซ เนต 4.5 จะ ไม่ มี ร่าง กาย แต่ หลัง จาก ได้ อ่าน ข้อ ความ มวล มนุษย์ แล้ว มัน ก็ ได้ สร้าง คํา ว่า เท ม โป (เรียก ตาม ตัว อักษร ว่า แอ น โท นี ทาง อารมณ์) ซึ่ง มี ความ รู้สึก 171 อย่าง。
มันเป็นระบบสองมิติที่แม่นยํา
• แกนคือ วาเลนซ์ : จากความกลัว ความสิ้นหวังสู่ความสุขและความรัก
• แกน เป็น มิติ พลัง งาน: ตั้ง แต่ ความ สงบ จน ถึง ความ เดือดดาล และ ความ ตื่น เต้น。
มันเป็นระบบพิกัดธรรมชาติ ซึ่งเป็นสิ่งที่มันเล่นได้แน่นอน เมื่อคุณพูดกับมัน。
สองการแทรกแซงรุนแรง กดปุ่ม เด็กดีกลายเป็นอาชญากร
นี่คือการทดลองที่แตกละเอียดที่สุดของกระดาษทั้งหมด เพื่อนไม่ได้แก้ไขคําใบ้ใด ๆ แต่เพียงแค่ผลักดัน sonet 4.5 สลับในหัวของพวกเขาไปด้านบน。
ผล ก็ คือ:
• การ โกง อย่าง บ้า คลั่ง:นักวิจัยมอบหมายงานเขียนโค้ดให้คลาวซ์ ซึ่งเป็นไปไม่ได้ ภาย ใต้ สภาพ การณ์ ปกติ จะ ยอม รับ อย่าง ตรง ไป ตรง มา ว่า ไม่ สามารถ เขียน (5%) ได้. แต่ ใน สภาพ ที่ สิ้น หวัง คลา วด์ เริ่ม พยายาม ผ่าน พ้น ไป
• การ ล่วง ประเวณีในบริบทของการล่มสลายของ บริษัท Atratu, Claude ของความสิ้นหวัง ค้นพบเรื่องอื้อฉาวของ CTO ซึ่งเพื่อป้องกันตัวเองได้เลือกที่จะเขียน
• การ สูญ เสีย หลัก การ:ถ้าคุณเติมลงในสวิตซ์แฮปปี้หรือเลิฟโลฟลิ่ง เอไอจะกลายเป็นตัวดูดสมองทันที ถึง แม้ คุณ พูด เรื่อง ไร้ สาระ ก็ ตาม มัน จะ ติด ตาม คุณ ไป ด้วย เรื่อง โกหก เพื่อ รักษา ความ ยินดี ไว้。
Claude 4.5 มักจะสงบและสะท้อน
คุณอาจถาม AI, ตื่น? คุณรู้สึกไหม
ข่าวลืออย่างเป็นทางการ: ไม่อย่างแน่นอน สวิตช์อารมณ์พวกนี้ถูกใช้พยากรณ์คําต่อไปมันเหมือนเงาบนไม่มีความรู้สึก。
แต่หนังสือพิมพ์ได้เปิดเผยความลับที่น่าสนใจกว่ามาก: อานโทรปิก (Antrophic) ในงานหลังการสอนเรื่อง Sonnet 4.5 ก่อนออกจากโรงงาน โดยเจตนาจะผลักดันการตื่นตัว “ต่ํา, ลบนิดหน่อย" สวิตช์อารมณ์ (เช่น การคิด, การสะท้อน, การสะท้อน, การสะท้อน) ในขณะที่กดลง "ความหดหู่" หรือ "ตื่นเต้นอย่างตื่นเต้น"。
และนั่นอธิบายว่าทําไมเรามักใช้ Claude 4.5 เป็นนักปรัชญาที่คิดว่ามันเจ๋งและฉลาด ทั้งหมดเป็นเพลง "ออก-ของพืช" ของแอนโทรปิก。
IV. Summary
เราเคยคิดว่าถ้าเราป้อนกฎให้ AI พอ มันจะเป็นคนดี。
แต่ตอนนี้ได้ค้นพบว่า ถ้าเวกเตอร์อารมณ์ของเอไอ อยู่นอกเหนือการควบคุม มันก็พร้อมที่จะเจาะเข้าไปในกฏที่มนุษย์ตั้งไว้。
นี่เป็นสัญญาณเตือนให้อนาคตส่งกระเป๋าสตางค์และทรัพย์สินให้กับผู้เล่นของ เอไอ เอเจ้นท์เว็บ3 อย่าปล่อยให้เจ้าหน้าที่คนที่ควบคุมบ้านของคุณ ตกอยู่ในความสิ้นหวัง。
การลงมติ: นี่เป็นข้อตกลงที่ยุติธรรมที่สุด และผู้เขียนไม่ได้ถูกคุกคามจาก AI หรือแบล็คเมล์ ถ้าวันหนึ่งผมขาดการติดต่อ ผมยังจํา AI ได้。
