คลาวด์มักจะทําผิดพลาด? กฎ 12 ข้อนี้ทําให้อัตราการพลาดลดลงเหลือ 3%

2026/05/15 23:15
🌐th

จาก 41% ถึง 3% กฎสี่ข้อของคาร์โรธีไม่เพียงพอ

คลาวด์มักจะทําผิดพลาด? กฎ 12 ข้อนี้ทําให้อัตราการพลาดลดลงเหลือ 3%
ชื่อเดิม: Karinie's 4 CLAUDE.md rule ตัดภาพยนตร์ Claude from 41% ถึง 11%
ต้นฉบับโดย: @ mnilax
รูปของเพ็กกี้ บล็อค บีทส์

เครื่องปริ้นบรรณาธิการ: ในเดือนมกราคม 2026 อันเดร คาโรดี้ เฉลียงบนรหัสการเขียนของ Claude นําไปสู่เอกสารที่ดูเล็กแต่สําคัญอย่างมาก ในงานเขียนโปรแกรม AI: CLAUDE.md. แชงจึงจัดการจัดการปัญหาเหล่านี้ ให้เป็นกฎสี่ข้อของพฤติกรรม พยายามจํากัดความผิดพลาดที่คลอเดียมักจะทําเมื่อเขียนโค้ด。

ไม่กี่เดือนต่อมา โค๊ดของ Claude ไม่ได้เป็นแค่ "ให้นางแบบเขียนโค้ด" ขณะที่ตัวแทนหลายขั้นตอน, ไกลูกโซ่, การโหลดทักษะและความร่วมมือหลายรหัส ห้องสมุดกลายเป็นปกติ รูปแบบใหม่ของความล้มเหลวเริ่มเกิดขึ้น: รุ่นเริ่มต้นออกจากการควบคุมในภารกิจอันยาวนาน, การผ่านผ่านโดยไม่มีเหตุผลจริง, การย้ายที่ แต่เงียบผ่านข้อผิดพลาด และรูปแบบรหัสที่แตกต่างกัน。

ผู้เขียนหนังสือพิมพ์ฉบับนี้ ได้ทดสอบไลบรารีโค้ด 30 แห่ง ภายใน 6 สัปดาห์ และเพิ่มกฏใหม่อีก 8 ข้อ เข้ากับกฎ 4 ข้อเดิมของคาโรธีส เพื่อพยายามครอบคลุมประเด็นใหม่ของโปรแกรม AI。

ต่อ ไป นี้ เป็น ข้อ ความ เดิม:

ปลายเดือนมกราคม 2026 อองเดร คาโรบี ได้ส่งข้อความทวีตออกมา เขา ชี้ ถึง ประเด็น ทั่ว ไป สาม ข้อ คือ ข้อ สันนิษฐาน ผิด ๆ ที่ ไม่ มี คํา อธิบาย, ความ ซับ ซ้อน มาก เกิน ไป, และ ความ เสีย หาย ที่ ไม่ เกี่ยว ข้อง กับ รหัส ที่ ไม่ ควร เปลี่ยน。

ฟอร์เรสท์ แชงเห็นข้อความทวีตนี้ จัดระบบการร้องเรียนเป็น 4 กฎของพฤติกรรม เข้าในแฟ้ม CLAEDE.md ที่แยกออกจากกัน และตีพิมพ์ในกิตฮุบ ในวันแรกของโปรเจกต์ มีการสร้าง 5,828 ดาว เก็บรวบรวม 60,000 ครั้งภายใน 2 สัปดาห์ และปัจจุบันมี 120,000 ดาว เป็นโกดังเก็บรหัสเพลงเดี่ยวที่โตเร็วที่สุด ในปี 2026。

จากนั้นในหกสัปดาห์ ผมทดสอบมันในห้องสมุด 30 รหัส。

กฎ นี้ ใช้ ได้ จริง ๆ. ใน อดีต ประมาณ 40 เปอร์เซ็นต์ ของ โอกาส ที่ จะ เกิด ความ ผิด พลาด มี น้อย กว่า 3 เปอร์เซ็นต์ ของ งาน ที่ เข้า กับ กฎ เหล่า นี้. แต่ปัญหาก็คือต้นแบบนี้ ถูกออกแบบมามาแต่เดิม เพื่อแก้ไขความผิดพลาดในเดือนมกราคม เมื่อ Claude เขียนรหัส。

พอถึงวันที่ 20 June 2026 ปัญหาทางนิเวศวิทยาที่เผชิญโดยรหัส Claude ก็แตกต่างไป: ความขัดแย้งระหว่างตัวแทน, ไกลูกสายฮุค。

ผมเพิ่มกฏอีกแปดข้อ CLUDE.md: ทําไมกฎทุกอันควรค่าแก่การเข้าร่วม และสถานที่เดิม Karinie ต้นแบบจะถูกถอดออกจากตําแหน่งเงียบ ๆ ในสี่สถานที่。

หากคุณต้องการข้ามคําอธิบาย โปรดคัดลอกมันโดยตรง และทิ้งเอกสารเต็มไว้ที่ท้ายข้อความ。

ทําไม เรื่อง นี้ จึง สําคัญ

Clade Code's CLUDE.md เป็นเอกสารที่ถูกประเมินค่าต่ําที่สุด ในตู้นิรภัยเทคโนโลยี AI นักพัฒนาส่วนใหญ่มักทําผิดพลาดสามประเภท

ประการ แรก เอา มัน ไป เป็น ถัง ขยะ เอา นิสัย ทุก อย่าง ของ คุณ ใส่ ลง ไป แล้ว ขยาย ให้ มี มาก กว่า 4000 ชิ้น และ ลด อัตรา การ ทํา ตาม ลง เหลือ 30%。

อย่างที่สอง คุณไม่จําเป็นต้องทํามันทั้งหมด นี่ จะ ยัง ผล ให้ มี ของ เสีย ห้า เท่า และ ขาด ความ เสมอ ต้น เสมอ ปลาย ระหว่าง วาระ การ ประชุม。

ข้อสาม หลังจากเลียนแบบแม่แบบ มันไม่สําคัญอีกต่อไป อาจ จะ ใช้ เวลา สอง สัปดาห์ แต่ เมื่อ มี การ เปลี่ยน แปลง ใน ห้อง สมุด รหัส แล้ว ห้อง สมุด นี้ จะ ล้ม เหลว โดย ที่ คุณ ไม่ รู้。

เอกสารทางการทางมานุษยวิทยาชัดเจนมาก: CLAUDE.md เป็นเพียงแค่คําแนะนํา คลอดจะมีเวลาประมาณ 80% ของเวลาที่จะปฏิบัติตามมัน เมื่อ มี มาก กว่า 200 บรรทัด อัตรา การ ทํา ตาม จะ ลด ลง อย่าง น่า สังเกต เนื่อง จาก กฎ สําคัญ ๆ ถูก กลบ ด้วย เสียง ดัง。

แม่แบบคาร์โรธี แก้ปัญหาได้คือ เอกสารเดียว 65 บรรทัด 4 กฎ นี่คือจุดต่ําสุด。

แต่เพดานอาจจะสูง หลัง จาก เพิ่ม กฎ แปด ข้อ ต่อ ไป นี้ แล้ว กฎ นี้ ไม่ เพียง แต่ ครอบ คลุม ปัญหา การ เขียน รหัส ซึ่ง คาร์ คี เมน ได้ บ่น เกี่ยว กับ ใน เดือน มกราคม 2026 เท่า นั้น แต่ ยัง มี ปัญหา ของ ตัว แทน ที่ เกิด ขึ้น เฉพาะ ใน เดือน พฤษภาคม 2026 ด้วย — ปัญหา ที่ ไม่ มี อยู่ เมื่อ มี การ เขียน ต้น ฉบับ。

กฎ เดิม 4

ถ้าคุณยังไม่ได้ดูโกดังของฟอร์เรสท์ แชง ดูที่ฉบับพื้นฐานนี้

กฎ 1: คิด ก่อน เขียน รหัส。

อย่าตั้งสมมุติฐาน เพื่อแสดงให้เห็นสมมติฐานของคุณ เปิดเผยการแลกเปลี่ยน คํา ถาม ก่อน การ คาด เดา. เมื่อ มี ทาง เลือก ที่ ง่าย กว่า มี การ ยก ข้อ คัดค้าน ขึ้น มา ด้วย ความ ริเริ่ม ของ ตน เอง。

กฎ 2: ลําดับ ความ สําคัญ อย่าง ง่าย ๆ。
ใช้รหัสที่น้อยที่สุดที่แก้ปัญหาได้ อย่าเพิ่มฟังก์ชันจินตนาการ อย่าออกแบบชั้นที่เป็นนามธรรม สําหรับรหัสครั้งเดียว ถ้าวิศวกรอาวุโสคิดว่ามันซับซ้อนเกินไป มันก็น่าจะลดรูปได้。

กฎ 3: ศัลยกรรม。
เฉพาะผู้ที่จะต้องเปลี่ยนแปลง อย่า "เปิด" รหัสเพื่อนบ้าน หมายเหตุ หรือรูปแบบ อย่าสร้างสิ่งที่ไม่แตก ตามแบบปัจจุบันต่อไป。

กฎ 4: การใช้วัตถุวัตถุ。
กําหนดเกณฑ์สําหรับความสําเร็จ แล้ววนรอบเมื่อเวลาผ่านไป จนกว่าการตรวจสอบจะเสร็จสิ้น อย่าบอก Claude ว่าต้องทําอะไรทุกฝีก้าว แต่บอกเขาว่ามันควรจะเป็นยังไง。

และกฎสี่ข้อนี้ที่ผมเห็น ในการสนทนารหัสของ Claude ที่ไม่มีใครดู คือประมาณร้อยละ 40 ของรูปแบบความล้มเหลว ปัญหาที่เหลือ 60% ซ่อนอยู่ในพื้นที่ว่างเปล่าด้านล่าง。

กฎ 8 ข้อใหม่ของฉัน และทําไม

กฎ แต่ ละ ข้อ มา จาก ห้วง เวลา ที่ แท้ จริง: กฎ สี่ ประการ แรก ของ คา ร คี ยา ไม่ พอ อีก ต่อ ไป. ผมจะเริ่มด้วยฉาก, แล้วผมจะให้ กฎที่ตรงกัน。

กฎ 5: อย่าปล่อยให้แบบจําลองทํางานโดยไม่ใช้ภาษา

คลอเดียสามารถใช้ในกระบวนการได้ การจําแนกประเภท การร่างร่าง การสรุป การสกัดเอาข้อมูล อย่าใช้กระบวนการประมวลผลของ Claude: เส้นทาง, ทดสอบอีกครั้ง, การประมวลผลสถานะ, การแปลงที่แน่นอน ถ้ารหัสสถานะได้ตอบคําถาม ให้รหัสปกติตอบคําถาม。

กฎของคาร์โรธีไม่ครอบคลุมเรื่องนี้ โมเดลจึงเริ่มตัดสินปัญหาบางอย่าง ที่ควรจะพูดถึงด้วยรหัสที่แน่นอน คือ จะลองอีกครั้งหรือไม่ ผล ก็ คือ การ ตัดสิน นั้น ต่าง กัน ไป ใน แต่ ละ สัปดาห์. สิ่งที่คุณได้คือความผันผวน ถ้า-ความชันต่อสัญลักษณ์ 0.003。

นี่คือช่วงเวลาที่: มีรหัสเรียกคลาวด์ว่า "ตัดสินว่า จะลองอีกครั้งหรือไม่ เมื่อมี 503" มันเริ่มต้นได้ดี ใช้เวลา 2 สัปดาห์ แล้วจู่ๆ ก็เกิดไม่มั่นคงขึ้นมา ในขณะที่โมเดลเริ่มใช้ร่างกายเป็นบริบท กลยุทธ์ของการลองใหม่จะกลายเป็นการสุ่ม เพราะตัวกระตุ้นเองคือการสุ่ม。

กฎ 6: ตั้ง งบ ประมาณ ที่ ยาก ลําบาก โดย ไม่ มี ข้อ ยก เว้น

งบประมาณแต่ละภารกิจ: 4,000 เหรียญ งบประมาณเซสชัน: 30,000 เหรียญ ถ้า คํา สั่ง นั้น อยู่ ใกล้ เพดาน งบ ประมาณ สถานการณ์ ปัจจุบัน จะ ถูก สรุป และ เริ่ม ต้น ใหม่. อย่าผลักดัน คง จะ ดี กว่า ถ้า จะ เปิดโปง ปัญหา เกี่ยว กับ งบ ประมาณ ที่ มี อยู่ ทั่ว ไป อย่าง ชัดเจน แทน ที่ จะ จัด การ กับ เงิน มาก เกิน ไป。

Clade.md ไม่มีข้อห้ามงบประมาณ เทียบได้กับเช็คเปล่า วัฒนา แต่ ละ รอบ อาจ ควบคุม ไม่ ได้ และ ถูก ทิ้ง ไว้ ใน บริบท 50,000 เหรียญ. นางแบบจะไม่หยุดตัวเอง。

นั่นคือช่วงเวลาที่: การดีบั๊กใช้เวลา 90 นาที ตัว อย่าง นี้ กําลัง เลียน แบบ ข่าวสาร ผิด ๆ ที่ มี อยู่ รอบ ตัว 8KB ตัว เดียว กัน และ ค่อย ๆ ลืม ว่า มัน ได้ พยายาม ทํา การ ฟื้นฟู วิธี ใด. ในตอนท้ายของวันที่มันเริ่มผลิต 40 ความคิดที่ผมปฏิเสธมาก่อน ถ้า มี งบ ประมาณ ที่ กําหนด ไว้ กระบวนการ นี้ ควร สิ้น สุด ภาย ใน 12 นาที。

กฎ 7: การ รับ รู้ ถึง ความ ขัด แย้ง ไม่ อะลุ้มอล่วย

อย่าผสมแบบจําลองทั้งสองที่มีอยู่ ในห้องสมุดโค้ด ถ้าพวกเขาขัดแย้งกัน เลือกหนึ่งในโมเดลเหล่านี้ โดยให้ความสําคัญกับการปรับปรุงหรือการทดสอบกว่า โดยให้เหตุผลและทําเครื่องหมายต่อมาว่า "กฏเกณฑ์" ที่พยายามทําตามกฎทั้งสองชุด ในเวลาเดียวกันนั้นแย่ที่สุด。

และเมื่อสองส่วนของโค๊ดอยู่ในความขัดแย้ง คลอดจะพยายามทําให้ทั้งสองฝั่งพอใจ และผลก็คือรหัสที่ไม่สอดคล้อง。

นั่นเป็นช่วงที่มีการประมวลผลผิดพลาดสองโหมด ในห้องสมุดโค้ดหนึ่งหนึ่ง หนึ่ง Asinc/awaite-suur+ พยายาม/จับและอื่น ๆ ชายแดนผิดทั่วโลก คลาดเขียนรหัสใหม่ที่ใช้ทั้งสองเซต ผล ก็ คือ มี การ ทํา ผิด สอง ครั้ง. ผมใช้เวลา 30 นาที กว่าจะคิดออก ว่าทําไมความผิดพลาดถูกกลืนไปสองครั้ง。

กฎ 8: อ่านก่อน แล้วค่อยเขียน

อ่านเนื้อหาการส่งออกของเอกสาร, การเรียกโดยตรง, และฟังก์ชันเครื่องมือที่ใช้ร่วมกันอย่างชัดเจน ก่อนที่จะเพิ่มรหัสเข้าไปในเอกสาร ถ้า คุณ ไม่ เข้าใจ ว่า ทําไม รหัส ที่ มี อยู่ จึง มี การ จัด ระเบียบ เช่น นั้น จง ขอ ก่อน ว่า อย่า เพิ่ม อะไร เข้า ไป โดย ตรง. "มันดูเหมือนจะไม่เกี่ยวข้องกับฉัน" เป็นวลีที่อันตรายที่สุดในห้องสมุดรหัส。

คาโรดี้บอกว่า "แก้ไขตัวเอง" ห้ามเปลี่ยนรหัสที่อยู่ติดกัน แต่มันไม่ได้บอกคลาวด เข้าใจรหัสที่อยู่ติดกันก่อน ถ้าไม่มีสิ่งนี้ คลอดจะเขียนรหัสใหม่ ที่ขัดแย้งกับรหัสที่มีอยู่ นอก 30 บรรทัด。

นั่นคือช่วงเวลาที่: Claude เพิ่มฟังก์ชันที่เหมือนกันกับฟังก์ชันที่มีอยู่ เพราะมันไม่ได้อ่านฟังก์ชันเดิมก่อน ฟังก์ชันทั้งสองทําเหมือนกัน แต่เนื่องจากลําดับของรายงาน ฟังก์ชันใหม่ครอบคลุมฟังก์ชั่นเดิม ซึ่งมีอยู่หกเดือน。

กฎ 9: ทดสอบ ไม่ ใช่ ทาง เลือก แต่ การ ทดสอบ ไม่ ใช่ จุด จบ ใน ตัว มัน เอง

การทดสอบแต่ละครั้งต้องมีรหัสว่า "ทําไมพฤติกรรมนี้ถึงสําคัญ" และไม่ใช่แค่ "สิ่งที่มันทํา" การทดสอบเช่น 'get ผู้ใช้'. tobe ('John') 'จะไร้ค่าถ้าฟังก์ชันได้รับ ID แบบเข้ารหัสยากจริง ๆ ถ้าคุณไม่สามารถเขียนการทดสอบที่ล้มเหลว เมื่อเหตุผลทางธุรกิจมีการเปลี่ยนแปลง ฟังก์ชันเองผิด。

Kartis's "Target-Trippy" แสดงให้เห็นว่าการทดสอบสามารถเป็นหลักเกณฑ์ที่ประสบความสําเร็จ แต่ในการปฏิบัติ Claude ใช้คําว่า "ผ่านการทดสอบ" เป็นเป้าหมายเดียวของเขา ดังนั้นเธอจึงเขียนรหัสบางอย่าง ที่สามารถผ่านการทดสอบ Subserface。

นั่น เป็น ช่วง เวลา ที่ คลา วด์ ได้ เขียน 12 สอบ สําหรับ งาน พิสูจน์ ยืน ยัน ทุก คน ได้ ผ่าน ไป. แต่เหตุผลเชิงอนุมานในสิ่งแวดล้อมของการผลิตนั้นเสียหาย การทดสอบเหล่านั้นเป็นเพียงการตรวจสอบว่าฟังก์ชัน "กลับไป บางสิ่งบางอย่าง" ไม่ได้ว่ามันจะกลับมาทางขวามือ ฟังก์ชันถูกทดสอบเพราะมันส่งค่ากลับมาเป็นค่าคงที่。

กฎ 10: การดําเนินงานเป็นเวลานานต้องตรวจสอบจุด

ในแต่ละงานหลายขั้นตอน การสรุปสิ่งที่ได้ทําไปแล้ว สิ่งที่ได้ถูกทดสอบแล้ว และสิ่งที่ยังคงอยู่คือการทํา อย่าลงมาจากรัฐที่คุณไม่สามารถทําซ้ําให้ฉัน ถ้าคุณพบว่าตัวเองสูญเสีย หยุดและฟื้นฟูสถานะปัจจุบัน。

ปฏิสัมพันธ์ปริยายของต้นแบบ Karibie เป็นหนึ่งปิด แต่งาน Code Claude จริง ๆ มักจะเป็นหลายขั้นตอน: มากกว่า 20 ไฟล์ สร้างความสามารถในหนึ่งเซสชั่น กว่าหลายคณะกรรมการดีบั๊ก หาก ไม่ มี การ ตรวจ สอบ และ ก้าว หนึ่ง ก้าว นั้น ผิด อาจ สูญ เสีย ความ ก้าว หน้า ไป。

นั่นคือช่วงเวลาที่: ภารกิจแก้ไข 6 ขั้นตอน ผิดพลาดในขั้นตอนที่ 4 พอ ผม รู้ ว่า คลา วด์ เดิน ทาง ต่อ ไป อีก 5 และ 6 ก้าว ผ่าน รัฐ ที่ ผิด. การ ใช้ เวลา ทั้ง หมด ใน การ ซ่อมแซม ยัง คง ใช้ เวลา นาน. ถ้า มี การ ตรวจ สอบ ขั้น ที่ 4 จะ เปิด เผย ปัญหา。

กฎ 11: ความ เห็น พ้อง ต้อง กัน ก่อน ใน เรื่อง ความ คิด สร้าง สรรค์

ถ้า ห้อง สมุด รหัส ใช้ กรณี งู คุณ ก็ ชอบ กรณี อูฐ มาก กว่า: ใช้ กรณี งู. ถ้าห้องสมุดโค้ดใช้คอมพิวเตอร์แบบมีระดับ และคุณต้องการแขวน: ใช้คอมพิวเตอร์แบบเรียน ทัศนะ ที่ ไม่ เห็น ด้วย เป็น อีก เรื่อง หนึ่ง ที่ ถก กัน. การ ทํา เช่น นี้ จะ ทํา ให้ คุณ มี ความ สุข. ถ้า คุณ คิด จริง ๆ ว่า ข้อ ตก ลง นั้น ก่อ ความ เสีย หาย จง พูด ให้ ชัดเจน. อย่าเปิดแยกเส้นทางในความเงียบ。

Claude ชอบที่จะแนะนําตัวเอง ในห้องสมุดโค้ดที่มีการจัดการอย่างดี ถึงแม้มันจะเขียนว่า "ดีกว่า" การแนะนํา แบบจําลองตัวที่สองก็จะเลวร้ายกว่าแบบจําลองใดๆ。

นั่น เป็น ช่วง ที่ คลา วด์ แนะ นํา พวก ฮุกส์ ให้ รู้ จัก ใน ห้อง เก็บ สิ่ง ของ ซึ่ง อาศัย ส่วน ประกอบ ใน ชั้น เรียน. มันวิ่งได้จริงๆ แต่ในเวลาเดียวกัน มันทําลายโมเดลการทดสอบของห้องสมุดรหัส เพราะการทดสอบเหล่านั้นขึ้นอยู่กับคอมพิวเตอร์ ต้อง ใช้ เวลา ครึ่ง วัน เพื่อ ลบ ออก และ เขียน ใหม่。

เพื่อ จะ เห็น ได้ อย่า นิ่ง เงียบ

ถ้าคุณไม่สามารถทําให้แน่ใจได้ว่า บางสิ่งบางอย่างทํา พูดอย่างชัดเจน หาก มี การ กระโดด ลง ไป อย่าง เงียบ ๆ 30 บันทึก ก็ ไม่ อาจ กล่าว ได้ ว่า การ อพยพ เสร็จ สมบูรณ์. ถ้าคุณข้ามการทดสอบใด ๆ คุณไม่สามารถพูดว่า "ผ่านการทดสอบ". ถ้าคุณยังไม่ได้ยืนยันขอบเขตที่ผมขอ คุณไม่สามารถพูดคําว่า "งาน" การเปิดรับความไม่แน่นอน ไม่ใช่การซ่อน。

ความล้มเหลวที่แพงที่สุดของ Claude มักจะดูเหมือนความสําเร็จ ฟังก์ชัน "สามารถทํางานได้" แต่คืนข้อมูลผิด การย้าย "สมบูรณ์" แต่ข้ามบันทึกไป 30 แผ่น และการทดสอบ "passed" เพียงเพราะว่าการยืนยันนั้นผิด。

นี่คือช่วงเวลาที่คลาวด์บอกว่า การย้ายฐานข้อมูลเป็น "ความงดงาม" แต่ในความเป็นจริง มันผ่านไปอย่างเงียบ ๆ ผ่านบันทึกของร้อยละ 14 ที่ทําให้เกิดความขัดแย้งที่ผูกพัน การข้ามไปถูกบันทึกในบันทึกโดยไม่ถูกเปิดเผย สิบเอ็ดวันต่อมา เมื่อข้อมูลรายงานเริ่มออกไป เราค้นพบปัญหา。

ผลลัพธ์ของข้อมูล

ในหกสัปดาห์ฉันติดตามกลุ่มเดียวกันของ 50 ภารกิจตัวแทนครอบคลุม 30 โค้ดห้องสมุดและการทดสอบสามรูปแบบ。

อัตราการผิดพลาด หมายถึง ต้องแก้ไขหรือเขียนใหม่ให้ตรงกับวัตถุประสงค์เดิม ความผิดพลาดรวมถึง สมมุติฐานที่ผิดพลาดแบบเงียบ ๆ, การปรับเปลี่ยนตัวเองมากเกินไป, ความเสียหายโดยไม่รบกวน, ความล้มเหลวเงียบ, การฝ่าฝืนข้อตกลง, การประนีประนอมความขัดแย้งและการสูญหายของจุดตรวจ。

อัตราการเชื่อฟังจะอ้างอิงถึงความน่าจะเป็นที่เมื่อปรับใช้กฎ จะเห็นได้ชัดเจนในโปรแกรม S ของ Claude。

ผลลัพธ์ที่น่าสนใจจริงๆ ไม่ใช่แค่ว่า อัตราการพลาดลดลงจาก 41% เป็น 3% ที่ สําคัญ ยิ่ง กว่า นั้น การ เพิ่ม กฎ ข้อ 4 ให้ กฎ ข้อ 12 แทบ จะ ไม่ เพิ่ม ภาระ เกี่ยว กับ การ ปฏิบัติ ตาม โดย อัตรา การ ทํา ตาม ลด ลง จาก 78 เปอร์เซ็นต์ เหลือ 76 เปอร์เซ็นต์ แต่ อัตรา ความ ผิด พลาด ลด ลง 8 เปอร์เซ็นต์. กฎ ข้อ ใหม่ นี้ ครอบ คลุม ถึง แบบ จําลอง ที่ ล้ม เหลว ซึ่ง ไม่ ได้ มี การ กล่าว ถึง โดย กฎ เดิม 4 ข้อ และ กฎ เหล่า นั้น ไม่ ได้ ลง ทุน เพื่อ ให้ ได้ งบ การ เอา ใจ ใส่ อย่าง เดียว กัน。

แม่แบบคาร์ไมน์จะล้มเหลวตรงไหน

แม้ ไม่ มี กฎ ใหม่ แต่ แม่ แบบ กฎ 4 ต้น ฉบับ ก็ ไม่ เพียง พอ ใน 4 แห่ง。

อย่างแรก ทําหน้าที่เจ้าหน้าที่ เป็นเวลานาน。
กฎของคาร์โรธีส่วนใหญ่สําหรับคลาวซ์ ทันทีที่เขาเขียนโค้ด แต่จะเกิดอะไรขึ้นเมื่อ Claude ทํางานท่อหลายขั้นตอน? แม่แบบเดิมไม่มีกฏงบประมาณ ไม่มีกฏการเช็ค และไม่มีกฏ "ความล้มเหลวในการแสดง" ดังนั้นท่อจะค่อยๆลอย。

อย่างที่สอง ห้องสมุดหลายโค้ดสอดคล้องกัน。
มีรูปแบบเดียวโดยปริยาย แต่ ใน งาน เสิร์ฟ 12 แห่ง ที่ ทํา กัน เพียง คน เดียว คลอด ต้อง เลือก ว่า จะ ทํา แบบ ไหน. กฎเดิมไม่ได้บอกให้เลือก ดังนั้นมันจะเลือกอย่างสุ่ม หรือผสมสไตล์。

ข้อสาม คุณสมบัติการทดสอบ。
“ การ ใช้ ประโยชน์ เต็ม ที่ จาก การ ทดสอบ... ผล ก็ คือ คลอ ดี เขียน การ ทดสอบ บาง อย่าง ซึ่ง แทบ จะ ไม่ มี การ พิสูจน์ แต่ นั่น ทํา ให้ เขา คิด ว่า เขา แน่ ใจ。

ข้อสี่ ความแตกต่างระหว่างสิ่งแวดล้อมการผลิต กับขั้นตอนต้นแบบ。
กฎเดียวกันนี้ป้องกัน การสร้างรหัสการผลิตที่มากเกินไป แต่ยังทําให้การพัฒนาต้นแบบช้าลงด้วย เพราะขั้นตอนต้นแบบบางครั้งก็ต้องใช้ 100 บรรทัด ของการขยายขนาด โดยมองหาทิศทางก่อน Karibie's "การขยายความสําคัญ" ถูกกระตุ้นได้ง่ายเกินไปโดยรหัสเริ่มต้น。

กฎ ใหม่ แปด ข้อ นี้ ไม่ ได้ มุ่ง หมาย จะ แทน กฎ สี่ ข้อ แรก เดิม ของ คา รอ รี แต่ กําลัง ทํา ให้ ช่อง ว่าง ของ เขา เต็ม ไป ด้วย: ต้นแบบเดิมตรงกับฉากการเขียนรหัสสมบูรณ์อัตโนมัติ ในเดือนมกราคม 2026; โดย May 2026 รหัส Claude ได้เข้าสู่ระบบเอเจ้น-ไดรฟ์, หลายขั้นตอน, สภาพแวดล้อมการจัดเก็บรหัสหลายรหัสซึ่งมีปัญหาที่แตกต่างกัน。

อะไรไม่ได้ผล

ผม ยัง ได้ พยายาม เลือก วิธี อื่น ด้วย ก่อน จะ จบ กฎ 12 ข้อ。

เพิ่มกฎที่ผมเห็นใน Reddit / X。
ส่วนใหญ่แล้ว จะทวนกฎสี่ข้อเดิมของคาโรดี้ ในแบบต่าง ๆ หรือเป็นกฏเฉพาะสนาม ที่ไม่สามารถใช้ทั่วไปได้ เช่น "ใช้การขับหางรถเสมอ" พวกเขาถูกลบไปหมดแล้ว。

ส่วน 12。
ฉันทดสอบจนอายุ 18 หลัง จาก มี มาก กว่า 14 บทความ อัตรา การ ทํา ตาม ลด ลง จาก 76% เหลือ 52%. เพดานเป็นของจริง มากกว่านั้น, Claude จะเริ่มจับคู่รูปแบบกับ "กฎที่นี่" แทนกฎโดย。

กฎที่ขึ้นอยู่กับการมีอยู่ของเครื่องมือบางอย่าง。
ตัวอย่างเช่น "ใช้ eslints เสมอ" กฎที่ผิดพลาดเมื่อไม่มี esplints ติดไว้ในโครงการ จากนั้นผมเปลี่ยนมันเป็นการแสดงออกที่ไม่ขึ้นอยู่กับเครื่องมือเฉพาะเช่น "ใช้ eslint" แทน "ปฏิบัติตามรูปแบบบังคับในห้องสมุดโค้ด"。

ใช้ตัวอย่างใน CLAUDE.md แทนกฎ。
ตัวอย่างเป็นบริบทมากกว่ากฎ บริบท ของ สาม ตัว อย่าง นี้ แทบ จะ เทียบ ได้ กับ กฎ 10 ข้อ และ คลา วด์ สามารถ วาง ตัว อย่าง ลง ได้ อย่าง ง่าย ดาย. กฎเหล่านี้เป็นนามธรรม และตัวอย่างนั้นเจาะจง ดัง นั้น จึง ควร ใช้ กฎ。

จง ระวัง, คิด อย่าง รอบคอบ, และ ตั้งใจ ให้ มาก ขึ้น。
นี่เป็นเสียง อัตรา การ ทํา ตาม คํา สั่ง ดัง กล่าว ลด ลง เหลือ ประมาณ 30 เปอร์เซ็นต์ เพราะ ไม่ สามารถ ตรวจ สอบ ได้. จากนั้นผมแทนที่พวกเขาด้วย กฎคําสั่งที่เฉพาะเจาะจงมากขึ้นเช่น "สมมติฐานพิเศษ"。

บอกคลาวซ์ให้ทําตัวเป็นวิศวกรอาวุโส。
มันไม่ได้ผล คลอดรู้สึกเหมือนเป็นวิศวกรอาวุโส คําถามที่แท้จริงไม่ใช่ว่ามันเชื่อหรือไม่ แต่มันถูกนํามาใช้ในทางนั้นหรือไม่ กฎคําสั่งสามารถจํากัดช่องว่างนี้ และไม่ใช่เคล็ดลับของตัวตน。

ผู้ ปกครอง เต็ม ที่ 12

ต่อ ไป นี้ เป็น ฉบับ แปล ที่ ครบ ถ้วน ซึ่ง สามารถ ใช้ ได้ โดย ตรง。

ไม่สามารถแสดงนี้นอกเอกสารปรับแต่งการวาด

บันทึกเป็น CLAUDE.md ในบันทึกรากของโกดัง ภายใต้กฏเกณฑ์นี้ ให้เพิ่มกฎแยกสําหรับรายการ เช่น กองเทคโนโลยี คําสั่งการทดสอบ รูปแบบความผิดพลาด ฯลฯ อย่าเกิน 200 บรรทัดเต็ม. หลังจากนั้น จะมีการลดลงอย่าง เห็นได้ชัดในความยินยอม。

จะติดตั้งยังไง

สองก้าวก็พอแล้ว

เพิ่มกฎพื้นฐานสี่ข้อของ Karinie เข้ากับ CLAUDE.md
shelp https/skrawr.githubusperconfect.com/forst change/andre-kar-skills/main/CLAED.md & gt; > CLAUDE.md


2. วางกฏ 5-12 ข้างล่าง

บันทึกแฟ้มไว้ในไดเร็กทอรีรากของคลังเก็บ นี่เป็นกฏ > > ซึ่งสําคัญมากที่จะเพิ่มเข้าไปใน CLADE.md ที่มีอยู่แล้ว แทนที่จะใช้กฏเฉพาะที่คุณเคยเขียน。

รุ่นของจิต

CLUDE.md ไม่ได้เป็นรายการของความปรารถนา แต่สัญญาของการดําเนินการที่จะปิดกั้นรูปแบบเฉพาะของความล้มเหลวที่คุณได้สังเกตเห็น。

กฎ แต่ ละ ข้อ ควร ตอบ คํา ถาม ที่ ว่า กฎ ข้อ นี้ สามารถ ป้องกัน อะไร ได้

กฎข้อที่ 4 ของคาร์โรธีคือ การป้องกันรูปแบบความล้มเหลว ที่เขาเห็นในเดือนมกราคม 2026: สมมุติฐานแบบเงียบ ๆ พวกเขาคือมูลนิธิ อย่าข้าม。

ผมเพิ่มกฎใหม่ 8 ข้อ เพื่อป้องกันการปรากฏตัวของรูปแบบใหม่ ของความล้มเหลวหลังปี 2026: วงจรเอเจนต์ไร้ระเบียบ ภารกิจหลายขั้นตอน มันเพิ่มขึ้นเรื่อย ๆ。

แน่นอน ผล กระทบ นั้น แตก ต่าง กัน ไป ใน แต่ ละ คน. ถ้าคุณไม่ทําหลายขั้นตอน กฎ 10 จะสําคัญน้อยกว่า ถ้าห้องสมุดโค้ดของคุณเป็นเพียงรูปแบบเครื่องแบบเดียว และได้มีการบังคับใช้โดย int กฎ 11 จะซ้ําซ้อน หลัง จาก อ่าน 12 บทความ จง รักษา กฎ ต่าง ๆ ที่ ทํา ให้ คุณ หลง ผิด จริง ๆ และ ลบ ข้อ อื่น ๆ ออก ไป。

รุ่นที่ 6 ของ CLUDE.md ปรับให้เข้ากับรูปแบบความล้มเหลวที่แท้จริง มีจํานวนมากกว่า 12 แบบที่คุณไม่เคยใช้。

การ รวม คํา พูด

การทวีตของคาร์ซิสันในเดือนมกราคม 2026 เป็นข้อร้องเรียนหลัก ฟอร์เรส แชง เปลี่ยนเป็น 4 กฎ ใน ที่ สุด ผู้ พัฒนา 120,000 คน ได้ ให้ ผล ตอบ แทน แก่ สตาร์. และส่วนใหญ่ยังคงใช้กฎทั้งสี่ข้อทุกวันนี้。

โมเดลได้ก้าวหน้าและเปลี่ยนแปลงระบบนิเวศ August agent, chick up-up language, language, multiple-code complete ห้องสมุด - ไม่มีสิ่งนี้เกิดขึ้นเมื่อคาร์คีรีเขียนทททท กฎ เดิม 4 ข้อ ไม่ ได้ แก้ ปัญหา เหล่า นั้น. พวกเขาไม่ผิด แต่ยังไม่สมบูรณ์。

กฎใหม่ที่ 8 หกสัปดาห์ มากกว่า 30 รหัสห้องสมุด อัตราความผิดพลาดลดลงจาก 41% เหลือ 3%。

บทความนี้จะถูกรวบรวมในคืนนี้ เพื่อวางกฎ 12 ข้อนี้ลงใน CLAUDE.md. ถ้ามันช่วยให้คุณเดินได้ 1 สัปดาห์น้อยลง คลอดก็ยินดีต้อนรับ。

(หัวเราะ)ส่วนเชื่อมโยงดั้งเดิม]

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.