Litecoin

Claude Opus 4.7: มันเป็นแบบจําลองที่แข็งแกร่งที่สุดหรือเปล่า

2026/04/18 03:19
🌐th

Opus 4.7 เป็นการปลดปล่อยที่ไม่ได้ตั้งใจให้เป็นแบบ "ที่ดีที่สุด" เป็นหนังสือที่มีการแลกเปลี่ยนที่ชัดเจน。

Claude Opus 4.7: มันเป็นแบบจําลองที่แข็งแกร่งที่สุดหรือเปล่า
ชื่อเดิม: "Opus 4.7 ไม่อยากเป็นรุ่นที่แข็งแกร่งที่สุด: คุณไม่สามารถติดตาม Antrophic ได้"
ต้นฉบับ: ลิเวอร์พูล สตาร์แมน โปร

ใน วัน ที่ 16 เมษายน 2026 อัน โต รปิก ได้ ปล่อย คลอด โอปุส 4.7 ออก มา อย่าง เป็น ทาง การ เพียง สอง เดือน กว่า จาก คน รุ่น สุด ท้าย ของ โอปุส 4.6。

หลังจากคลื่นเร็ว ๆ นี้ ของผลิตภัณฑ์และแบบจําลองที่บ้าและปรับปรุง อานโทรปิกที่โยนออกรูปแบบใหม่ตามธรรมชาติ และคุณได้เห็นรายงานการคัดกรองครั้งแรกมากมาย ทั้งหมดนี้หมายถึง Opus 4.7 เป็น "โมเดลที่ทรงอํานาจมากที่สุด" -- "ผู้คนตายไปแล้ว" และ "คําเตือนการรวมกิจการ" เป็นต้น。

แต่มาดูกันว่า อานโทรพิค ส่งตัวมายังไง。

เสียงที่ปล่อยออกมานี้ไม่ปกติ。

Antographic เขียนโดยตรงในข่าวที่ โอปุส 4.7 มีความจุน้อยกว่าการแสดงของ Claude Mytos - และ Mythos เท่านั้นที่เปิดให้หุ้นส่วนเช่นแอปเปิล, Google, Microsoft, Nvivia และไม่สามารถใช้งานนักพัฒนาและผู้ใช้ทั่วไปได้。

ในเวลาเดียวกัน สิ่งที่น่าสนใจมากกว่าวาทศิลป์ของมัน คือมันไม่เพียงแต่อ่อนแอกว่าไมทอสเท่านั้น。

Opus 4.7 จํานวนที่ผิดปกติจากผลงานของเขา:MRCR v2@1M from 78.3% ของ Opus 4.6 ลงไปที่ 32.2%46 เปอร์เซ็นต์ของการลดลงอย่างเฉียบพลัน。

นางแบบธงธงมีน้อยนัก ที่สามารถตัดครึ่งความสามารถ ในการเป็นเอซได้。

และนั่นคือทางเลือกของมัน。

ดังนั้น ขณะที่คุณยังคงอยู่กับความเฉื่อยชาของสมอง ทุกโมเดลที่พัดมันแข็งแรงที่สุด มันไม่ได้เป็นไปตามจังหวะของตัวเอง

ไม่แม้แต่จะซ่อมรถนี่

Opus 4.7 เป็นสิ่งพิมพ์ที่ไม่มีจุดประสงค์ที่จะเป็นนายแบบที่ทรงอํานาจที่สุด - มีดการค้าที่ชัดเจน。

มันอาจเป็นจุดที่ 4.7 สําคัญจริงๆ。

ความสามารถในการเขียนโปรแกรม: การปรับปรุงจริงหลังหมายเลข

วิธีที่ดีที่สุดที่จะเข้าใจการเปลี่ยนแปลงเหล่านี้ได้ดีขึ้น คือ การมองให้ละเอียดมากขึ้น ว่าจริงๆแล้วมันทําอะไร。

นี่คือคอมโบข้อมูลที่สมบูรณ์ ที่โอปุส 4.7 ปล่อยครั้งนี้ -- ที่ที่มีความคืบหน้าเกิดขึ้น, ที่ที่ถูกทําลายไป。

ข่าวอย่างเป็นทางการ:https/www.antropi.com/news/clade-opus-4-7

ความสําเร็จการเขียนโปรแกรมของ Opus 4.7 เป็นแกนหลักของการปลดปล่อยนี้。

คุณสมบัติของ SWE500 ปัญหา Github จริง โมเดลจําเป็นในการเขียนแพทช์ที่ผ่านการทดสอบ) จาก 80.8% ของ Opus 4.6 ถึง 87.6%, เกือบ 7 เปอร์เซ็นต์, เป็นรุ่นแรกที่เปิดรับในปัจจุบัน เมื่อเทียบกับจีมีน 3.1 โปร 80.6% ช่องว่างมีความสําคัญ。

โปรแกรม SWE-bench Proมันเป็นเวอร์ชันที่ยากกว่าเดิม ครอบคลุมเส้นทางการไหลของวิศวกรรมอย่างสมบูรณ์ ในสี่ภาษาโปรแกรม Opus 4.7 กระโดดจาก 53.4% ถึง 64.3%, 11 เปอร์เซ็นต์ เมื่อเทียบกับ 57.7 เปอร์เซ็นต์ของจีพีที-54, 54.2 เปอร์เซ็นต์ของจีมีนี 3.1 โปร, โอปุส 4.7 อยู่เหนือเครื่องหมายม้านั่งนี้อย่างชัดเจน。

มีดโกนเบนช์มันเป็นม้านั่งบนสนามจากเคอร์เซอร์ ซึ่งวัดคุณภาพการเขียนโปรแกรม Opus 4.6 เป็น 68%, Opus 4.7 กระโดดเหลือ 70%, 12 เปอร์เซ็นต์ ผู้ร่วมก่อตั้งเคอร์เซอร์ ไมเคิล เยล ในข่าวอย่างเป็นทางการของเขา ได้กล่าวว่า "นี่เป็นก้าวกระโดดที่มีความหมาย

สัดส่วนหุ้นส่วน:

Rakuten:Opus 4.7 แก้งานที่ผลิตได้มากกว่า Opus 4.6 สามเท่า โดยเพิ่มคุณภาพโค๊ดและคุณภาพการทดสอบ

• ข้อ เท็จ จริง:อัตราความสําเร็จของภารกิจเพิ่มขึ้น 10-15 เปอร์เซ็นต์ และจํานวนโมเดลหยุดลดลงอย่างมาก

• ปรับ ปรุง ใหม่ข้างหลังบริษัท โมเดล "อาจจะทํางานเป็นชั่วโมง โดยไม่เสียเส้น"

• รหัส รับ บี:นึกถึงอัตราการเพิ่มขึ้นมากกว่า 10% ที่ "เร็วกว่าจีพีที-5.4 xigh นิดหน่อย"

• โบลท์:ในภารกิจก่อสร้างประยุกต์ที่ยาวขึ้น โอปุส 4.7 คือ 4.6

ฉันไม่รู้ ขนาดเทอร์มินัล 2. 0:Opus 4.7 ได้แก้ไขงาน 3 งาน ที่ก่อนหน้านี้ไม่สามารถดูแลได้โดย Claude Mode (หรือคู่แข่ง) หนึ่งในงานนั้นต้องใช้เหตุผลหลายแฟ้ม

ข้อมูลเหล่านี้ถูกเน้นไปในทิศทางเดียว: Opus 4.7 ได้ปรับปรุงอย่างชัดเจนในงานโปรแกรมที่ซับซ้อน และนั่นคือจุดที่ผู้ใช้ลดลงมากที่สุด ในสองเดือนที่ผ่านมา เมื่องานสําเร็จครึ่งหนึ่ง。

ภาพ: การ ปรับ ปรุง ที่ ไม่ มี คุณค่า มาก ที่ สุด ของ การ เปิดตัว

เครื่องหมายแถบปรับภาพXBOW กระโดดจาก 54.5% ถึง 98.5%。นี่ไม่ใช่การพัฒนาที่ค่อยๆดีขึ้น แต่เป็นการกระโดดไปข้างหน้าในระดับของการบูรณะ。

การเปลี่ยนค่าเฉพาะ:

ฉันไม่รู้ค่าความละเอียดสูงสุดของภาพที่เพิ่มขึ้นจากประมาณ 1.15 ล้านพิกเซล (ยาว 1,568 พิกเซล) เป็นประมาณ 3.75 ล้านพิกเซล (ยาว 2,576 พิกเซล) มากกว่าสามเท่าของรุ่นก่อน ๆ

ฉันไม่รู้พิกัดรุ่นและพิกเซลจริงที่ประสบความสําเร็จ1: 1ก่อนที่งานจะต้องแปลงค่าตัวช่วยปรับขนาดเอง, ขั้นตอนนี้จะหายไป

ฉันไม่รู้KarXiv point point board point: ไม่มีเครื่องมือ 82.1%, เครื่องมือ 91.0%

ฉากแบบไหนที่ส่งผลกระทบจริงๆ

สําหรับทีมผลิตภัณฑ์ การอัพเกรดนี้อาจเป็นการตัดสิน Opus 4.6-rae คอมพิวเตอร์กําลังอยู่ในสภาวะที่ "ยิงได้ แต่กลัวที่จะผลิต" สูงกว่าอัตราความผิดพลาดที่จะคาดเดา ความ ถูก ต้อง แม่นยํา ทาง สายตา ของ 98.5 เปอร์เซ็นต์ หมาย ความ ว่า เป็น ครั้ง แรก ที่ การ ทํา งาน นี้ มี ขีด จํากัด สําหรับ การ ใช้ งาน ที่ น่า เชื่อ ถือ. ในการประเมินนี้ นักบล็อกเทคนิคหลายคนเขียนว่า "ถ้าคุณเอาคอมพิวเตอร์ไปใช้โปรแกรมผลิตสินค้า เพราะความถี่สูงของข้อผิดพลาดของโอปุส 4.6。

การตอบกลับครั้งแรกบนสีแดง(ค.ศ. ผู้ใช้กล่าวว่า "การปรับปรุงความสามารถด้านสายตานั้นสําคัญเกินไป และผมได้ทําโครงการต่าง ๆ มาก่อน โดยพยายามที่จะให้แบบจําลอง

นอก จาก การ ใช้ คอมพิวเตอร์ แล้ว ผล ประโยชน์ ต่าง ๆ ยัง รวม ถึง การ ตรวจ สอบ เอกสาร ด้วย (การ อ่าน อักษร ตัว เล็ก กว่า, การ ระบุ ราย ละเอียด ของ แผนภูมิ ที่ ซับ ซ้อน กว่า), การ ปรับ ปรุง ความ เข้าใจ, การ ใช้ แบบ หน้า ปัด, การ ดําเนิน งาน ที่ ซับ ซ้อน ของ PDF。

ปัญหา ด้าน ราคา ที่ จําเป็น ต้อง เอา ใจ ใส่:ภาพความละเอียดสูงใช้เครื่องหมายมากขึ้น หาก ฉาก ของ โปรแกรม ไม่ จําเป็น ต้อง มี ภาพ โดย ละเอียด ก็ ขอ แนะ ให้ ถ่าย ภาพ ตัว อย่าง ก่อน จะ ถูก อัปโหลด。

3 ความล้มเหลวที่ยิ่งใหญ่ที่สุด: บริบทยาวได้ยุบ

MRR( v2@ 1M(การทดสอบหน่วยความจําจํานวนหลายล้านอัน):

ฉันไม่รู้4.6 :78.3%

ฉันไม่รู้4.7:32.2 เปอร์เซ็นต์

การล่มสลายของร้อยละ 46 จากเกือบ 80 เปอร์เซ็นต์เป็นหนึ่งในสาม。

การหยดนี้ไม่มีตัวอย่าง ในประวัติของนางแบบเรือธง MRCR v2 เป็นความสามารถของ Antrophic ตัวเองจะถูกเน้นในยุค Opus 4.6 เมื่อ Antrophic ถูกเรียกว่า "การเปลี่ยนแปลงแบบคลุ้งในบริบท 4.7 การแปลงมวลนี้หายไป。

ทําไม? โทเคโนเซอร์เปลี่ยนไป。

โอปุส 4.7 ด้วยลายเซ็นใหม่ ข้อความนําเข้าเดียวกันจะถูกสร้างราว1.0-1.35 หมู่จํานวนของสัญลักษณ์, จํานวนของเครื่องหมายต่าง ๆ แตกต่างกันตามชนิดของเนื้อหา。

ปฏิกิริยาลูกโซ่โดยตรงคือ

ฉันไม่รู้หน้าต่างบริบทสําหรับ 200K/1M ยังคงใช้ได้ในชื่อ แต่ข้อความเดิมถูกโหลดน้อยลง

ฉันไม่รู้การ บริโภค อาหาร ที่ ได้ ผล จริง เพิ่ม ขึ้น ประมาณ 35 เปอร์เซ็นต์ สําหรับ งาน มอบ หมาย ที่ ทํา กัน มา นาน

ฉันไม่รู้ค่าไม่เปลี่ยนแปลงของราคา $5, ค่าส่งออก 25 ดอลลาร์ต่อล้านเหรียญ) แต่ค่าใช้จริงเพิ่มขึ้น

อโทรปิก (Antrophic) รุ่นอย่างเป็นทางการ คือ เครื่องเซ็นซิเซอร์รุ่นใหม่ "พิสูจน์ประสิทธิภาพการประมวลผลของข้อความ" แต่ข้อมูลมาตรฐานแสดงความถดถอยที่โดดเด่นในบริบทที่ยาวเหยียด。

ความสามารถในการค้นหายังลดลง

ฉันไม่รู้Brownecomp (Web in-depth access): 83.7% ของ Opus 4. 6

ฉันไม่รู้GPT-5.4 คะแนน Pro 89.3%, Gemini 3.1 Pro คะแนน 85.9%, Opus 4.7 ปัจจุบันในการแข่งขันหลักรุ่นล่าง

การ ค้น หา และ การ ส่ง ข้อ ความ ยาว ๆ เป็น ฉาก ที่ พบ ได้ ทั่ว ไป สําหรับ ผู้ ใช้ ธุรกิจ หลาย คน。

การตอบรับครั้งแรกจากนักพัฒนาเกี่ยวกับข่าวแฮกเกอร์ (ผู้เผยแพร่ 275, หมายเหตุ 215, แหล่งที่มา: HN อภิปราย):

"เพื่อปิดความคิดที่น่ารังเกียจ และดึงความพยายามด้วยตัวเองไปด้านบน "การประเมินภายในของเราดูดี" ไม่เพียงพอ และทุกคนเห็นปัญหาเดียวกัน "4.7" ค่าปริยายไม่มีป้ายเหตุผลที่อ่านได้อีกต่อไป

ปัญหาเหล่านี้สะท้อนโดยผู้ใช้ที่แท้จริง แต่ นี่ ยัง เป็น ทาง เลือก ที่ อะ โทร ฟิก ได้ ทํา ด้วย ความ ริเริ่ม ของ เขา เอง。

IV ลักษณะพฤติกรรมใหม่: ความมั่นใจในตัวเองและปฏิบัติตามคําแนะนํา

โอปุส 4.7 การ ประกาศ อย่าง เป็น ทาง การ มี คํา แถลง เพียง ข้อ เดียว ที่ ควร ค่า แก่ การ รับ:รุ่นนี้จะยืนยันผลของมัน ก่อนที่จะรายงานผล。

ทีมเทคนิคของเฮกซ์ให้กรณีเฉพาะในการทดสอบ: เมื่อข้อมูลหายไป Opus 4.7 รายงานว่าข้อมูลไม่ได้มีอยู่จริง เวทีด้านเทคโนโลยีการเงิน บล็อกนี้กําลังจะพูดว่า "มันสามารถตรวจจับความผิดพลาดได้เอง ในขั้นตอนการวางแผน, เร่งการทํางาน

แต่การสร้างตัวเองนําการเปลี่ยนแปลงพฤติกรรมอื่นที่เกี่ยวข้อง: Opus 4.7 การตีความของคําสั่งเป็นความหมายตามตัวอักษรมากกว่า。

นี่เป็นความเสี่ยงในการอพยพที่สําคัญ ถ้าคุณวาดทันทีอย่างระมัดระวัง 4.7 สําหรับ Opus 4.6 มันอาจไม่ใช่ "อ่านออก" เช่น 4.6 แต่มันทําอย่างเคร่งครัดตามสิ่งที่คุณเขียน Anthropedic ได้กล่าวถึงเรื่องนี้อย่างชัดเจนในคู่มือการอพยพอย่างเป็นทางการ แสดงให้เห็นว่าการกระตุ้นที่สําคัญจะถูกทดสอบสําหรับความถดถอย ก่อนที่จะไปออนไลน์ 4.7。

หมายเลขอ้างอิงที่ทํางาน จาก CTO ใน Hex:Opus 4.7 สําหรับความพยายามต่ํา มีประสิทธิภาพประมาณเท่ากับ Opus 4.6 สําหรับความพยายามปานกลาง。

v. elimination command mechannisms: xhe, bobs และ / ultrareview

โอปุส 4.6 มีเหตุการณ์ที่มีผลต่อความไว้วางใจของผู้ใช้: 9 กุมภาพันธ์ ต้นแบบปริยายสําหรับความคิดที่ปรับตัวได้, 3 มีนาคม อย่างเป็นทางการเลื่อนความคมชัดของเหตุผลปริยายจากด้านบนไปสื่อในพื้นที่ "สมดุลระหว่างสติปัญญา, ล่าช้า, ราคา". เรื่อง นี้ มี การ อ้าง ถึง โดย ผู้ ใช้ ว่า เป็น “ประตู แห่ง การ หลอก ลวง ” และ คํา ถาม จาก ผู้ อํานวย การ อาวุโส ใน กิตติฮับ ก็ มี การ ถ่ายทอด อย่าง กว้าง ขวาง。

โอปุส 4.7 ตอบ สนอง โดย ให้ อํานาจ ควบคุม ความ ลึก ของ การ หา เหตุ ผล ที่ เห็น ได้ ชัด กว่า ผู้ ใช้。

ความพยายามสูงการ หา เหตุ ผล ใน ระดับ ใหม่ ระหว่าง ระดับ สูง และ สูง สุด. ขณะนี้รหัส Claude ได้อัปเดตรูปแบบวางแผนทั้งหมดไปยัง XHEE。

แต่ชุมชนนักพัฒนามีคําถามเกี่ยวกับ xhee และคําเดิมของผู้ใช้ Reddit คือ "Opus 4.6" ค่าปริยายคือสื่อ, 4. 7 ค่าปริยายคือ xhen ผมอยากรู้ว่าอะไรอยู่เบื้องหลังการตัดสินใจครั้งนี้ เพราะเห็นได้ชัดว่าการเพิ่มขึ้นของไฟล์ความพยายาม

หรือพูดอีกอย่างคือ ผู้ใช้เห็น "กลับค่าการควบคุมไปยังผู้ใช้" แต่จริง ๆ แล้ว แฟ้มปริยายถูกยกขึ้นมา ซึ่งหมายความว่า งานเดิมได้ถูกตั้งค่าให้เขียนเครื่องหมายเพิ่มเติม เพิ่มการเปลี่ยนแปลงของลายเซ็น ซึ่งเป็นการเพิ่มค่าใช้จ่ายสองเท่า。

บั๊กงานกลไกควบคุมงบประมาณ สําหรับภารกิจที่ยาวนาน นัก พัฒนา ตั้ง งบ ประมาณ ทั้ง หมด (inmum of 20K) ซึ่ง ทํา ให้ แบบ จําลอง สามารถ ดู จํานวน ที่ เหลือ ได้ จริง ๆ ระหว่าง การ นํา มา ใช้ โดย วิธี นี้ จึง เป็น การ ลด ทรัพยากร ไว้ เหลือ ครึ่ง หนึ่ง เนื่อง จาก มี การ แสดง มาก เกิน ไป และ ป้องกัน ของ เสีย ที่ ไม่ จําเป็น。

โค้ด Claude เพิ่มคําสั่ง / ultrraview:การทบทวนรหัสพิเศษ, เรียกใช้การทบทวนข้อมูล in-depth ที่เน้นในการค้นหาข้อผิดพลาด และปัญหาการออกแบบ, และ Pro และ Max ผู้ใช้ให้พวกเขา ฟรี 3 ครั้งต่อเดือน。

โหมดอัตโนมัติจะเปิดให้ผู้ใช้สูงสุด:ความเดิมตอนที่แล้วในโครงการเอ็นเตอร์ไพรส์ ตอนนี้ ผู้ใช้แมกซ์ใช้มันได้ คลา วด์ มี อิสระ ใน การ ตัดสิน ใจ และ ช่วย ลด จํานวน ความ ก้าวร้าว ของ ผู้ ใช้. หัวหน้าทีมรหัส Claude Brobr Cherny บอกว่า "ให้ Claude ภารกิจ ปล่อยให้เขาวิ่ง กลับไปดูว่าเกิดอะไรขึ้น"

ที่ที่จะชนะที่ที่จะสูญเสีย

ต่อ ไป นี้ เป็น ข้อมูล พื้น ฐาน หลัก ที่ มี อยู่ ใน ปัจจุบัน (แหล่ง ข้อมูล: บัตร ระบบ อธิก ธรรม และ การ ประเมิน คู่ ครอง)。

โปรแกรมและวิศวกรรม (Opus 4. 7 ตะกั่ว)

ภาพและโมเดลา (Opus 4. 7 โดยห่างไกล)

งาน ด้าน ความ รู้ (Opus 4. 7)

การ ประเมิน ที่ เข้าใจ ได้ (Opus 4. 7 เห็น ได้ ชัด ว่า เหนือ ขั้น ตอน)

การ หา เหตุ ผล ทั่ว ไป (สาม แบบ พื้น ฐาน)

ม้านั่งนี้อิ่มตัว และไม่เป็นน้ําที่มีประสิทธิภาพอีกต่อไป。

งาน วิจัย (GPT-54 ตะกั่ว Opus 4. 7 ถอย)

คอนเท็กซ์ยาว (Opus 4. 7 ความถดถอยเชิงลบ)

สรุปตรรกะการคัดเลือก: สี่พื้นที่ของการเขียนโปรแกรม, ตัวแทนวิศวกรรม, การอ่านภาพ, การอ่านตามกฏหมาย, Opus 4.7 มีข้อดีชัดเจน; การวิจัยและเปิดเว็บค้นหา GPT-5.4 แข็งแกร่ง; และในบริบทของบริบท โอปุส 4.7 นั้นน้อยกว่ารุ่นก่อน ๆ มาก, จุดที่น่าสะพรึงกลัวที่สุด。

วีไอ รั้ว ป้องกัน: หิน ที่ ปู ด้วย หิน แห่ง มาย อส

ส่วนนี้สามารถใช้ได้อย่างง่ายดายเป็น "คําสั่งป้องกันปกติ" ในการปลดปล่อย แต่มันคือกุญแจสําคัญในการเข้าใจกลยุทธ์ปัจจุบันของอานโทรปิก。

เมื่อวันที่ 7 เมษายน อานโทรปิกประกาศโครงการ กลาสวิง: การเปิดโครงการ Claude Mytos ตัวอย่างของแอปเปิล, Google, Microsoft, Nvidia, Amazon, Sciet, ฝูงชน, JP Morgan เชส และ Broadcom 9 หุ้นส่วนที่อุทิศให้กับโครงการรักษาความปลอดภัยไซเบอร์。

Mythos เป็นรุ่นที่ทรงพลังที่สุดของ Antrophic จนถึงขณะนี้ และตามรายงานของ The Hacker News มันสามารถตรวจจับหลุมศูนย์วันได้เอง อย่าง ไร ก็ ตาม เนื่อง จาก ความ สามารถ นี้ จึง มี การ พบ ว่า มี ความ เสี่ยง สูง ต่อ การ ถูก ทํา ร้าย และ ไม่ มี ใน ที่ สาธารณะ。

Opus 4.7 เป็นตัวอย่างการทดสอบครั้งแรกบนเส้นตรงนี้。ในระยะการฝึก อาโทรปิกได้ริเริ่มลดความสามารถการจู่โจมของระบบไซเบอร์ (ในขณะที่ยังรักษาความสามารถในการป้องกันไว้ได้มากที่สุดเท่าที่จะทําได้) และไปออนไลน์ด้วยระบบรักษาความปลอดภัยจริงเวลา เพื่อตรวจจับและดักจับความอันตรายของเครือข่าย ข้อความของข่าวที่: "เราจะเรียนรู้จากการใช้งานจริงของ Opus 4.7 เกี่ยวกับ ประสิทธิภาพของรั้วแล้วตัดสินว่า จะขยายให้ไมทอส"

กล่าว อีก นัย หนึ่ง นัก พัฒนา ทุก คน ที่ ใช้ โอปุส 4.7 กําลัง ช่วย อะ โทร ฟิก ใน การ ทํา ให้ รั้ว รักษา ความ ปลอด ภัย เสื่อม ถอย。

ผลการประเมินของกิซโมโด:การเปิดตัวได้นํา "กลยุทธ์ทางการตลาดแบบแบนด์ - โปรโมชั่นอัตโนมัติของรูปแบบการแสดงตัวเองใหม่" ด้วยความสามารถทั่วไปน้อยกว่าตัวเลือกอื่น ๆ ซึ่งหายากในการปล่อยธง。

ผู้รักษาความปลอดภัยที่ต้องการใช้ Opus 4.7 เพื่อทดสอบการเจาะลึกทางกฎหมาย การศึกษาช่องว่าง หรือการทดสอบทีมแดง。

ที่ 8 ราคาและการย้ายถิ่น: ไม่มีการเปลี่ยนแปลงในชื่อ การเพิ่มขึ้นจริง

ตัวประกอบ:ใส่เหรียญ 5 ล้านเหรียญ, ค่าออกมา 25/ล้านเหรียญ, เหมือนกับ Opus 4.6 บัตรประจําตัวรุ่น API ถูกปิด 4-7 แพลตฟอร์มที่มีอยู่รวมถึง Claude API, Amazon Bedrock, Google Cload Vertex AI, มูลนิธิไมโครซอฟท์, Githoub Co Columm ก็อยู่ในสายด้วย。

แต่ ดัง ที่ กล่าว ไป ก่อน หน้า นี้ การ เปลี่ยน แปลง ของ ตัว แทน ทํา ให้ การ นํา เข้า นั้น ประมาณ เท่า กัน1.0-1.35เพิ่มจํานวนของสัญลักษณ์เป็นทวีคูณ โดยเพิ่มค่าความคิดปริยายให้สูงขึ้น ภายใต้เครื่องหมายช่องลองค่า ใช้ จ่าย จริง ๆ สําหรับ การ ทํา งาน อัน ยาว นาน。

Antrophic ยังลดการจัดเก็บรหัสของ Claude จากหนึ่งชั่วโมงเป็นห้านาที -- นี่ หมาย ความ ว่า ถ้า คุณ ออก จาก คอมพิวเตอร์ นาน กว่า ห้า นาที แล้ว กลับ มา การ เก็บ ข้อมูล ใน บริบท จะ ล้ม เหลว คุณ จะ ต้อง ใส่ เครื่อง ใหม่ และ สัญลักษณ์ จะ กิน เร็ว ขึ้น. ชุมชนเรดดิท มีผู้ใช้หลายคน ที่ "เผาเร็วกว่าตก"。

รายชื่อการเปลี่ยนแปลงความเสียหายของ Opus 4.6 ผู้ใช้ที่มีอยู่:

งบ ประมาณ ที่ ยืด เยื้อ

2. การขยายพารามิเตอร์ต่าง ๆ เช่น อุณหภูมิ (อุณหภูมิ), ด้านบน p, บนสุด k ได้ถูกลบและควบคุมการแสดงผลแล้ว

กําหนดคําสั่งที่ใช้ข้อความตามต่อไปนี้ - ถูกแก้ไขสําหรับ Opus 4. 6 จําเป็นต้องตรวจสอบอีกครั้ง และไม่สามารถแทนที่ได้ด้วยหมายเลขต้นแบบบนบรรทัด

4. การ เปลี่ยน แปลง ของ โท เคน เซอร์ ยัง ผล ให้ มี การ เปลี่ยน แปลง เป็น หมาย สําคัญ และ มี การ แนะ นํา ให้ ใช้ ตัว อย่าง การ จราจร จริง ก่อน การ อพยพ เต็ม ที่

การแสดงผลปริยายไม่มีส่วนสรุปเหตุผลอยู่แล้ว และต้องการการตั้งค่าที่มองเห็นได้เพื่อให้มันกลับมา

คํา แนะ นํา ที่ ใช้ ได้ จริง:คู่มือ การ อพยพ อย่าง เป็น ทาง การ ของ แอ นโทร ฟิก เสนอ แนะ ว่า การ เปลี่ยน แปลง อย่าง เป็น ทาง การ นี้ ใช้ โอปุส 4.7 โดย มี การ ผลิต ตัว แทน เป็น ตัว แทน ไหล เวียน ก่อน ตัดสิน ใจ ใช้ ประโยชน์ จาก การ บริโภค และ คุณภาพ ของ ภารกิจ。

เป็นวิธีที่น่ากลัวที่สุด ที่จะปล่อยมีด

Opus 4.7 เป็นอัพเกรดที่มีทิศทางเป้าหมายที่ชัดเจน และอัพเกรดในค่าใช้จ่ายที่ชัดเจน และทั้งหมดนี้เป็นการออกแบบของแอนโธนี และคุณจะต้องจ่ายเงินสําหรับพวกเขาในระดับใหญ่。

ในด้านก้าวหน้าของโมเดลนี้

ฉันไม่รู้87.6% ของ SWE-Becherd, 64.3% ของ SWE-bench Pro, 70% ของ เคอร์เซอร์เบนช์, 3 เท่าของงานของ Raguen - นี่คือการปรับปรุงโปรแกรมที่รู้สึกได้ในสภาพแวดล้อมการผลิต

ฉันไม่รู้ปรับปรุงภาพ (XBOW 54.5% 98.5%, มติ 3 ครั้ง, พิกเซล 1:1), อนุญาตให้มีประตูสําหรับการใช้งานที่เชื่อถือได้เป็นครั้งแรก

ฉันไม่รู้xigh, tsk ปุ่ม, / ltraview เป็นการตอบสนองที่มองเห็นได้กับ "truture"

ฉันไม่รู้BigLaw 90.9 เปอร์เซ็นต์, ผู้กุมอํานาจการเงิน 64.4 เปอร์เซ็นต์, เป็นผู้นําอย่างชัดเจนใน ความเชี่ยวชาญเช่นกฎหมายการเงิน

ยอมแพ้ซะ

ฉันไม่รู้MRCR v2@1M จาก 78.3% ถึง 32.2% โดยมีเกือบครึ่งหนึ่งของความสามารถในบริบท

ฉันไม่รู้Brownecomp ลดลงจาก 83.7% ถึง 79.3% และความสามารถในการค้นหาถูกข้ามคู่ด้วย GPT-54 และ Gemini 3.1 pro

ฉันไม่รู้tochiter change + ความพยายามปริยายสูง + แคช TTL สั้น = ทริปเปิล Price up

ฉันไม่รู้Mythos ยังกดต่อไป ซึ่งหมายความว่า Antrophic ยังคงมีการ์ดที่ใหญ่กว่านี้ แต่ทําไม่ได้

คราวนี้ เรื่องจริงไม่ใช่ "โมเดลที่แข็งแกร่งที่สุด" หรือ "รุ่นที่เปิดแข็งแรงที่สุด" แต่หนึ่งที่มีการแลกเปลี่ยนที่ชัดเจน。

ข่าวล่าสุดคือ รายได้ประจําปีของ Claude Code ได้ถึง 2.5 พันล้านบาท Opus 4.7 เป็นเดิมพันต่อไปในบรรทัดนี้。

มี การ เพิ่ม โปรแกรม และ เพิ่ม ภาพ เข้า ไป บริบท และ การ ค้น หา นาน ๆ จะ ลด ลง และ ราคา ยัง คง ระบุ ได้ แต่ ค่า ใช้ จ่าย เพิ่ม ขึ้น. Anthoric is ดุลยภาพกับ Opus 4.7 - ทั้งการซ่อมแซมความเสียหายของความไว้วางใจที่เหลือจาก Opus 4.6 และทําแบบฝึกหัดด้านการรักษาความปลอดภัย สําหรับอนาคตของ Mythos รุ่นที่มากขึ้น และ ที่ สําคัญ ยิ่ง กว่า นั้น มัน จํา ต้อง ใช้ ประโยชน์ เต็ม ที่ จาก สาร ตะกั่ว ที่ มี อยู่ ใน ทุก วัน นี้ เปลี่ยน ความ นิยม ของ ผู้ ใช้ ที่ มี ต่อ ผลิตภัณฑ์ ของ มัน ให้ กลาย เป็น สาร เจือ จาง ซึ่ง ยัง คง เป็น สิ่ง ที่ ขาด ไม่ ได้ สําหรับ ผลิตภัณฑ์ รุ่น หนึ่ง แม้ ว่า จะ บกพร่อง แล้ว ก็ สร้าง ผู้ ใช้ ที่ น่า รัก และ เกลียด เช่น แอปเปิล และ ป่า ไม้ ที่ มี ค่า ทาง การ ค้า อย่าง แท้ จริง。

ส่วนเชื่อมโยงดั้งเดิม

QQlink

Tidak ada "backdoor" kripto, tidak ada kompromi. Platform sosial dan keuangan terdesentralisasi berdasarkan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Tim R&D QQlink. Hak Cipta Dilindungi Undang-Undang.