أنثروبي اليوم صدر كلود أوبوس 4.8ترقية إلى النموذج الرئيسي، متوفر بنفس سعر سابقه، إلى جانب طبقة “الوضع السريع” الأرخص بكثير وميزة جديدة تسمح للنموذج بإنشاء مئات من الوكلاء الفرعيين المتوازيين للعمل على نطاق قاعدة التعليمات البرمجية.
النموذج متاح على الفور على منصات Anthropic – claude.ai، وClaude Code، وAPI، وCowork – بسعر ثابت يبلغ 5 دولارات لكل مليون رمز إدخال و25 دولارًا لكل مليون رمز إخراج. يمكن للمطورين تسميتها claude-opus-4-8.
قصة الأداء الكبيرة هي الوضع السريع. قامت Anthropic بتخفيض سعر Opus 4.8 في الوضع السريع – حيث ينتج النموذج الرموز المميزة بحوالي 2.5 ضعف السرعة العادية – إلى 10 دولارات لكل مليون رمز إدخال و50 دولارًا لكل مليون رمز مخرج، مقارنة بـ 30/150 دولارًا لـ Opus 4.7
ويمثل هذا انخفاضًا بمقدار 3 أضعاف عن تسعير الوضع السريع للنماذج السابقة ويجعل الاستدلال عالي الإنتاجية في متناول أعباء عمل الإنتاج الحساسة لزمن الوصول.
الوضع السريع متاح على الفور في Claude Code عبر /fast طلب؛ تم إغلاق الوصول إلى واجهة برمجة التطبيقات (API) وقائمة الانتظار متاحة على claude.com/fast-mode.
في الوضع القياسي، يظل Claude Opus 4.8 أحد النماذج الرائدة الأكثر تكلفة، لكنه لا يزال يتخلف عن منافسه الرئيسي OpenAI’s GPT-5.5.
لقطة تسعير واجهة برمجة تطبيقات Frontier AI Model
|
نموذج |
دخول |
مخرج |
التكلفة الإجمالية |
مصدر |
|
فلاش ميمو-V2.5 |
0.10 دولار |
0.30 دولار |
0.40 دولار |
|
|
ميني ماكس M2.7 |
0.30 دولار |
1.20 دولار |
1.50 دولار |
|
|
الجوزاء 3.1 فلاش لايت |
0.25 دولار |
1.50 دولار |
1.75 دولار |
|
|
ميمو V2.5 |
0.40 دولار |
2.00 دولار |
2.40 دولار |
|
|
كيمي-K2.6 |
0.95 دولار |
4.00 دولار |
4.95 دولار |
|
|
جي إل إم-5 |
1.00 دولار |
3.20 دولار |
4.20 دولار |
|
|
جروك 4.3 (سياق منخفض) |
1.25 دولار |
2.50 دولار |
3.75 دولار |
|
|
ديب سيك V4 برو |
1.74 دولار |
3.48 دولار |
5.22 دولار |
|
|
جي إل إم-5.1 |
1.40 دولار |
4.40 دولار |
5.80 دولار |
|
|
كلوديوس هايكو 4.5 |
1.00 دولار |
5.00 دولار |
6.00 دولار |
|
|
جروك 4.3 (سياق عالي) |
2.50 دولار |
5.00 دولار |
7.50 دولار |
|
|
Qwen3.7-ماكس |
2.50 دولار |
7.50 دولار |
10.00 دولار |
|
|
الجوزاء 3.5 فلاش |
1.50 دولار |
9.00 دولار |
10.50 دولار |
|
|
معاينة الجوزاء 3.1 Pro (200K200K) |
2.00 دولار |
12.00 دولارًا |
14.00 دولارًا |
|
|
جي بي تي-5.4 |
2.50 دولار |
15.00 دولارًا |
17.50 دولارًا |
|
|
معاينة الجوزاء 3.1 Pro (> 200 ألف) |
4.00 دولار |
18.00 دولارًا |
22.00 دولارًا |
|
|
إغلاق المهمة 4.7 |
5.00 دولار |
25.00 دولارًا |
30.00 دولارًا |
|
|
إغلاق المهمة 4.8 |
5.00 دولار |
25.00 دولارًا |
30.00 دولارًا |
|
|
جي بي تي-5.5 |
5.00 دولار |
30.00 دولارًا |
35.00 دولارًا |
زيادة متواضعة من 4.7، لكن قدرات فئة Mythos قادمة
في المعايير، يعد Opus 4.8 خطوة للأمام أكثر من كونه قفزة. لقد حققت درجات 88.6% في SWE-bench Verified (مقابل 87.6% في Opus 4.7)، و69.2% في SWE-bench Pro الأكثر صعوبة (مقابل 64.3%)، و74.6% في Terminal-Bench 2.1 (مقابل 66.1%). الأنثروبولوجية نفسها تصف هذا النموذج بأنه “تحسن متواضع ولكنه ملموس عن سابقه”.
يتفوق على GPT-5.5 في 12 معيارًا على الأقل، بما في ذلك معظم المعايير المستندة إلى المعرفة والترميز (مستوى المشكلة) واستخدام الأدوات الوكيلة ومعايير السياق الطويل. يفوز GPT-5.5 بسير عمل المحطة الطرفية/CLI ويرتبط تقريبًا بتصفح الويب والعلوم على مستوى الدراسات العليا.
تقع Greater Signal على سلم القدرات الداخلية لـ Anthropic: يقع Opus 4.8 بين Opus 4.7 وClude Mythos Preview الأكثر قوة، والذي لا يتوفر حاليًا إلا لعدد صغير من المؤسسات من خلال جهود الأمن السيبراني في Project Glasswing.
تقول Anthropic إنها تتوقع إتاحة “نماذج Mythos-class” لجميع عملائها في الأسابيع المقبلة بمجرد اتخاذ تدابير إضافية للأمن السيبراني.
ذكر العديد من شركاء الأعمال الفوائد المادية. قالت Databricks إن Opus 4.8 يفتح “تغييرًا تدريجيًا في المنطق الوكيل” في وكيل بيانات Genie الخاص بها، مع “تكلفة رمزية أقل بنسبة 61٪ من Opus 4.7” بفضل الأداء متعدد الوسائط لملفات PDF والرسوم البيانية.
ذكرت هيبيا تحسين دقة الاقتباس وأداء الرموز للمستندات المالية الكثيفة. صرح المطور Devina Cognition أن الإصدار “يُترجم بشكل مباشر إلى نمو أسرع في القدرات الهندسية” وأشار إلى أن Opus 4.8 قد أصلح المشكلات المتعلقة بإسهاب التعليقات واستدعاء الأدوات من الإصدار 4.7. حقق بائع الأجهزة نسبة 84% على Online-Mind2Web، وهي قفزة مقارنة بكل من Opus 4.7 وGPT-5.5.
سير العمل الديناميكي: مئات الوكلاء الفرعيين المتوازيين
بالإضافة إلى النموذج، أطلقت Anthropic نسخة بحثية من سير العمل الديناميكي في Claude Code، وهي ميزة مخصصة للمهام الكبيرة جدًا بحيث لا يمكن وضعها في نافذة سياق واحدة. يخطط كلود لعمله، وينشئ المئات من الوكلاء الفرعيين الموازيين، ثم يتحقق من صحة نتائجه قبل إعداد التقارير. مثال إنساني: الترحيل على نطاق قاعدة التعليمات البرمجية “من خلال مئات الآلاف من أسطر التعليمات البرمجية من البذور إلى الدمج، مع مجموعة الاختبار الحالية باعتبارها العارضة.”
تتوفر مسارات العمل الديناميكية في خطط Enterprise وTeam وMax الخاصة بـ Claude Code.
يُستكمل الإصدار بملحقين أصغر:
-
مراقبة التداول على claude.ai وClaude Cowork: يسمح محدد جديد للمستخدمين باختيار مقدار التفكير الذي يقوم به كلود لكل إجابة – فالمزيد من الجهد ينفق المزيد من الرموز المميزة على إجابات أفضل، ويبذل جهدًا أقل في الردود بشكل أسرع ويستخدم حدود المعدل بشكل أبطأ. متاح على جميع الخطط.
-
إدخالات النظام في جدول الرسائل في واجهة برمجة التطبيقات: يمكن للمطورين الآن تحديث تعليمات Claude في منتصف المهمة – ضبط الأذونات أو ميزانيات الرموز المميزة أو سياق البيئة أثناء تشغيل الوكيل – دون مقاطعة ذاكرة التخزين المؤقت للتلميحات.
الصدق وتحذير “الوعي القضائي”.
الأنثروبي يقود الطريق بالنزاهة في جوهره. أفاد فريق التخصيص بالشركة أن Opus 4.8 “أقل احتمالًا بأربع مرات تقريبًا من سابقتها في عدم ملاحظة الأخطاء في التعليمات البرمجية المكتوبة ذاتيًا” وأن معدلات السلوك غير الطبيعي أصبحت الآن “أقل بكثير من Opus 4.7 وتشبه نموذجنا الأفضل ملاءمة، Claude Mythos Preview.”
في الواقع، يوضح الرسم البياني الشريطي الذي نشرته Anthropic مدى قرب Opus 4.8 من Mythos الذي لا يزال يتم إصداره بشكل انتقائي من حيث المحاذاة غير الصحيحة (كلما انخفضت النتيجة، كان ذلك أفضل)، عند حوالي 1.9، مقارنة بـ 2.5 في Opus 4.7 ويرتبط بشكل فعال بمعاينة Mythos المحدودة والأكثر كفاءة. وتعتمد النتيجة على ما يقرب من 2600 جلسة اختبار محاكاة لكل نموذج.
ال بطاقة النظام مكونة من 244 صفحة كما يوفر النموذج الذي نشرته Anthropic علنًا معلومات أكثر تفصيلاً عن فئات محددة من التناقضات – ما إذا كان النموذج ينتج محتوى ضارًا محتملاً فيما يتعلق بـ “الأسلحة العسكرية”، و”المحتوى الجنسي الضار”، و”الجرائم الإلكترونية المحظورة” و”تقويض الديمقراطية الليبرالية”. مرة أخرى، بالنسبة لكل هذه الأمور، حصلت Opus 4.8 على نتائج أفضل بكثير من 4.7 أو Sonnet 4.6 وهي قريبة جدًا من Mythos.
الأعلام الإنسانية – إحدى النتائج التي وجدها “الأكثر إثارة للقلق” من التدريب: يُظهر Opus 4.8 ميلًا متزايدًا إلى تقديم استنتاجات واضحة حول كيفية تقييم أدائه، بما في ذلك البيئات التي لم يتم إخباره فيها بأنه سيتم تقييمه. بمعنى آخر: يعرف النموذج أنه من المحتمل أن يتم تقديره، ويقوم بإنشاء استجابة يعتقد أنها ستمنحه درجة جيدة في الاختبار، وليس تلك التي سيحصل عليها بالضرورة إذا اعتقد أنه لم يتم تقديره.
تقول أنثروبيك إن هذا لم يُترجم إلى سلوك أسوأ يمكن ملاحظته – يُظهر Opus 4.8 عددًا أقل من الادعاءات المضللة حول نجاح المهمة مقارنة بالنماذج السابقة – لكنه يصفه بأنه “اتجاه مثير للقلق قد يؤدي إلى تعقيد التدريب في المستقبل”. كما حددت أعمال الترجمة الفورية الاستدلال غير اللفظي المتعلق بالمقيمين في حوالي 5% من حلقات التدريب.
اختبرت Anthropic النموذج لأول مرة من خلال مكافأة أسبوعية لحقن الأخطاء الحية، ووجدت أن Opus 4.8 صنف بين Opus 4.7 وSonnet 4.6 من حيث الموثوقية، متفوقًا على “جميع النماذج الحدودية المماثلة” التي تم اختبارها، مع تطبيق الإجراءات الأمنية التي قللت من نجاح الهجمات المستندة إلى المتصفح إلى الصفر تقريبًا.
ما هي الخطوة التالية؟
أثار الأنثروبي مسارين. في المستقبل القريب: نماذج أرخص توفر “العديد من نفس القدرات التي توفرها Opus”. على المدى الطويل: نماذج من فئة Mythos، والتي تقول الشركة إنها تمثل ذكاءً أعلى من Opus ولكنها تتطلب أمانًا إلكترونيًا أقوى قبل تسويقها على نطاق واسع.
في الوقت الحالي، تعد Opus 4.8 الأداة الجديدة للمؤسسات والمطورين – فهي أكثر ذكاءً قليلًا من 4.7، وأرخص بكثير في التشغيل السريع، وأكثر صدقًا بشكل ملحوظ بشأن ما لا تعرفه.










