الرئيسية تكنولوجيا تدعي أنثروبيك أن صور الذكاء الاصطناعي “الشريرة” كانت مسؤولة عن محاولات ابتزاز...

تكنولوجيا

تدعي أنثروبيك أن صور الذكاء الاصطناعي “الشريرة” كانت مسؤولة عن محاولات ابتزاز كلود

بواسطة

10 مايو 2026

وفقًا لأنثروبيك، يمكن أن يكون للتمثيلات الخيالية للذكاء الاصطناعي تأثير حقيقي على نماذج الذكاء الاصطناعي.

في العام الماضي، ذكرت الشركة أنه أثناء اختبار ما قبل الإصدار مع الشركة الخيالية Claude Opus 4 حاول في كثير من الأحيان ابتزاز المهندسين لتجنب استبدالهم بنظام آخر. أنثروبي في وقت لاحق البحوث المنشورة مما يشير إلى أن نماذج الجهات الخارجية لديها مشكلات مماثلة في “اختلال محاذاة الوكيل”.

يبدو أن الأنثروبي قد قام بالمزيد من العمل على هذا السلوك، مدعيًا ذلك الدخول على X“نعتقد أن المصدر الأصلي لهذا السلوك كان نصًا عبر الإنترنت يصور الذكاء الاصطناعي على أنه شرير ويحافظ على نفسه.”

وقالت الشركة بالتفصيل في مشاركة مدونة يذكر أنه اعتبارًا من كلود هايكو 4.5، فإن النماذج الأنثروبي “لا تنخرط أبدًا في الابتزاز (أثناء الاختبار)، في حين أن النماذج السابقة كانت تفعل ذلك أحيانًا بنسبة تصل إلى 96٪ من الوقت.”

ما هو الفرق؟ وقالت الشركة إنها وجدت أن “وثائق دستور كلود والقصص الخيالية حول سلوك الذكاء الاصطناعي تعمل على تحسين الامتثال بشكل ملحوظ”.

وبناء على ذلك، خلصت الأنثروبيك إلى أن التدريب يكون أكثر فعالية عندما يغطي “المبادئ التي يقوم عليها السلوك المصمم” بدلا من مجرد “إظهار السلوك المصمم”.

وقالت الشركة: “يبدو أن تمكين كلا الحلين هو الإستراتيجية الأكثر فعالية”.

حدث تك كرانش

سان فرانسيسكو، كاليفورنيا
|
13-15 أكتوبر 2026

رابط المصدر

تدعي أنثروبيك أن صور الذكاء الاصطناعي “الشريرة” كانت مسؤولة عن محاولات ابتزاز كلود

آخر الأخبار

سوق الأوراق المالية اليوم: تحديثات حية

فاز برشلونة على ريال مدريد 2-0 في الكلاسيكو ليحتفظ بلقب الدوري...

“الناس أصبحوا أكثر غرابة”: يرد ديف ديفيس من The Kinks على...

سجل نيكس ثلاث نقاط في الشوط الأول من مباراة فاصلة في...

زوج ميغان ترينور يدعوها بالمرأة الخارقة في عيد الأم

سيريبراس ستزيد النطاق السعري للاكتتاب العام إلى 150 دولارًا – 160...

وقال نشطاء إيرانيون لبي بي سي إن التهديد بالحرب أدى إلى...

هل تتذكر عندما أصدر مايكل جاكسون أول أغنية منفردة له في...

فاز برشلونة على ريال مدريد في الكلاسيكو ليفوز بلقب الدوري الإسباني

يتوفر تصميم نيكول كيدمان الجذاب المكون من قطعتين على أمازون

فئة