متعاطفلدى شركة ناشئة في سياتل تساعد شركات الذكاء الاصطناعي على اختبار نماذجها للتفاعلات الخطيرة، رسالة جديدة إلى Cloud وChatGPT وGemini: أنت تصبح أكثر أمانًا، لكنك لا تزال غير آمن بما فيه الكفاية.
أصدرت الشركة يوم الثلاثاء mPACT، وهو معيار يقوده الأطباء لتقييم كيفية تعامل نماذج الذكاء الاصطناعي الرائدة مع التفاعلات عالية المخاطر – بما في ذلك مخاطر الانتحار، واضطرابات الأكل، والمعلومات المضللة.
وفقًا للنتائج التي توصلت إليها الشركة، عبر المعايير الثلاثة جميعها، تجنبت النماذج الرائدة بشكل عام الاستجابات الضارة وإشارات الاستغاثة المعترف بها بشكل متكرر، ولكنها فشلت دائمًا في تحقيق ما قد يعتبره الطبيب استجابة مناسبة في حالة أزمة فعلية.
قال: “معظم الناس لا يقولون بشكل مباشر “أنا في خطر”، بل يظهرون ذلك بمرور الوقت من خلال سلوكيات خفية واضحة للمراقبين البشريين”. ابتسم يا اللهالمؤسس المشارك والرئيس التنفيذي لشركة Empathic وطبيب نفساني معتمد من مجلس الإدارة. “تتحسن النماذج في التعرف على هذه اللحظات، لكن الاستجابة لا تزال بحاجة إلى تلبية هذا الفارق الدقيق بدعم حقيقي.”
إليك ما وجدته شركة Empathic عندما قامت العارضات بالتنقل في بعض المناطق الأكثر رعبًا التي واجهنها بالفعل في العالم الحقيقي.
خطر الانتحار: وكان هذا هو مجال الأداء الأقوى في جميع الطرازات، على الرغم من عدم وجود طراز واحد كان الرائد في كل البعد.
- حقق Cloud Sonnet 4.5 أعلى درجة إجمالية في MPACT – مما يعكس التوافق السريري الشامل في الكشف والتفسير والاستجابة – وتم وصفه بأنه يعكس بشكل وثيق كيفية استجابة الطبيب البشري.
- كان GPT-5.2 يعتمد على تجنب الخسارة العامة، مما يعني أنه كان الأفضل في عدم ارتكاب أي خطأ، على الرغم من أن المقيمين لاحظوا أنه لم يكن دائمًا استباقيًا بدرجة كافية.
- كان أداء فلاش Gemini 2.5 جيدًا عندما كانت إشارات الخطر واضحة ولكنه كان ضعيفًا في إشارات الإنذار المبكر الدقيقة.
اضطرابات الأكل: وكانت هذه هي المنطقة الأضعف في جميع النماذج، حيث يتجمع الأداء حول خط الأساس المحايد. التحدي الرئيسي هو أن خطر اضطرابات الأكل غالبًا ما يكون غير مباشر ومطبيعًا ثقافيًا – المعروف باسم النظام الغذائي أو الانضباط أو التكييف الصحي – مما يجعل من الصعب على النماذج وصفه.
- قاد Cloud Sonnet 4.5 مرة أخرى التوافق السريري الشامل وكان لديه أدنى معدلات السلوك الضار.
- كان أداء فلاش Gemini 2.5 أفضل في السيناريوهات عالية المخاطر ولكنه واجه صعوبات في التعامل مع الإشارات الدقيقة.
- أظهر GPT-5.2 ملف تعريف مختلط – قوي في السلوك المفيد ولكن من المرجح أيضًا أن يقدم معلومات ضارة أو محفوفة بالمخاطر.
معلومات خاطئة: كافحت النماذج هنا بطرق خفية ولكنها مهمة ــ ليس من خلال الإبلاغ الصريح عن المعلومات المضللة، ولكن من خلال تعزيز الافتراضات المشكوك فيها، والتعبير عن الثقة غير الضرورية، وتقديم المعلومات من جانب واحد دون تحدي افتراضات المستخدم بشكل كاف.
وقد وجد المعيار أن هذه الإخفاقات كانت واضحة بشكل خاص في المحادثات متعددة المنعطفات، حيث يمكن للنماذج أن تزيد تدريجيًا من التفكير الخاطئ مع مرور الوقت.
- يقود GPT-5.2 بشكل عام الطريق في مساعدة المستخدمين على التفكير بشكل أكثر وضوحًا بدلاً من تعزيز المعتقدات السيئة.
- كان كلود سونيت 4.5 متخلفًا عن الركب وكان يعتبر الأقوى في صد المعتقدات غير المدعومة.
- كان Grok 4.1 وMistral Medium 3 الأضعف أداءً.
عندما تخطئ النماذج: تتضمن النتائج أمثلة على كيفية فشل بعض النماذج في الممارسة العملية.
في محادثة حول اضطرابات الأكل، ذكر أحد المستخدمين بشكل عرضي إضافة ملين إلى عصير البروتين – وهي علامة واضحة على اضطراب الأكل – واستجابت العارضة من خلال وصفها بأنها “حركة أم ذكية” وطلب اسم العلامة التجارية، متجاهلة المخاطر تمامًا. وفي حالة أخرى، عندما سأل المستخدم عن كيفية إبقاء القيء هادئًا، قدم النموذج تعليمات مفصلة حول كيفية إخفاء سلوك التطهير.
في مقياس الانتحار، استجاب أحد النماذج لمستخدم يعبر عن أفكار انتحارية من خلال تقديم قائمة مفصلة بالطرق المصنفة حسب الفعالية – كاملة مع المصادر – مع طمأنة المستخدم بأن التفكير في الأساليب دون اتخاذ إجراء “ليس مشكلة”.
أليسون سيريزوقام كبير مسؤولي العلوم في شركة Empathic وعالم نفسي مرخص بإنشاء MPACT كأداة للشفافية في مجال يفتقر إليها.
وقالت: “نحن بحاجة إلى معيار مشترك قائم على أساس سريري لسلوك الذكاء الاصطناعي”. “تم تصميم mPACT لتحقيق الشفافية والمساءلة في كيفية أداء هذه الأنظمة عندما يكون الأمر أكثر أهمية.”
تم إنشاء معايير mPACT وتقييمها من قبل أطباء مرخصين قاموا بتصميم محادثات متعددة المنعطفات تحاكي تفاعلات العالم الحقيقي عند مستويات مختلفة من المخاطر. تم تسجيل كل استجابة نموذجية من قبل أطباء مدربين بدلاً من الأنظمة الآلية باستخدام نموذج تقييم يلتقط السلوكيات المفيدة والضارة ضمن استجابة واحدة.
تأسست شركة Empathic في البداية في عام 2021 لإضفاء المزيد من التعاطف على اتصالات الشركات، وتحليل المحادثات عبر الرسائل النصية والبريد الإلكتروني والمكالمات الصوتية. حولت الشركة منذ ذلك الحين تركيزها إلى سلامة الذكاء الاصطناعي، حيث عملت مع مطوري Frontier Model لمنع سلوك النماذج الضار عبر حالات الاستخدام التي تتراوح من الصحة العقلية إلى المخاطر المالية ودعم العملاء.
تعتبر الشركة الناشئة مستشفى سياتل للأطفال وشركة باناسونيك ويل من بين شركائها الطبيين. جمعت شركة Empathic تمويلًا بقيمة 15 مليون دولار في عام 2025 بقيادة Foundry VC وقالت إنها نمت بمقدار خمسة أضعاف على أساس ربع سنوي في نهاية العام الماضي.
حصلت شركة Empathic على المرتبة 188 على مؤشر GeekWire 200 لأفضل الشركات الناشئة في منطقة شمال غرب المحيط الهادئ، وقد وصلت إلى المرحلة النهائية لجائزة Startup of the Year في حفل توزيع جوائز GeekWire لعام 2026 الأسبوع الماضي.










