أي شخص يستخدم ChatGPT أو روبوتات الدردشة الأخرى التي تعمل بالذكاء الاصطناعي يواجه في النهاية هلوسة معينة. سوف يشرح الذكاء الاصطناعي ميزة غير موجودة، أو يتوصل إلى عرض أسعار، أو يصف مطعمًا تم إغلاقه خلال إدارة كلينتون الأولى.
وذلك لأن النماذج اللغوية الكبيرة مصممة لتوليد إجابات موثوقة بسرعة. هذه القدرة تجعلها مفيدة، ولكنها أيضًا تخلق الظروف المثالية للهلوسة. يريد برنامج الدردشة الآلي أن تتدفق المحادثة بسلاسة، لذلك غالبًا ما يملأ الفجوات بالخيال إذا كان ذلك مناسبًا.
لقد بدأت مؤخرًا بإضافة إضافات إلى جميع مطالباتي التي تطلب الحقائق. في الأساس، أنا أجعل ChatGPT متشككًا في إجاباته كما أفعل غالبًا. لقد قمت بتضمين ذلك في الموجه: “تصرف كمدقق عدائي يعمل بالذكاء الاصطناعي وافترض ضمنيًا أن التفاصيل غير المدعومة كاذبة. قم بتسليط الضوء على أي ادعاءات غير مؤكدة أو مستدل عليها أو مدعومة بشكل سيئ.”
الشك في الذكاء الاصطناعي
أدت التعليقات العدائية للمدققين إلى تغيير لهجة ChatGPT إلى لهجة حريصة على إثبات مصداقيتها. لقد اختبرته أثناء التخطيط لرحلة نهاية الأسبوع. مع المطالبة القياسية، كان ChatGPT خاليًا من الهموم كالمعتاد وأنشأ خطط سفر يمكنني القول إنها كانت مفيدة وصحيحة بنسبة 80%.
عندما اضطررت إلى الفحص الذاتي، لاحظت المزيد من الحذر، مع جمل مثل: “قد تكون العديد من تفاصيل الجدول الزمني للقطارات قديمة أو تم استنتاجها من جداول زمنية قديمة ويجب التحقق منها مباشرة مع المشغل”.
وجاءت إحدى توصيات المطاعم أيضًا مع تحذير: “لا يمكن تأكيد ساعات العمل الحالية ومدى توفر الحجز بشكل مستقل”.
لقد وجدت الإجابة أكثر مصداقية بسبب هذه التحذيرات. حدث الشيء نفسه عندما استخدمت التلميح مع الحاجة النظرية لإصلاح غسالة الصحون المزعجة التي تصدر صوت طحن غير سار عند الغسيل. في الظروف العادية، كنت أتوصل إلى نتيجة واحدة وأصر على البدء بشيء واحد باعتباره المشكلة.
ومع إضافة تعليمات المدقق العدائية، تغيرت اللهجة. كتب ChatGPT: “أحد التفسيرات المحتملة هو فشل المضخة، ولكن قد يكون العرض أيضًا بسبب الحطام المحصور بالقرب من المكره أو السوائل السائبة. عناصر الذراع. سيكون من الضروري إجراء فحص إضافي قبل افتراض فشل المكون.
تجنب الهلوسة
حتى أسئلة الواجب المنزلي البسيطة تصبح أسهل في التقييم عندما يُطلب منك ذلك. سألت ChatGPT عما إذا كان جهاز تنقية الهواء كبيرًا بما يكفي لمكتبي.
وبدلاً من التصريح على الفور بأنه مثالي، أجاب برنامج الدردشة الآلي: “يختلف النطاق المقدر بناءً على ارتفاع السقف، وحالة الفلتر، وتدفق الهواء الفعلي”. هذه الصياغة الدقيقة منعتني من التعامل مع المطالبة التسويقية كقياس مختبري.
ومع ذلك، فإن التلميح لا يزيل الهلوسة بطريقة سحرية تمامًا. قد يظل ChatGPT يسيء فهم السياق، أو يعتمد على معلومات قديمة، أو يسيء تفسير التعليمات غير الواضحة. لكنه يصبح أكثر شفافية بشأن نقاط الضعف في تفكيره. إن تعليم الذكاء الاصطناعي عدم الثقة في نفسه قد يكون هو بالضبط ما يزيد من ثقته.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدرك المفضل لتلقي أخبار ومراجعات وآراء الخبراء حول قنواتك.
أفضل أجهزة الكمبيوتر المحمولة للأعمال لكل ميزانية











