لكي تتمكن أنظمة الذكاء الاصطناعي من التحسين المستمر في العمل المعرفي، فإنها تحتاج إما إلى آلية قوية ومستقلة للتحسين الذاتي أو مقيمين بشريين يمكنهم اكتشاف الأخطاء وتقديم تعليقات عالية الجودة. قامت الصناعة باستثمارات ضخمة في السابق. لا يوجد أي تفكير تقريبًا على الإطلاق فيما يحدث في كل ثانية.
أنا أزعم أننا يجب أن نتعامل مع مشكلة المراجعة البشرية بنفس الدقة والاستثمار الذي نتعامل به في بناء القدرات النموذجية نفسها. توظيف الخريجين الجدد في شركات التكنولوجيا الكبرى إلى النصف منذ عام 2019. مراجعة المستندات، والفحص الأول، وتنقية البيانات، ومراجعة التعليمات البرمجية: يمكن للنماذج التعامل معها الآن. الاقتصاديون الذين يتتبعون هذه الظاهرة يطلقون عليها اسم التحول. الشركات التي تفعل ذلك تسميها الكفاءة. ولا يركز أي منهم على مشكلة المستقبل.
لماذا التحسين الذاتي له حدود عند العمل بالمعرفة
الرفض الواضح هو التعلم المعزز (RL). تعلم AlphaZero لعبة Go والشطرنج وShogi على مستوى فوق طاقة البشر دون تدخل بشري، مما أدى إلى إنشاء استراتيجيات مبتكرة في هذه العملية. الحركة 37 في مباراة 2016 ضد لي سيدول، وهي الحركة التي ادعى المحترفون أنهم لن يلعبوها أبدًا، لم تنشأ من الشرح البشري. تم إنشاؤه نتيجة لعب الذكاء الاصطناعي بشكل مستقل.
وهذا يسمح بالاستقرار البيئي. الحركة 37 هي حركة جديدة في مساحة الحالة الثابتة لـ Go. اللوائح كاملة ولا لبس فيها ودائمة. والأهم من ذلك، أن إشارة المكافأة مثالية: الفوز أو الخسارة، وهي فورية، دون مجال للتفسير. يعرف النظام دائمًا ما إذا كانت الحركة جيدة أم لا، لأن المباراة تنتهي في النهاية بنتيجة واضحة.
والعمل المعرفي ليس له أي من هذه الخصائص. القواعد المطبقة على أي مجال مهني هي قواعد ديناميكية ويتم إعادة كتابتها باستمرار من قبل الأشخاص العاملين فيها. يتم إقرار قوانين جديدة. تم اختراع أدوات مالية جديدة. قد تفشل الإستراتيجية القانونية التي نجحت في عام 2022 في ولاية قضائية غيرت تفسيرها منذ ذلك الحين. قد لا يكون من المعروف لسنوات ما إذا كان تشخيص الطبيب صحيحًا. بدون بيئة مستقرة وإشارة مكافأة واضحة، لا يمكن إغلاق الحلقة. لمواصلة تدريس النموذج، تحتاج إلى أشخاص في سلسلة التقييم.
مشكلة التكوين
تم تدريب أنظمة الذكاء الاصطناعي التي يتم إنشاؤها حاليًا بناءً على معرفة الأشخاص الذين خضعوا لهذا التكوين الدقيق. والفرق الآن هو أن المناصب المبتدئة التي تطور مثل هذه المعرفة كانت آلية في البداية. مما يعني أن الجيل القادم من الخبراء المحتملين لا يراكم المعرفة نوع الجملة لذلك، من المفيد وجود مقيم بشري بشكل مستمر.
يعرف التاريخ أمثلة على موت المعرفة. الخرسانة الرومانية . تقنيات البناء القوطية. التقاليد الرياضية التي استغرقت قرونًا لإعادة بنائها. لكن في كل حالة تاريخية كان السبب خارجيًا: الطاعون، والغزو، وانهيار المؤسسات التي استضافت المعرفة. والفرق هو أنه لا حاجة لقوة خارجية. فالحقول من الممكن أن تختفي ليس بسبب كارثة، بل بسبب الآلاف من القرارات الاقتصادية العقلانية الفردية، والتي يصبح كل منها منطقياً بمعزل عن غيره. هذه آلية جديدة وليس لدينا الكثير من التدريب على التعرف عليها عند حدوثها.
عندما تكون الحقول بأكملها صامتة
ضمن المنطق، هذه ليست مجرد مشكلة في خطوط الأنابيب. وهذا انهيار في الطلب على الخبرة نفسها.
النظر في الرياضيات المتقدمة. ولا يختفي لأننا توقفنا عن تدريب علماء الرياضيات. فهو يختفي لأن المؤسسات لم تعد بحاجة إلى علماء رياضيات في عملها اليومي، ويختفي الحافز الاقتصادي ليصبحوا علماء رياضيات، ويتراجع عدد الأشخاص الذين يمكنهم استخدام الاستدلال الرياضي الرائد، وتختفي قدرة هذا المجال على توليد رؤى جديدة بهدوء. وينطبق نفس المنطق على الترميز. سؤالنا ليس “هل سيكتب الذكاء الاصطناعي الكود” ولكن “إذا كتب الذكاء الاصطناعي كل كود الإنتاج، فمن الذي سيطور الحدس المعماري العميق الذي يسمح بتصميمات نظام مبتكرة حقًا؟”
هناك فرق جوهري بين المجال الآلي والمجال المفهوم. اليوم، يمكننا أتمتة قدر كبير من الهندسة الإنشائية، ولكن المعرفة المجردة حول أسباب نجاح بعض الأساليب لا تزال موجودة في أذهان الأشخاص الذين ارتكبوا أخطاء لأول مرة لسنوات. إذا قمت بإلغاء ممارسة ما، فلن تفقد الممارسين فقط. تفقد القدرة على معرفة ما فقدته.
الرياضيات المتقدمة، وعلوم الكمبيوتر النظرية، والتفكير القانوني العميق، وهندسة الأنظمة المعقدة: عندما يتقاعد آخر شخص لديه فهم عميق لبعض مجالات الجبر ولا يحل محله أحد بسبب جفاف الأموال واختفاء المسار الوظيفي، فمن غير المرجح إعادة اكتشاف هذه المعرفة في أي وقت قريب.
لقد ذهب. ولا أحد يلاحظ ذلك لأن النماذج التي تم تدريبها على أداء وظيفتها تستمر في الأداء الجيد في المعايير لعقد آخر. أرى هذا بمثابة تفريغ: إذ تظل القدرات السطحية قائمة (لا تزال النماذج قادرة على إنتاج نتائج تبدو وكأنها خبيرة)، في حين تختفي القدرة البشرية الأساسية على التحقق من تلك المعرفة أو توسيعها أو تصحيحها بهدوء.
لماذا لا يتم استبدال نماذج التقييم بالكامل
يعتمد النهج الحالي على التقييم النموذجي. يعد الذكاء الاصطناعي الدستوري، والتعلم المعزز من ردود فعل الذكاء الاصطناعي (RLAIF)، والمعايير المنظمة التي تمكن النماذج من تقييم النماذج من التقنيات القوية التي تقلل بشكل كبير من الاعتماد على المقيمين البشريين. أنا لا أرفضهم.
حدودهم هي كما يلي: يمكن لقاعدة التقييم أن تلتقط فقط ما يستطيع الشخص الذي كتبه قياسه. قم بتحسين ذلك وسينتهي بك الأمر بنموذج يلبي متطلبات نموذج التقييم هذا بشكل جيد للغاية. هذا ليس هو نفس النموذج المناسب بالفعل.
تقيس قواعد التقييم الجزء الواضح والصريح من الحكم. أما الجزء الأعمق، ألا وهو الغريزة، والشعور بوجود خطأ ما، فلا يتناسب مع هذا المعيار. لا يمكنك كتابتها لأنه عليك تجربتها أولاً قبل أن تعرف ما تكتبه.
ماذا يعني هذا في الممارسة العملية؟
وهذه ليست حجة لإبطاء التنمية. الزيادة في الفرص حقيقية. من الممكن أن يجد الباحثون طريقة لإغلاق حلقة التقييم دون الحكم البشري. ربما تثبت خطوط أنابيب البيانات الاصطناعية أنها جيدة بما فيه الكفاية. وربما تعمل النماذج على تطوير آليات تصحيح ذاتي موثوقة لا يمكننا أن نتخيلها بعد.
ولكن اليوم ليس لدينا لهم. وفي الوقت نفسه، نعمل على تفكيك البنية التحتية البشرية التي تسد الفجوة حاليا، ليس كقرار متعمد، بل كنتيجة ثانوية لآلاف من القرارات العقلانية. إن النسخة المسؤولة من هذا التحول لا تفترض أن المشكلة سوف تحل نفسها. ويهدف هذا إلى التعامل مع فجوة التقييم باعتبارها مشكلة بحثية مفتوحة بنفس درجة إلحاح بناء القدرات.
إن أكثر ما يحتاجه الذكاء الاصطناعي من البشر هو الشيء الذي لا نركز على الحفاظ عليه. وسواء كانت هذه حقيقة دائمة أو مؤقتة، فإن تكلفة تجاهلها واحدة.
أحمد الدحلة هو المدير التنفيذي للتكنولوجيا في Airbnb.
مرحبًا بك في مجتمع VentureBeat!
في برنامج نشر الضيوف الخاص بنا، يشارك خبراء التكنولوجيا الأفكار ويقدمون معلومات محايدة ومتعمقة حول الذكاء الاصطناعي والبنية التحتية للبيانات والأمن السيبراني وغيرها من التقنيات المتطورة التي تشكل مستقبل المؤسسات.
اقرأ المزيد من برنامج نشر الضيوف لدينا – وتحقق من موقعنا المبادئ التوجيهية إذا كنت مهتمًا بالمساهمة في مقالتك الخاصة!












