مع انتقال وكلاء الذكاء الاصطناعي للمؤسسات إلى الإنتاج، تواجه المؤسسات مشكلة موثوقية متزايدة. تكتشف العديد من الفرق أن أداء LLM وحده لا يحدد نجاح الوكلاء في الإنتاج. يجب أن تنجو مسارات عمل الذكاء الاصطناعي طويلة الأمد من حالات الفشل، وتحافظ على الحالة، وتتعافى من حالات الفشل، وتدير تكاليف الاستدلال، وتنسيق واجهات برمجة التطبيقات، والأدوات، وأنظمة المؤسسة.
بعد أن ركزت الموجة الأولى على النشر السريع، تحتاج المؤسسات الآن إلى إعادة النظر في عمليات نشر الجيل الأول وإعادة تصميم بنيات الوكيل المبكرة حول تنسيق سير العمل وإمكانية المراقبة والإدارة والتعافي، كما قال بريتي سومال، نائب الرئيس الأول للهندسة في Temporal Technologies، في أحدث حدث لسلسلة AI Impact في نيويورك.
وقال الصومال: “لدينا الكثير من العملاء الذين يأتون إلينا عندما يقومون ببناء الإصدار 2.0 من نفس الوكيل”. “كان عليهم أن يتحركوا بسرعة كبيرة، لكنهم لم يعتنوا بالسباكة. كل شيء يتحطم ويحترق، ثم يعودون إلى إعادة البناء على أساس موثوق.”
بالنسبة لشركة تنسيق سير العمل Temporal، التي سبقت بنيتها التحتية الموجة الحالية من الذكاء الاصطناعي القائم على الوكيل، يعكس هذا التغيير تحقيقًا مؤسسيًا أوسع: تتطلب أنظمة الذكاء الاصطناعي للإنتاج التنفيذ المستمر، وإدارة الصحة، والرؤية في سير العمل، وآليات للتعافي من فشل النموذج أو النظام النهائي.
قام Agent AI بشحن المشاكل الهندسية المعروفة
وقال الصومال: “هذه الأنماط ليست بالضرورة جديدة”. “الذكاء الاصطناعي يشحنهم فقط.”
تقدم أنظمة الوكيل تعقيدًا إضافيًا لأنها غالبًا ما تتضمن عمليات طويلة الأمد ومتعددة الخطوات تتضمن خدمات ونماذج وواجهات برمجة التطبيقات والأدوات المتعددة. يمكن لسير عمل واحد استدعاء العديد من نماذج اللغات الكبيرة، والوصول إلى أنظمة البحث، وتشغيل التطبيقات الخارجية، وإدارة الحالة على مدار ساعات أو أيام. وقال الصومال إن المشكلات الهندسية لا تنشأ غالبًا إلا بعد التنفيذ.
وقالت: “سيكتب الناس إلى العملاء، لكنهم لا يفكرون فيما سيحدث إذا سقط العميل”. “هل سيتعين علي إعادة تشغيل تدفق الوكيل بالكامل؟”
بالنسبة للشركات التي تعمل في ظل قيود التكلفة، فإن الإجابة مهمة. يمكن أن تؤدي إعادة تشغيل سير العمل بعد الفشل إلى مضاعفة تكاليف الاستدلال وزيادة زمن الوصول وتقليل تجارب العملاء.
قارن صومال اللحظة الحالية بفترة سابقة من اعتماد السحابة المؤسسية، عندما قفزت المؤسسات مباشرة إلى ترحيل أعباء العمل قبل أن تدرك أنها بحاجة إلى إعادة تصميم البنى الأساسية إذا أرادت أن تستمر أعباء العمل هذه على المدى الطويل.
وقالت: “هذا الاندفاع لإنشاء الذكاء الاصطناعي في عالم لم يتم فيه تحديث التطبيقات حتى يذكرني قليلاً بهذا التحول الذي حدث في السحابة”. “لقد أدرك الجميع أنك تنفق المزيد من الأموال على السحابة ولا نحصل على أي قيمة هناك.”
لماذا يفرض الوكلاء على المدى الطويل بنية جديدة
يتضمن سير العمل في المؤسسة بشكل متزايد وكلاء يقومون بمهام عبر نوافذ طويلة، تدوم أحيانًا لساعات، أثناء التفاعل مع الأدوات والأنظمة. تتفاقم تحديات الموثوقية عندما يستمر سير العمل لفترات طويلة من الزمن، مما يؤثر على كل من الحالة والذاكرة – وهما مفهومان غالبًا ما يتم التعامل معهما بالتبادل في محادثات الذكاء الاصطناعي.
تشير الحالة إلى تنفيذ سير العمل. يتضمن ذلك مكان وجود الوكيل في العملية، والأنشطة التي تم إكمالها بالفعل، والمكان الذي يجب استئناف التعافي من الكوارث فيه. تلتقط الذاكرة أو السياق المعلومات التي يحملها الوكيل كجزء من التفاعلات أو المهام.
وأوضح الصومال أن “حالة الوكيل تعتمد على الخطوة والإجراءات التي تم تنفيذها، وإذا تعطل شيء ما، فمن أين تريد استرداد البيانات، اعتمادًا على السياق وقطعة الذاكرة”.
يصبح هذا التمييز ذا أهمية متزايدة عندما تبدأ المؤسسات في تجاوز تفاعلات chatbot البسيطة نحو العمليات التجارية طويلة المدى. وأشار الصومال إلى مثال الرعاية الصحية مع العميل Abridge، حيث يقوم سير العمل بمعالجة الزيارات الطبية في مراحل متعددة، بما في ذلك معالجة الصوت واستخلاص المعلومات والمكالمات النموذجية وتوليد المعلومات بعد الزيارة.
وقال الصومال: “لا يوجد عنصر واحد فقط في هذا التدفق”. “تسجيل مقاطع الفيديو وتقطيعها إلى أجزاء، وعمل الملخصات، والاتصال بـ LLM، وإنشاء ملخص ما بعد الزيارة – كل هذا منظم.”
بالنسبة للمؤسسات، يعني هذا أن الوكلاء الفعالين يعتمدون بشكل متزايد على الأنظمة التي يمكنها التغلب على الانقطاعات، وتنسيق الخدمات والحفاظ على الاستمرارية مع مرور الوقت.
ظهور العمود الفقري الحتمي
وقال الصومال إن الإطار المفيد لتصميم الذكاء الاصطناعي المؤسسي هو العمود الفقري الحتمي، الذي يحدد كيفية تفكيرهم في دور Temporal.
قالت: “إنه يدل على المسار الذي تريد اتباعه”. “إنه يتصل بالدماغ، ولكن إذا لم يستجب الدماغ، فإنه يعيد الاتصال به. وإذا استجاب الدماغ ولكن فشلت الخطوة التالية، فسوف يعود إلى المكان الذي حدث فيه الفشل.”
من وجهة النظر هذه، يعمل نموذج اللغة كنظام احتمالي ينتج نتائج متغيرة، بينما يحافظ برنامج التنسيق على موثوقية التنفيذ حوله. وهذا المفهوم مهم لأن أنظمة المؤسسة تتطلب بشكل متزايد الاتساق حتى مع بقاء النماذج غير حتمية. لا يمكن أن يفشل سير عمل الشراء أو ملخص الرعاية الصحية أو تصعيد خدمة العملاء أو عملية الامتثال ببساطة بسبب انتهاء مهلة استدعاء النموذج أو فشل التبعية الخارجية.
وقال الصومال: “أكثر ما تريده هو أن تكون قادراً على التعافي وألا تضطر إلى دفع ضريبة رمزية إذا حدث خطأ ما”.
الموثوقية والرؤية والفعالية من حيث التكلفة للإنفاق الرمزي
بينما يقوم قادة المؤسسات بتقييم العائد على الاستثمار في الذكاء الاصطناعي، أصبحت رؤية التكلفة مصدر قلق متزايد. غالبًا ما يقوم الوكلاء الذين يعملون لفترة طويلة بإجراء استدعاءات نموذجية متعددة في مسارات عمل معقدة، مما قد يؤدي إلى إنشاء أنماط إنفاق مبهمة. ووصف الصومال إحدى الفوائد التشغيلية للتنسيق بأنها رؤية الأماكن التي تتراكم فيها التكاليف. نظرًا لأنه يمكن ملاحظة سير العمل خطوة بخطوة، يمكن للفرق معرفة مكان استخدام الرموز المميزة في عملية الوكيل.
قالت: “لديك رؤية لكل هذا التدفق في جزء واحد”. “يمكنك الآن معرفة أين تنفق الرموز المميزة في وكيل لديه العديد من الخطوات ويستدعي العديد من الأنظمة المختلفة.”
تؤدي استعادة سير العمل أيضًا إلى زيادة كفاءة التكلفة. بدون التنسيق المستمر، يمكن أن يؤدي الفشل في المرحلة المتأخرة إلى إجبار المؤسسات على إعادة تشغيل العملية بأكملها من البداية، بما في ذلك جميع استدعاءات النماذج السابقة. وقال الصومال إن الأنظمة المصممة مع وضع استعادة البيانات في الاعتبار يمكنها استئناف التنفيذ من نقطة التوقف.
قالت: “أنت تلتقط من المكان الذي وقع فيه الحادث”. “نحن نوفر تكلفة إعادة تشغيل الوكيل من الخطوة الأولى.”
يجب على الشركات بناء مسارات محددة واكتساب المعرفة من الشركاء
هناك نمط ناشئ آخر مع ظهور الذكاء الاصطناعي القائم على الوكيل وهو المخاوف المتعلقة بالحوكمة. وبدلاً من طرح أنظمة الوكلاء المُدارة بالكامل بالجملة، قال الصومال إن الشركات تريد بشكل متزايد هياكل داخلية موحدة توفر حواجز الحماية مع الحفاظ على المرونة وتنفيذ الميزات الضرورية مثل الضوابط الإدارية وسياسات اختيار النماذج وأنظمة الهوية وإدارة التكلفة وإمكانية المراقبة.
وقالت: “تتطلع الشركات إلى بناء هذه المسارات المعبدة”. “قد لا ينجح إخراج شيء ما من الرف، نظرًا لوجود كل هذه المتطلبات الأخرى.”
مع عودة المؤسسات إلى عمليات نشر الجيل الأول، أصبحت هذه الأنواع من التحديات على نحو متزايد بمثابة مشكلة نمذجة أكثر من كونها مشكلة هندسة أنظمة، ويمكن أن يساعد برنامج Temporal المؤسسات على اتخاذ الخطوة التالية، ويرجع ذلك جزئيًا إلى أنه بالنسبة للعديد من المؤسسات كان موجودًا بالفعل كجزء من برامج التحديث الأوسع قبل أن يصبح الذكاء الاصطناعي أولوية استراتيجية.
قال الصومال: “المؤقت موجود بالفعل في المؤسسة”. “إن تطبيق هذا وتوسيع نطاقه ليشمل الذكاء الاصطناعي ومنصات الوكلاء يبدو أمرًا طبيعيًا للغاية.”










