Microsoft 365 Copilot ونهاية عصر النموذج الفردي في الذكاء الاصطناعي للمؤسسات

ستيف جوستافسون، نائب رئيس شركة مايكروسوفت للتصميم والأبحاث. (صورة مايكروسوفت)

(ملاحظة المحرر: Agents of Transformation عبارة عن سلسلة مستقلة من GeekWire، كتبتها شركة Accenture، وتستكشف اعتماد وتأثير الذكاء الاصطناعي والوكلاء. راجع تغطية البرامج ذات الصلة.)

لا يزال استخدام نماذج الذكاء الاصطناعي مصحوبًا بعلامة النجمة غير المعلنة: تحقق قبل التصرف. حقيقة التحقق من ذلك. جوجل ذلك. اسأل زميل العمل. وفي نهاية المطاف، يقع عبء الدقة دائمًا على عاتق الإنسان. لكن مايكروسوفت تعتقد أن لديها طريقة لإزالة هذا العبء – دع اثنين من أنظمة الذكاء الاصطناعي يراقبان بعضهما البعض.

في عصر يتولى فيه عملاء الذكاء الاصطناعي مهام القوى العاملة بشكل متزايد، تمتد هذه الاستراتيجية متعددة النماذج الآن إلى ما افترض العمال البشريون أنه مهمتهم وحدهم: دعوة الحكم. لقد كان وجود الإنسان في الحلقة أمرًا غير قابل للتفاوض لفترة طويلة في سير عمل الذكاء الاصطناعي. إن النهج الذي تتبناه ميكروسوفت لا يلغي هذا الأمر، ولكنه يثير التساؤل حول حجم الدور الذي نرغب في التنازل عنه.

“رأسان أفضل من رأس واحد”

مايكروسوفت ليست وحدها في هذا الرهان. تعمل أمازون ويب سيرفيسز وجوجل وآخرون على إنشاء منصات تتيح للمؤسسات الوصول إلى نماذج متعددة من خلال واجهة واحدة.

توفر AWS Bedrock إمكانية الوصول إلى النماذج الأساسية من موفري خدمات متعددين، في حين توفر خدمة Gemini من Google بابًا أماميًا واحدًا للذكاء الاصطناعي في مكان عمل المؤسسة. ما يميز Microsoft هو أنها تقوم بدمج مراجعة النماذج المتعددة مباشرةً في أداة إنتاجية يستخدمها ملايين العمال.

لقد شهدنا التنفيذ الأول لهذه الخطة الأسبوع الماضي من خلال الترقية الجديدة إلى Microsoft 365 Copilot. يمكن لوكيل الأبحاث الخاص بها الآن استخدام GPT الخاص بـ OpenAI لصياغة الرد، ثم مراجعته بواسطة سحابة Anthropic للتأكد من دقته واكتماله وجودة الاقتباس قبل الانتهاء منه.

“إننا نسعى عمدا إلى تنوع الآراء” ستيف جوستافسونصرح نائب رئيس شركة Microsoft للتصميم والأبحاث لـ GeekWire في مقابلة. “عندما يجتمع الرأسان يكونان أفضل من رأس واحد.”

هذا ليس مصدر قلق بسيط. وقد أظهرت الأبحاث هذا بالفعل يستعين مستخدمو الذكاء الاصطناعي بمصادر خارجية للتفكير النقدي النماذج التي يعتبرونها موثوقة. إذا كنا نحكم بالفعل على أحد النماذج، فهل يمكن أن يؤدي الضغط الثاني على النموذج الأول إلى توفير التحقق المفقود؟

هذا هو السؤال الذي واجهته Microsoft أثناء تصميم Critic و Council، وهما ميزتان جديدتان ضمن وكيل الباحث الخاص بها.

قال جوستافسون: “يُظهر بحثنا باستمرار أن الموظفين يريدون ثقة أعمق في الذكاء الاصطناعي والمحتوى عالي الجودة”. “إما أن الناس إما يفرطون في الثقة في الذكاء الاصطناعي – ويطلقون ادعاءات لا ينبغي لهم – أو يقللون من ثقتهم به ولا يحصلون على القيمة الكاملة. هناك فرص في التصميم والتقنية.”

خذ ميزة Microsoft Critic، على سبيل المثال. قال جوستافسون إن مايكروسوفت صممتها عمدًا حول عملية التسليم: تقود GPT الجيل، وتتدخل السحابة كمراجع.

وقال: “إن الفصل مهم لأن التقييم هو طريقة معرفية مختلفة عن الجيل”. “عندما يقوم أحد النماذج بالأمرين معا، تحصل على نفس النقاط العمياء مرتين. وعندما تكون مهمة النموذج الثاني هي التحقق من صحة النموذج الأول، فإنك تحصل على شيء مختلف من الناحية الهيكلية.”

وهذا يخلق “حلقة ردود فعل قوية توفر نتائج عالية الجودة من حيث الدقة الواقعية والتفاصيل التحليلية والعرض التقديمي.” غوراف أناندنائب رئيس شركة مايكروسوفت للهندسة، كتب في منشور مدونة تقني حول الميزات الهامة لـ M365.

النماذج المتعددة ليست مجرد إثبات للمفهوم – فهي حية، وهي بالفعل التجربة الافتراضية داخل الباحث. لكن غوستافسون سارع إلى الإشارة إلى أن معظم الموظفين لن يهتموا بالعارضات التي تعمل تحت الغطاء. ومن وجهة نظره، يجب أن تكون النماذج غير مرئية.

وقال “المستخدم العادي يريد مخرجات غير مسبوقة. ويريد أن يكون قادرا على الاعتماد عليها”. “هل يحتاجون إلى معرفة أنها 5.2 مقابل أي شيء آخر؟ لا أعتقد ذلك.”

يرى جوستافسون أن هذه حالة “أعمى يقود أعمى”، مشددًا على أن ضبط النماذج هو السبيل لتجنب الهلوسة. مع تعليق الباحث، “لقد أثبت Cloud أنه مُركِّب رائع ويوفر نوعًا من التحقق مما تفعله نماذج GPT.”

ومع ذلك، قال جوستافسون إن مايكروسوفت تقوم باستمرار بتقييم أداء النموذج الفردي مقابل النموذج المزدوج، بالإضافة إلى تعيين “قاضي LLM بين الاثنين” لرؤية المفاضلات.

وقال جوستافسون إن مايكروسوفت تخطط للابتعاد عن الترويج لأسماء نماذج محددة والتركيز على ما يحاول العامل تحقيقه. على سبيل المثال، قال، يمكن للموظفين تحديد عملهم في مجال الشؤون المالية، وسيعمل برنامج Copilot على أي نموذج يتعامل بشكل أفضل مع برنامج Excel، وتوليف البيانات وتحليلها – دون الحاجة إلى اختيار النموذج.

المؤسسة منظمة العفو الدولية البندول

بالنسبة لمايكروسوفت، تعد المؤسسات متعددة النماذج أقل راحة من الاتجاه الحتمي للذكاء الاصطناعي. يسميها جوستافسون بالتطور الطبيعي، نظرًا لأن مساعد الطيار بدأ بنفس النموذج.

منذ ذلك الحين، قال إن الصناعة ظلت تتساءل عما يمكن أن تفعله النماذج، وما ينبغي أن تكون عليه تجربة المنتج، وأين يوجد الخندق التنافسي.

وقال “أعتقد أنه مجرد تطور طبيعي”. “نموذجان أفضل من نموذج واحد.”

مع تفوق النماذج على بعضها البعض كل بضعة أشهر، لا تراهن Microsoft على أي نموذج، ولكنها تحاول إنشاء شيء يتفوق عليهم جميعًا.

مع انتقال المؤسسات من تجربة الذكاء الاصطناعي إلى الاعتماد عليه لاتخاذ قرارات مستنيرة، بدأ نهج النموذج الواحد في إظهار حدوده. قد يكون السؤال أقل حول ما إذا كان ينبغي للشركات أن تتبنى نماذج متعددة، بدلا من ما إذا كانت على استعداد لقبول نظام حيث تتم عمليات الفحص الآلية، وتكون النماذج غير مرئية، ويقوم الذكاء الاصطناعي بمراجعة النماذج قبل أن يرى الإنسان المخرجات.

بالإضافة إلى التكامل الأولي في وكيل الباحث، قال جوستافسون إن مايكروسوفت تخطط لتوسيع النهج متعدد النماذج ليشمل أدوات الذكاء الاصطناعي الأخرى. ويأمل أن يصبح هذا النهج معيارًا في جميع أنحاء الصناعة. ومن وجهة نظرهم، فإن بناء مراجعة متعددة الوسائط في سير العمل الفاعل يعد حكمًا جيدًا وتصميمًا جيدًا.

بالنسبة لأولئك الذين يبنون تجارب الوكلاء، فإن نصيحة جوستافسون بسيطة: تعامل مع الوكلاء مثل أي عملية ذات نتائج ذات معنى. السؤال الرئيسي: “من يتحقق من العمل؟”

رابط المصدر