ستنظر قناة تكنولوجيا المعلومات في تأثير أعباء عمل الذكاء الاصطناعي ذات الحوسبة الثقيلة على السحابة في عام 2026.
أصبحت Microsoft هذا الأسبوع أحدث بائع يعاني من انقطاع كبير في الخدمة أثر على العديد من المنتجات والخدمات. وعلى الرغم من أن عملاق التكنولوجيا لم يربط الفشل بأي شيء متعلق بالذكاء الاصطناعي، إلا أن القناة ستراقب الحجم المتزايد والتأثيرات الأعمق على عملائها من هذه الانقطاعات حيث تجهد الشركات للتعامل مع أعباء العمل الأكثر كثافة في الحوسبة.
بما يعكس التأثيرات واسعة النطاق لهذا الانقطاع الأخير من قبل شركة مايكروسوفت التي يقع مقرها في ريدموند بواشنطن – والتي لديها واحدة من أكبر الأنظمة البيئية في القناة مع ما يقرب من 500000 شريك – سجلت DownDetector 12380 تقريرًا عن انقطاع خدمة البريد الإلكتروني Outlook من Microsoft اعتبارًا من الساعة 3:15 مساءً بالتوقيت الشرقي في 22 يناير.
سجل موقع اكتشاف الانقطاعات 15,745 تقريرًا عن انقطاع التطبيقات السحابية لمجموعة Microsoft 365 اعتبارًا من الساعة 3:17 صباحًا بالتوقيت الشرقي و2,246 تقريرًا لمتجر Microsoft اعتبارًا من الساعة 3:29 صباحًا بالتوقيت الشرقي.
(ذات صلة: أكبر 10 انقطاعات سحابية في عام 2025: AWS، وGoogle، وMicrosoft)
انقطاع مايكروسوفت
والآن بعد أن تم حل المشكلة، اتصلت CRN بشركة Microsoft للحصول على تعليق.
ديفيد شتاينر، رئيس US ITec، وهو عضو في CRN’s 2025 MSP 500 ومقره في بوفالو، نيويورك، نسب الفضل إلى استخدام شركته لتطبيق Invarosoft ITSupportPanel للتواصل الفعال مع العملاء أثناء انقطاع الخدمة، مما يجعله “أكثر انقطاع خالي من التوتر شهدناه على الإطلاق”.
وقال ستاينر إنه من الأهمية بمكان أن يتواصل مقدمو الخدمة MSP بشكل استباقي مع العملاء أثناء انقطاع الخدمة. وقال: “في الماضي، كانت هواتفنا تحترق وكانت ساعات مكالماتنا مع تقنيي OnCall تصبح مجنونة لأن الناس كانوا لا يعرفون شيئًا عن انقطاع الخدمة”.
في شهر مايو، قالت المنظمة في تقرير تحليل انقطاع التيار الكهربائي السنوي الصادر عن معهد Uptime إن “الطلب المتزايد على الذكاء الاصطناعي يضغط على تصميمات البنية التحتية الحالية – خاصة فيما يتعلق بالطاقة والتبريد – في حين أن قيود شبكة الطاقة والتوترات التجارية العالمية تخلق حالة جديدة من عدم اليقين في سلاسل التوريد وخطط التوسع”.
مع دخول عصر الذكاء الاصطناعي العام عامه الرابع وخروج المزيد من المشاريع من المرحلة التجريبية للإنتاج، يجب على متخصصي تكنولوجيا المعلومات أن يضعوا في اعتبارهم تأثير ذلك على موثوقية السحابة واستقرارها.
إليك كل ما تحتاج إلى معرفته حول انقطاع Microsoft 365 الذي استمر لأكثر من تسع ساعات هذا الأسبوع.
ضربت العديد من منتجات مايكروسوفت
أثر الانقطاع على العديد من خدمات Microsoft 365، بما في ذلك Outlook وExchange Online والبحث في SharePoint Online وMicrosoft OneDrive وMicrosoft Teams.
أثر الانقطاع أيضًا على الوصول إلى مدخل الخدمة لـ Microsoft Purview وMicrosoft Defender XDR ومركز إدارة Microsoft 365.
أثناء انقطاع الخدمة، تلقى مستخدمو Outlook رسالة خطأ “451 4.3.2 مشكلة في الخادم المؤقت” عند محاولة إرسال بريد إلكتروني أو تلقيه. وفقًا للمورد، لم يكن لدى المستخدمين القدرة على إرسال واستقبال رسائل البريد الإلكتروني من خلال Exchange Online، بما في ذلك رسائل البريد الإلكتروني الخاصة بالإشعارات من Microsoft Viva Engage.
وشملت المشكلات الأخرى التي ظهرت عدم القدرة على إرسال واستقبال رسائل البريد الإلكتروني الخاصة بالاشتراك من خلال Microsoft Fabric، أو جمع آثار الرسائل، أو البحث داخل SharePoint Online وMicrosoft OneDrive، وإضافة أعضاء إلى الدردشات أو الاجتماعات أو الفرق أو القنوات أو إضافة أعضاء إلى Microsoft Teams.
واجه مستخدمو Teams أيضًا مشكلة في الوصول إلى معلومات الحضور والموقع. وفقًا لمايكروسوفت، لاحظ مستخدمو Fabric عدم القدرة على تطبيق وإدارة تسميات الحساسية، وإجراء عمليات تفاعلية على التقارير، وإدارة العناصر المصنّفة بالحساسية.
حل مشكلة تأخير الاسترداد
كما هو الحال مع الانقطاعات السحابية السابقة مع البائعين الآخرين، حتى بعد قيام Microsoft بإصلاح المشكلات، استغرقت جهود استرداد مستخدميها للعودة إلى الوضع الطبيعي وقتًا إضافيًا.
اعترف عملاق التكنولوجيا بالانقطاع في الساعة 2:37 مساءً. Eastern Thursday، حيث أرسلت إلى X أنها “تحقق في مشكلة محتملة تؤثر على خدمات Microsoft 365 المتعددة.” حدد البائع “جزءًا من البنية التحتية للخدمة في أمريكا الشمالية لا يعالج حركة المرور كما هو متوقع” في الساعة 3:17 مساءً.
أكدت Microsoft في منشور على X الساعة 4:14 مساءً بالتوقيت الشرقي أنها “قامت باستعادة البنية التحتية المتأثرة إلى حالة (صحية)” ولكن “هناك حاجة إلى مزيد من موازنة التحميل لتقليل التأثير.”
في الساعة 5:21 مساءً، قالت مايكروسوفت إنها “تعيد موازنة حركة المرور عبر جميع البنية التحتية المتأثرة لضمان عودة البيئة إلى حالة متوازنة في أسرع وقت ممكن.” سمح هذا الأسلوب للبائع “بتحديد أي إجراءات إضافية مطلوبة للاسترداد”.
أبلغت الشركة عن “اختلال التوازن المتبقي في البيئة” الساعة 7:02 مساءً، و”استعادة الوصول إلى الخدمات المتأثرة” واستقرار تدفق البريد في الساعة 12:33 صباحًا يوم 23 يناير.
في ذلك الوقت، لاحظت مايكروسوفت أن “عددًا صغيرًا من الخدمات المتأثرة المتبقية” لا يزال بدون استقرار كامل للخدمة. وأعلنت الشركة أن تأثير الحادث “تم حله” الساعة 1:29 مساءً بالتوقيت الشرقي. أرسلت Microsoft منشور X آخر في الساعة 8:20 صباحًا، تطلب من المستخدمين الذين يواجهون مشكلات متبقية “مسح ذاكرة التخزين المؤقت لنظام أسماء النطاقات المحلية أو تقليل قيم DNS TTL مؤقتًا للمساعدة في ضمان استكشاف الأخطاء وإصلاحها بسرعة.”
وتبع ذلك قضايا أخرى في يناير
لم يكن هذا هو الانقطاع الأول لشركة Microsoft في عام 2026، حيث تعامل البائع مع مشكلات الوصول مع Teams وOutlook وخدمات M365 الأخرى يوم الأربعاء، ومشكلة Copilot في 15 يناير بالإضافة إلى انقطاع Azure في وقت سابق من الشهر.
أقرت Microsoft بمشاكل M365 في منشور على X يوم الأربعاء الساعة 12:11 مساءً. الشرقية. ووصفت الشركة مشكلات الوصول بأنها “تم حلها” الساعة 1:29 مساءً. وأرجع ذلك إلى “مشكلة في شبكة الطرف الثالث”، مشيرًا إلى أن “بيئة خدمة مايكروسوفت ظلت سليمة”.
في 15 يناير، واجه البائع مشكلات مع تطبيق الذكاء الاصطناعي Microsoft Copilot في أمريكا الشمالية. اعترفت Microsoft بالمشكلة في الساعة 7:42 مساءً بتوقيت المحيط الهادئ ووصفتها بأنها “تم حلها” في الساعة 8:24 مساءً، حيث ألقى البائع اللوم في المشكلة على تغيير التكوين في الخدمة والتراجع عن التغيير لحل التأثير.
وبالنسبة لحادثة Azure لشهر يناير، بين الساعة 17:50 بالتوقيت العالمي في 10 يناير والساعة 1:23 بالتوقيت العالمي في 11 يناير، رأى المستخدمون في منطقة غرب الولايات المتحدة 2 الموجودة في ولاية واشنطن “مشكلات متقطعة في الاتصال، أو انتهاء المهلات، أو زيادة معدلات الأخطاء، أو التأخير عند تنفيذ العمليات على الموارد المتأثرة،” وفقًا لمراجعة Microsoft الأولية لما بعد الحادث (PIR).
وأرجعت الشركة التعطيل إلى “انقطاع التيار الكهربائي الذي أثر على البنية التحتية داخل منطقة توافر الخدمات الفردية (AZ01) داخل منطقة غرب الولايات المتحدة 2، مما أدى إلى عدم توفر بعض البنية التحتية مؤقتًا.” استعادت Microsoft البنية التحتية للحوسبة والتخزين بحلول الساعة 19:51 بالتوقيت العالمي المنسق في 10 يناير، ولكن التأثير المتبقي على الأجهزة الافتراضية التي تم إنشاؤها حديثًا وأجهزة VM التي تم تحديثها خلال الإطار الزمني للتأثير من منطقة الألف إلى الياء استمر حتى الساعة 1:23 بالتوقيت العالمي المنسق في 11 يناير.
أثر الانقطاع على Azure Cache لـ Redis وAzure Cosmos DB وAzure Data Explorer وAzure Database لـ PostgreSQL وAzure Databricks وAzure Synapse Analytics وAzure Service Bus وقاعدة بيانات Azure SQL وAzure Storage وخدمات Azure الأخرى.
نتيجة لهذا الحادث، قالت Microsoft إنها ستعمل على تحسين التنبيهات الخاصة بالبنية التحتية المحددة للحامل المتأثرة بمشاكل مركز البيانات هذه وتحسين إجراءات التشغيل القياسية وأدلة استكشاف الأخطاء وإصلاحها وسير عمل التصعيد لتقليل الوقت اللازم للتعافي والتخفيف من التأثير المتبقي.
كما وعدت الشركة أيضًا بتحسين الاسترداد الآلي لخدمات البنية التحتية المتأثرة لـ SLB بعد انقطاع البنية التحتية المحلية.
توصي Microsoft أيضًا المستخدمين بالاستفادة من مناطق توافر الخدمات لتشغيل الخدمات في مواقع منفصلة ماديًا داخل منطقة Azure للحصول على مرونة أكبر في التعامل مع حالات الفشل على مستوى مركز البيانات والنظر في تقييم موثوقية التطبيقات باستخدام إرشادات Azure Well-Architected Framework ومراجعتها التفاعلية Well-Architected.
إلقاء اللوم على “انخفاض القدرة أثناء الصيانة”.
وقالت Microsoft في تحديث لمركز الإدارة إن الانقطاع كان سببه “زيادة حمل الخدمة الناتج عن انخفاض السعة أثناء الصيانة لمجموعة فرعية من البنية التحتية التي تستضيفها أمريكا الشمالية”.
بالإضافة إلى ذلك، لاحظت Microsoft أنه خلال “الجهود المستمرة لإعادة توازن حركة المرور” “قدمت تغييرًا مستهدفًا في تكوين موازنة التحميل يهدف إلى تسريع عملية الاسترداد، مما أدى بالمناسبة إلى حدوث اختلالات إضافية في حركة المرور مرتبطة بالتأثير المستمر على جزء من البنية التحتية المتأثرة.”
وقال ديفيد شتاينر من شركة US iTech إنه يبدو أن مايكروسوفت لم يكن لديها القدرة الكافية على أنظمة النسخ الاحتياطي الخاصة بها أثناء قيامها بإجراء صيانة لأنظمتها الرئيسية.
وقال “يبدو أن نظام النسخ الاحتياطي كان محملا فوق طاقته، مما أدى إلى إغلاق النظام أثناء قيامهم بإجراء صيانة على النظام الرئيسي”. “لهذا السبب استغرق الأمر عدة ساعات لإعادة تشغيله مرة أخرى. إذا كان نظامك الأساسي معطلاً للصيانة وفشل نظام النسخ الاحتياطي لديك بسبب مشكلات في السعة، فسوف يستغرق الأمر بعض الوقت لإعادة تشغيل نظامك الأساسي مرة أخرى.”
السحابة لا تزال الملك
في حين أن تكرار انقطاع الخدمة السحابية قد يدفع البعض في مجال تكنولوجيا المعلومات إلى التفكير في نقل أعباء العمل مرة أخرى إلى مقر العمل، فمن المهم أن نتذكر الفوائد المستمرة لاعتماد السحابة، خاصة وأن السحابة لا تزال وسيلة شائعة لتقديم منتجات وخدمات الذكاء الاصطناعي.
وفي تقرير معهد May Uptime أيضًا، الذي حذر من تأثيرات الذكاء الاصطناعي على البنية التحتية، أشارت المنظمة إلى أنه مع التقدم الصناعي في إدارة المخاطر والموثوقية، أصبحت حالات انقطاع التيار الكهربائي أقل تواتراً وأقل خطورة مقارنة بالنمو السريع للبنية التحتية الرقمية على مدى السنوات العديدة الماضية.
ووجد المعهد أن 53 في المائة من مشغلي مراكز البيانات أبلغوا عن انقطاعات في الخدمة خلال السنوات الثلاث الماضية، وهو انخفاض كبير من 60 في المائة في عام 2022، و69 في المائة في عام 2021، و78 في المائة في عام 2020. واقترب هذا المعدل من 55 في المائة المسجلة في عام 2023.
أما بالنسبة لخطورة الحوادث، فقد تم تصنيف 9 بالمائة من الحوادث المبلغ عنها في عام 2024 على أنها خطيرة أو حرجة، وهو أدنى مستوى سجلته Uptime حتى الآن.
وأشارت المنظمة إلى أن AWS Outpost وAzure Arc وغيرها من منصات السحابة الهجينة بالإضافة إلى VMware Cloud Foundation وأطر الإدارة الأخرى يمكن أن تساعد المؤسسات على تحسين التكامل السحابي مع البنية التحتية المحلية.
قالت ليديا ليونج، نائبة الرئيس المتميزة والمحللة في شركة Gartner، في منشور لها في شهر نوفمبر، إن نقل أعباء العمل السحابية مرة أخرى إلى أماكن العمل أو من موفري الخدمات واسعة النطاق إلى السحابات السيادية الأصغر لن يقضي على مخاطر انقطاع الخدمة.
على سبيل المثال، يجب أن تقوم التطبيقات السحابية الأصلية الحديثة بتوزيع أعباء العمل عبر مناطق توفر متعددة وأن تكون مستعدة للفشل سريعًا في الانتقال إلى منطقة أخرى إذا لزم الأمر. توفر السحابات الفردية وقت تشغيل أفضل وعمليات أبسط من الجمع بين موفري خدمات متعددين بعمليات مختلفة.
قد ترغب الشركات التي قد لا يكون لديها وقت توقف لمهام معينة في النظر في الحلول اليدوية في حالة فشل النظام الأساسي، الأمر الذي يمكن أن يرضي المنظمين مع الحفاظ على ميزانيات تكنولوجيا المعلومات منخفضة. رفض Leong أيضًا استخدام السحابة المتعددة ما لم يطلب المنظمون ذلك.
وقالت: “تظهر أبحاث جارتنر أن اعتماد المرونة متعددة السحابات قد يكلف أكثر مما يوفر، مما يؤدي إلى تعقيد تقني دون القضاء فعليًا على المخاطر النظامية”.












