يشير الانقطاع لمدة ثلاث ساعات يوم الثلاثاء إلى الحاجة إلى تعزيز المرونة داخل مقدمي الخدمة الحاليين، لكن الخطوات الأكثر دراماتيكية ليست جديرة بالاهتمام بالنسبة للانقطاعات قصيرة المدى، وفقًا لمحللين في شركة الأبحاث.
يشير التعطيل الملحوظ على نطاق واسع لخدمات شبكة Cloudflare يوم الثلاثاء إلى الحاجة إلى تعزيز المرونة داخل مقدمي الخدمات السحابية الحاليين، ولكن من غير المرجح أن يكون تقديم خدمات زائدة عن الحاجة للانقطاعات قصيرة المدى مفيدًا، وفقًا لتحليل أجرته شركة الأبحاث Gartner.
تسبب الانقطاع الذي استمر ثلاث ساعات يوم الثلاثاء في تعطل عدد من مواقع الويب الشهيرة للعديد من المستخدمين – بما في ذلك ChatGPT من OpenAI،
(ذات صلة: أكبر 10 انقطاعات سحابية في عام 2025 (حتى الآن))
كشف ماثيو برينس، المؤسس المشارك والرئيس التنفيذي لشركة Cloudflare، في مقابلة أن انقطاع الشبكة العالمية كان بسبب تغيير في أذونات قاعدة البيانات ولم يكن نتيجة لهجوم إلكتروني. بريد يوم الثلاثاء
وفي تحليل أجرته مؤسسة جارتنر يوم الثلاثاء، حثت شركة الأبحاث قادة البنية التحتية لتكنولوجيا المعلومات وقادة الأمن على “مقاومة ردود الفعل المبالغ فيها” تجاه الانقطاع.
يشير العديد من محللي Gartner إلى أنه من المنطقي بالتأكيد استكشاف طرق لتحسين المرونة داخل مقدمي الخدمات الحاليين، ولكن “لا تتخذ قرارات متهورة لتقسيم التطبيقات أو مقدمي الخدمة”.
وكتب المحللون: “إن الاستجابات التفاعلية لانقطاع واحد، مثل السحابة المتعددة أو إضافة بنية زائدة عن الحاجة، غالبًا ما تؤدي إلى تعقيدات وتكلفة غير ضرورية دون تحسين المرونة بشكل كبير للأحداث قصيرة المدى”.
ومع ذلك، في حالة التطبيقات المهمة، فإن فشل التصميم بين مقدمي الخدمة “قد يكون ممكنًا” – على الرغم من أن هذا قد يأتي مع ارتفاع التكاليف والقيود على الخدمات التي يمكن استهلاكها، كما كتب محللو جارتنر.
وقال المحللون إن أفضل مسار للعمل هو “إعطاء الأولوية للمرونة، وليس الاستغناء عن العمالة في كل مكان”. “قم بتطبيق التنويع بشكل مقتصد وفقط للأنظمة المهمة حيث يكون لتوقف العمل تأثير مادي على الأعمال.”
تغييرات تعهد Cloudflare
كتب برنس في منشوره يوم الثلاثاء أنه في حين أن Cloudflare “اشتبهت بشكل خاطئ في البداية في أن الأعراض التي نراها كانت ناجمة عن هجوم DDoS واسع النطاق”، تمكن البائع قريبًا من تحديد المشكلة بشكل صحيح.
وكتبوا أن سبب الخطأ هو تغيير في أذونات قاعدة البيانات في مجموعة ClickHouse الخاصة بالبائع، مما تسبب في مضاعفة حجم ملف التكوين الذي تستخدمه خدمة إدارة الروبوت الخاصة بها عن غير قصد ثم انتشاره عبر الشبكة.
كتب برينس لأن ملف التكوين تجاوز الحد الأقصى للحجم الذي يفرضه برنامج Cloudflare، “مما تسبب في فشل البرنامج”.
وقال إن الحادث أثبت أنه “الأسوأ” لانقطاع خدمة Cloudflare منذ عام 2019.
كتب برنس أنه من الآن فصاعدا، ستنفذ Cloudflare إصلاحات لمنع تكرار هذه الأنواع من الإخفاقات في المستقبل. تتضمن التحسينات المخطط لها وفقًا لبرنس تشديد استيعاب ملفات التكوين التي أنشأها البائع وتمكين عدد أكبر من “مفاتيح التوقف” للميزات.
وكتب في نهاية المطاف أن “انقطاع التيار الكهربائي مثل هذا اليوم غير مقبول”. “نيابة عن فريق Cloudflare بأكمله، أود أن أعتذر عن الإزعاج الذي سببته للإنترنت اليوم.”











