مقدمة (X-45)
يتغير التنبؤ بشكل أساسي عندما نحاول التنبؤ بحدث نادر جدًا. نحن بحاجة إلى تغيير جذري لما نمثله للتركيز على الأحداث النهائية. من مقاييس أداء النموذج وتعريف الهدف إلى النموذج النهائي ورؤوس مخرجات المحولات، يعد التنبؤ بالأحداث النادرة أمرًا صعبًا. من الصعب، ولكن يستحق كل هذا العناء.
بدأت عواصف الهالوين عام 2003 كاضطراب شمسي، وهي بقعة مظلمة واحدة أنتجت واحدة من أقوى أحداث الطقس الفضائي في عصر الأقمار الصناعية. من أواخر أكتوبر إلى أوائل نوفمبر، دارت سلسلة من المناطق النشطة الضخمة على القرص الشمسي. أدى هذا إلى إطلاق مشاعل قوية وسحب من البلازما الممغنطة باتجاه الأرض. كان هذا الحدث بمثابة تسليط الضوء على جمالية فريدة من نوعها مع آثار موجة الراديو.
وتعطلت الأقمار الصناعية، وتم التشويش على نظام تحديد المواقع العالمي (GPS) والراديو، وحولت شركات الطيران رحلاتها القطبية. ووفقا للإدارة الوطنية للمحيطات والغلاف الجوي (NOAA)، تأثرت شبكات الكهرباء في جميع أنحاء العالم، حيث تجاوزت التيارات 100 أمبير في بعض الحالات، مما أدى إلى انقطاع التيار الكهربائي في مدينة مالمو بالسويد. وفي الساعة 20:07 بالتوقيت العالمي، انقطع التيار الكهربائي في المنطقة، مما أدى إلى انقطاع التيار الكهربائي عن حوالي 50000 عميل لمدة تتراوح بين 20 و50 دقيقة.
مصدر الصورة: NASA / مرصد ديناميكيات الطاقة الشمسية (SDO) / AIA. المجال العام
كان هذا الحدث بمثابة صدمة دولية، حيث أدى إلى زيادة تشبع أجهزة استشعار الأشعة السينية التابعة لـ GOES، لذلك لا يمكن حساب الحجم الحقيقي للتوهج إلا من خلال إعادة البناء. غالبًا ما يُطلق عليه اسم X-45، نظرًا لحجمه الأكبر بـ 450 مرة من M-1، وهو توهج متوسط. ويبين الجدول أدناه مقياس ريختر فلير.
مشكلة التنبؤ
المشكلة المتناقضة مع الكوارث هي أنه كلما كانت أكثر كارثية، كلما كانت نادرة. فكر في الفيضانات والعواصف الثلجية والانهيارات الثلجية. كل قصة مدتها 50 عامًا تحدث مرة واحدة كل خمسين عامًا. وهذا أمر جيد عادة، ولكن بسبب ندرته، يصبح من الصعب للغاية التنبؤ به.
هناك العديد من الأشياء التي تجعل التنبؤ بالأحداث النادرة تحديًا مثيرًا للاهتمام بشكل خاص في التعلم الآلي:
- تحتاج مقاييس تقييم النموذج لدينا إلى التغيير
- يجب تصميم الميزات بناءً على بيانات المغناطيسية
- قم بإنشاء نموذج ذيل لالتقاط الأحداث النادرة
- قم بتوصيل نموذج الذيل بنموذج التوزيع الكامل باستخدام محول
ملاحظة حول الدقة، والتي عادة ما تكون مقياسًا جيدًا للتصنيف الثنائي. يمكننا تحقيق دقة تصل إلى 99% عن طريق تفويت كل توهج شمسي في 10000 تنبؤ إذا كان لدينا 100 توهج كبير فقط. يمكننا فقط أن نخمن. وهذا لن يحدث في كل مرة.
الدقة = (10,000-100)/10,000 = 9,900/10,000 = 0.99 = 99%
الإيجابية الحقيقية = 0
بيانات
إذا كنت مهتمًا بمعرفة مصدر هذه البيانات، فإن جميع البيانات المتوفرة لدينا عن التوهجات الشمسية تأتي من طبقة مختلفة تمامًا من الشمس عن تلك التي يحدث فيها التوهج. البيانات المتوفرة لدينا عن التوهجات الشمسية تأتي من الغلاف الضوئي، وهي أول طبقة مرئية من الشمس.
تحدث مشاعل في الهالة والكروموسفير. يتم جمع البيانات بواسطة مرصد ديناميكيات الطاقة الشمسية (SDO)، وهو مركبة فضائية تابعة لناسا تراقب الشمس باستمرار لمراقبة نشاطها. باستخدام الكاميرا الشمسية والمغناطيسية (HMI).
إدخال النموذج
لحسن الحظ، وبفضل وكالة ناسا، اكتمل الآن إنشاء ونشر ورحلة قمرنا الصناعي إلى الشمس، ويمكننا الآن التركيز على إدخال البيانات في النموذج. يقدر الرسم المغناطيسي المتجه متجه المجال المغناطيسي ب. الملاحظات الأولى لها نوعان:
من نقطة البداية هذه، يؤدي تصحيح المنطقة النشطة Space Weather HMI وظيفتين:
- موقع
- هندسة الميزات
يعني اختيار المناطق النشطة على الشمس (التوطين) وحساب المعلمات المغناطيسية التي تصف بشكل أفضل البنية الشمسية والمغناطيسية (هندسة المعالم).
الدرس المهم هو أنه لتحديد مدى ندرة الحدث الذي نحاول التنبؤ به، فإننا نركز على جمع البيانات من المواقع التي من المرجح أن يحدث فيها. نحن نأخذ بيانات القياس الأولية للمجالات المغناطيسية ونحسب الخصائص المختلفة مثل:
تصبح مدخلاتنا دالة للوقت وتطورت الوظائف:
إذا كان نموذجنا يستخدم آخر 24 ساعة و9 ميزات مطورة، فستكون مساهمتنا هي
الغرض من النموذج
ربما يمكننا أيضًا توضيح هدفنا الآن. ونعرفه على أنه احتمال رصد حدث من فئة M-1 خلال الـ 24 ساعة القادمة، بالنظر إلى التاريخ المغناطيسي. هنا سيكون التاريخ المغناطيسي هو كل مدخلاتنا.
ومع ذلك، فقد اتخذنا العديد من قرارات التصميم المخفية الموضحة بوضوح في الجدول أدناه.
لاحظ أن هناك العديد من الخيارات عند بناء هدفنا. هذه مشكلة خطيرة عند مقارنة النماذج المختلفة. ومن الجدير بالذكر أن مجرد جمع المزيد من البيانات ليس أفضل لأن الأحداث التي وقعت في الماضي عادة ما تكون مؤشرات أضعف للأحداث المستقبلية. يقدم هذا مشكلة نسبة الضوضاء إلى الإشارة فيما يتعلق بنافذة التدريب.
متري TSS
لحل المشكلة المطروحة سابقًا والمتمثلة في وجود نموذج بدقة 99% واستدعاء صفر، نقدم إحصائية جديدة تسمى إحصائية المهارة الحقيقية (TSS)، والتي يتم تعريفها على أنها الفرق بين المعدل الإيجابي الحقيقي والمعدل الإيجابي الخاطئ. تكافئ TSS الإيجابيات الحقيقية بينما تعاقب الإيجابيات الكاذبة.
صنع نموذج الذيل
نظرًا لندرة التوهجات الشمسية، إذا طبقنا هدف المخاطرة التالي، فسنجد أن فترة الخسارة تهيمن عليها الأحداث العادية التي لم تكن هناك توهجات شمسية. الأحداث النادرة بالكاد تساهم في هذا لأنها نادرًا ما تحدث، على الرغم من أنها الأكثر أهمية لما نحاول التنبؤ به. يمكن أن يصبح النموذج جيدًا جدًا في معظم التوزيعات بينما يتعلم القليل جدًا عن الأحداث المتطرفة محل الاهتمام. لهذا السبب الخياطة تستحق النظر.
يمكننا وصف المشكلة بشكل أكبر من خلال الإشارة إلى أن هدفنا مرجح بالتكرار، مما يعني أن الأحداث المتكررة تهيمن خلال فترة الخسارة، في حين أن الأحداث الأقل تكرارًا (النادرة) تساهم بأقل قدر ممكن، على الرغم من أن هذا هو ما يحتاج نموذجنا إلى تعلمه.
لذلك، يمكن لنموذجنا أن يتعلم من الأحداث النادرة في الغالب. نختار عتبة ثابتة لمتغير مستمر، مثل تدفق الأشعة السينية الناعمة. أي شيء يقيس شدة التوهج يمكن أن ينجح. نحن نستهدف الفرق بين العتبة ومتغير شدة التوهج الملحوظ ونستخدم فقط البيانات من ذيل التوزيع.
ثم البيانات التي نمثلها هي:
باستخدام المحولات
يمكننا الآن الجمع بين نموذجنا الأصلي والنموذج الخلفي باستخدام محول للحصول على حل أكثر قوة يتعلم بشكل مثالي ما يحدث أسفل وفوق عتبة الحدث النادر. بمعنى آخر، نود أن يعرف النموذج أصل الوظيفة المنفصلة وشكل المخاطر الزائدة التي يحددها النموذج الخلفي. ولهذا الغرض يمكننا استخدام محولات ذات رؤوس مختلفة. يمكن أن يبدأ النموذج ببيانات التاريخ المغناطيسي وترميزها في تمثيل ح; يمكن للرؤوس المنفصلة تقدير كميات مختلفة مثل احتمالية التوهج، وعبور الذيل غير المؤكد، والإشارة الأولية.
غالبًا ما يتم تدريب رأس التصنيف، الذي يقدر احتمالية أن يكون هدفنا هو الهدف المحدد في بياناتنا، باستخدام الإنتروبيا الثنائية، وربما يتم وزنه لمراعاة عدم التوازن الطبقي.
يمكننا استخدام توزيع باريتو المعمم (GPD)، الذي يوفر نموذجًا مدمجًا للتجاوزات (توزيعنا الخلفي). هنا، σ يتحكم في المقياس ويتحكم ξ في شدة الذيل. يقوم المحول بإنشاء تمثيل للحالات الأخيرة للشمس ح يعيّن هذا التمثيل لمعلمات GPD، لذا فإن التواريخ المغناطيسية المختلفة تشير إلى توزيعات ذيل مختلفة لمنطقة نشطة واحدة (البقع الشمسية).
يجمع الهدف الكامل بين مهمتين للتنبؤ. يُعلم مصطلح التصنيف النموذج كيفية تقدير ما إذا كان التوهج سيتجاوز العتبة المحددة، في حين يعلم مصطلح النهاية كيف تبدو الكثافة المفرطة بمجرد تجاوز تلك العتبة. وهذا مهم لأن النموذج لا ينبغي أن يتعلم فقط “الانعكاس أو عدم الانعكاس”. ويجب عليه أيضًا معرفة حجم الحادث إذا كان في جزء خطير من التوزيع.
ناسا, البقع الشمسية 1302 سبتمبر 2011، NASA.jpg24 سبتمبر 2011 عبر ويكيميديا كومنز. المجال العام
طلب
عندما يتعلق الأمر بالحصول على تنبؤ جيد لحدث نادر جدًا باستخدام محول، فلا يكفي مجرد توصيل البيانات وتقليل وظيفة الخسارة. عندما يتعلق الأمر بالتنبؤ بالتوهجات الشمسية، نحتاج أولاً إلى تطبيق تقنيات الترجمة والهندسة المميزة على بياناتنا. بعد ذلك، نحتاج إلى تحديد الغرض من النموذج الذي سيكون قادرًا على التمييز بين الأحداث الإيجابية والسلبية. نحن بحاجة إلى اختيار مقياس مناسب يكافئ الإيجابيات الحقيقية ويعاقب الإيجابيات الخاطئة. علاوة على ذلك، نظرًا للاختلال الهائل في التوازن الطبقي، فمن المنطقي إنشاء نموذج ذيل يستخدم توزيع باريتو المعمم لتجاوزات النماذج فوق العتبة. يمكن استخدام هذه التقنيات ووظائف الخسارة كرؤوس محولات مختلفة قادرة على التنبؤ والتقدير، وكذلك التعرف على حجم الحدث الذي قد يكون عندما يدخل جزءًا خطيرًا من التوزيع. وهذا يمنحنا أداءً تنبؤيًا أفضل ونموذجًا محددًا بشكل أفضل.
الموقع | لينكد إن | جيثب











