استدعاء أداة واحدة للحكم عليهم جميعا؟ تقوم أداة Runpod Flash الجديدة مفتوحة المصدر من Python بإزالة الحاويات من أجل تطوير الذكاء الاصطناعي بشكل أسرع

Runpodأطلقت منصة حوسبة سحابية عالية الأداء ووحدة معالجة الرسومات (GPU) مصممة خصيصًا لتطوير الذكاء الاصطناعي، اليوم أداة برمجة Python جديدة مفتوحة المصدر وصديقة للمؤسسات ومرخصة من معهد ماساتشوستس للتكنولوجيا (MIT) رنبود فلاش – وهي على استعداد لتسريع إنشاء أنظمة الذكاء الاصطناعي وتكرارها ونشرها بشكل كبير في مختبرات النماذج الأساسية وخارجها.

تهدف الأداة إلى إزالة بعض أكبر الحواجز والعقبات التي تعترض التدريب واستخدام نماذج الذكاء الاصطناعي، وبالتحديد القضاء على تكديس Docker والحاويات عند إنشاء بنية تحتية لوحدة معالجة الرسومات بدون خادم، والتي تقول الشركة إنها ستسرع عملية تطوير ونشر نماذج الذكاء الاصطناعي الجديدة والتطبيقات وسير العمل الوكيل.

بالإضافة إلى ذلك، تم تصميم المنصة لتكون بمثابة ركيزة مهمة لعملاء الذكاء الاصطناعي ومساعدي البرمجة – مثل Claude Code وCursor وCline – مما يمكنهم من تنسيق الأجهزة عن بعد ونشرها بشكل مستقل بأقل قدر من الاحتكاك.

يمكن للمطورين استخدام Flash لتنفيذ مجموعة متنوعة من مهام الحوسبة عالية الأداء، بما في ذلك أحدث أبحاث التعلم العميق والتدريب على النماذج والضبط.

وقال برينين سميث، كبير مسؤولي التكنولوجيا في Runpod، الأسبوع الماضي في مكالمة فيديو مع VentureBeat: “إننا نجعل الأمر بسيطًا قدر الإمكان لربط عالم أدوات الذكاء الاصطناعي المختلفة المتاحة في مكالمة وظيفية”.

تتيح الأداة إنشاء خطوط أنابيب “متعددة اللغات” متطورة حيث يمكن للمستخدمين توجيه المعالجة المسبقة للبيانات إلى عمال وحدة المعالجة المركزية (CPU) ذوي التكلفة الفعالة ثم دفع عبء العمل تلقائيًا إلى وحدات معالجة الرسومات المتطورة للاستدلال.

بالإضافة إلى البحث والتطوير، يدعم Flash متطلبات درجة الإنتاج من خلال ميزات مثل واجهات برمجة التطبيقات HTTP ذات زمن الوصول المنخفض ومتوازنة التحميل، ومعالجة الدُفعات المستندة إلى قائمة الانتظار، والتخزين المستمر عبر مراكز بيانات متعددة.

– إلغاء “ضريبة التغليف” المتعلقة بتطوير الذكاء الاصطناعي

تتمثل القيمة الأساسية لـ Flash GA في إزالة Docker من دورة التطوير بدون خادم.

في بيئات GPU التقليدية بدون خادم، يجب على المطور وضع التعليمات البرمجية الخاصة به في حاوية، وإدارة ملف Dockerfile، وإنشاء صورة، ودفعها إلى السجل قبل أن يتم تنفيذ سطر واحد من المنطق على وحدة معالجة الرسومات البعيدة. يتعامل Runpod Flash مع هذه العملية برمتها على أنها “ضريبة تغليف” تعمل على إبطاء دورات التكرار.

تحت الغطاء، يستخدم Flash محرك بناء متعدد المنصات يسمح للمطور الذي يعمل على سلسلة M-Mac بإنشاء قطعة أثرية Linux x86_64 تلقائيًا.

يحدد هذا النظام الإصدار المحلي من Python، ويفرض العجلات الثنائية، ويجمع التبعيات في قطعة أثرية قابلة للنشر يتم تجميعها في وقت التشغيل على أسطول Runpod بدون خادم.

تقلل إستراتيجية التثبيت هذه بشكل كبير من “البدء البارد” – التأخير بين الطلب وتنفيذ التعليمات البرمجية – عن طريق تجنب الحمل الزائد لسحب وتهيئة صور الحاويات الضخمة مع كل عملية نشر.

علاوة على ذلك، فإن البنية التحتية التقنية التي تدعم تقنية الفلاش مبنية على مجموعة من الشبكات المعرفة بالبرمجيات (SDN) وشبكة توصيل المحتوى (CDN).

صرح سميث لـ VentureBeat أن المشاكل الأكثر صعوبة في البنية التحتية لوحدة معالجة الرسومات لا تكمن غالبًا في وحدات معالجة الرسومات نفسها، بل في مكونات الشبكات والتخزين التي تربطها ببعضها البعض.

قال سميث: “يتحدث الجميع عن الذكاء الاصطناعي العميل، لكن الطريقة التي أراها شخصيًا – وهذه هي الطريقة التي يراها فريق قيادة Runpod – هي أنه يجب أن يكون هناك ركيزة وغراء جيد حقًا لهؤلاء العملاء، بغض النظر عن ما يتم تشغيله به، حتى يتمكنوا من العمل معهم”.

يستخدم Flash هذه الركيزة ذات زمن الاستجابة المنخفض لدعم اكتشاف الخدمة وتوجيهها، مما يسمح باستدعاء الوظائف بين نقاط النهاية. يتيح ذلك للمطورين إنشاء خطوط أنابيب “متعددة اللغات”، حيث، على سبيل المثال، تعالج نقطة نهاية وحدة المعالجة المركزية منخفضة التكلفة المعالجة المسبقة للبيانات قبل إرسال البيانات النظيفة إلى وحدة معالجة الرسومات NVIDIA H100 أو B200 المتطورة للاستدلال عليها.

يتم دعم أربعة بنيات مختلفة لأحمال العمل

بينما يركز الإصدار التجريبي من Flash على نقاط نهاية الاختبار المباشر، يقدم إصدار GA مجموعة من الميزات المصممة لتحقيق الموثوقية على مستوى الإنتاج.

الواجهة الأساسية جديدة @Endpoint مصمم يدمج التكوين – مثل نوع وحدة معالجة الرسومات، وقياس العامل، والتبعيات – مباشرةً في التعليمات البرمجية. يحدد إصدار GA أربعة أنماط معمارية مختلفة لأحمال العمل بدون خادم:

  • قائمة الانتظار: مصمم للوظائف الدفعية غير المتزامنة حيث يتم تزيين الوظائف وتشغيلها.

  • حمولة متوازنة: مصمم خصيصًا لواجهات برمجة تطبيقات HTTP ذات زمن الوصول المنخفض حيث تشترك مسارات متعددة في مجموعة من العاملين دون تحميل قائمة الانتظار.

  • صور دوكر مخصصة: الحل الاحتياطي للبيئات المعقدة مثل vLLM أو ComfyUI حيث يتوفر بالفعل عامل تم إنشاؤه مسبقًا.

  • نقاط النهاية الموجودة: استخدام Flash كعميل Python للتفاعل مع موارد Runpod المنشورة مسبقًا باستخدام معرفاتها الفريدة.

الإضافة الرئيسية لبيئات الإنتاج هي NetworkVolume منشأة توفر دعمًا من الدرجة الأولى لتخزين البيانات المستمر عبر مراكز بيانات متعددة.

الملفات المثبتة في /runpod-volume/ تمكين تخزين أوزان النماذج ومجموعات البيانات الكبيرة مؤقتًا وإعادة استخدامها مرة واحدة، مما يقلل بشكل أكبر من تأثير البداية الباردة أثناء أحداث القياس.

بالإضافة إلى ذلك، قدم Runpod إدارة متغيرات البيئة التي تم تعطيلها من تجزئة التكوين، مما يعني أنه يمكن للمطورين تغيير مفاتيح واجهة برمجة التطبيقات أو تبديل علامات الميزات دون الحاجة إلى تشغيل إعادة بناء نقطة النهاية بالكامل.

ولمواجهة صعود التطور المدعوم بالذكاء الاصطناعي، أصدرت Runpod حزم مهارات خاصة لوكلاء البرمجة مثل Claude Code وCursor وCline.

توفر هذه الحزم للوكلاء سياقًا عميقًا حول Flash SDK، مما يقلل بشكل فعال من الهلوسة النحوية ويمكّن الوكلاء من كتابة تعليمات النشر الوظيفية بأنفسهم.

هذه الخطوة لا تجعل من Flash أداة للبشر فحسب، بل تجعل أيضًا “الأرض والغراء” للجيل القادم من عملاء الذكاء الاصطناعي.

لماذا Runpod Flash مفتوح المصدر؟

قام Runpod بإصدار Flash SDK كجزء من رخصتيواحدة من التراخيص مفتوحة المصدر الأكثر ليبرالية المتاحة.

يعد هذا الاختيار خطوة إستراتيجية مدروسة جيدًا تهدف إلى زيادة حصة السوق إلى أقصى حد واعتماد الحلول من قبل المطورين. على عكس التراخيص الأكثر تقييدًا مثل GPL (الرخصة العامة)والتي قد تفرض متطلبات “الحقوق المتروكة” – مما قد يجبر الشركات على فتح مصدر كود الملكية الخاص بها إذا كان يحتوي على روابط للمكتبة – يسمح ترخيص MIT بالاستخدام التجاري غير المقيد والتعديل والتوزيع.

وأوضح سميث هذه الفلسفة باعتبارها “بنية محفزة” للشركة، حيث قال لـ VentureBeat: “أفضل الفوز على أساس جودة المنتج والابتكار بدلاً من السهولة القانونية والمحامية”.

من خلال اعتماد ترخيص متساهل، يعمل Runpod على تقليل العوائق التي تحول دون اعتماد المؤسسات لأن الفرق القانونية لا يتعين عليها التعامل مع تعقيدات الامتثال المقيد للمصادر المفتوحة.

علاوة على ذلك، فهو يشجع المجتمع على تطوير الأداة وتحسينها، والتي يمكن لـ Runpod بعد ذلك دمجها في الإصدار الرسمي، مما يدعم النظام البيئي التعاوني الذي يعمل على تسريع تطوير النظام الأساسي.

الوقت هو جوهر الأمر: تطور Runpod وموقعه في السوق

يأتي إطلاق Flash GA خلال فترة النمو السريع للشركة Runpod الذي تجاوز 120 مليون دولار من الإيرادات السنوية المتكررة (ARR) ومنذ ذلك الحين دعمت قاعدة مطورين تزيد عن 750.000 تأسست عام 2022.

يعتمد نمو الشركة على قطاعين متميزين: مؤسسات “P90” – عمليات واسعة النطاق مثل Anthropic وOpenAI وPerplexity – والباحثون والطلاب المستقلون “sub-P90″، الذين يمثلون الغالبية العظمى من قاعدة المستخدمين.

تم إظهار مرونة النظام الأساسي مؤخرًا أثناء إطلاق DeepSeek V4 الأسبوع الماضي. وفي غضون دقائق من ظهور النموذج لأول مرة، استخدم المطورون البنية التحتية لـ Runpod لنشر البنية الجديدة واختبارها.

تعد ميزة “الوقت الفعلي” هذه نتيجة مباشرة لتركيز Runpod المتخصص على مطوري الذكاء الاصطناعي، حيث تقدم أكثر من 30 وحدة معالجة رسوميات وفواتير بالميلي ثانية لضمان أن كل دولار يتم إنفاقه يؤدي إلى أقصى قدر من الإنتاجية.

يشير موقع Runpod باعتبارها “سحابة الذكاء الاصطناعي الأكثر استشهادًا على GitHub” إلى أنها تمكنت من اكتساب خبرة المطورين المطلوبة للحفاظ على زخم التطوير.

باستخدام Flash GA، تحاول الشركة تحويل نفسها من مزود حوسبة أولية إلى طبقة تنسيق أساسية لسحابة الذكاء الاصطناعي الأولى.

ومع تحول التطوير نحو الترميز “القائم على النية” – حيث تكون النتيجة أكثر أهمية من تفاصيل التنفيذ – من المرجح أن تحدد الأدوات التي تسد الفجوة بين الأفكار المحلية والنطاق العالمي الحقبة القادمة من الحوسبة.

رابط المصدر