- يجمع الكمبيوتر العملاق LineShine من هواوي بين 2.45 مليون نواة للذراع في مجموعة واحدة ضخمة من الذكاء الاصطناعي
- تعمل معالجات هواوي حاليًا على تشغيل واحدة من أكبر تركيبات حوسبة الذكاء الاصطناعي في الصين
- تعمل أجهزة الكمبيوتر العملاقة التي تستخدم وحدة المعالجة المركزية (CPU) فقط على التخلص من عمليات نقل البيانات المكلفة بين المعالجات والمسرعات أثناء الأحمال الثقيلة
نشرت الصين حاسوبًا عملاقًا ضخمًا يستخدم وحدة المعالجة المركزية فقط يسمى LineShine والذي يوفر 1.54 إكسافلوبس من أداء تدريب الذكاء الاصطناعي دون استخدام أي وحدات معالجة رسومات.
يتكون النظام من 20,480 عقدة حسابية، تحتوي كل منها على معالجين LX2، بإجمالي 40,960 شريحة في الجهاز بأكمله.
يحتوي كل معالج LX2 على 304 نواة، مما يعني أن الكمبيوتر العملاق بأكمله يستخدم إجمالي 2.45 مليون نواة Armv9 تقريبًا.
داخل بنية معالج LX2 الاستثنائية
تم تطوير المعالج بواسطة شركة هواوي أو في مشروع مشترك مع مركز الحوسبة الفائقة الوطني الصيني، على الرغم من أن أصوله الدقيقة لم يتم الكشف عنها بعد.
يستخدم كل معالج LX2 شريحتين حاسوبيتين مع أنوية منظمة في ثماني مجموعات تحتوي على 38 نواة في كل مجموعة.
يوفر المعالج 60.3 تيرافلوب من أداء FP64، و240 تيرافلوب من إنتاجية BF16، و960 تيرافلوب من أداء INT8 من شريحة واحدة.
يجمع نظام الذاكرة الفرعي بين 32 جيجابايت من ذاكرة HBM المدمجة، مما يوفر ما يصل إلى 4 تيرابايت/ثانية من عرض النطاق الترددي، مع ما يصل إلى 256 جيجابايت من ذاكرة DDR5 المتاحة الجاهزة.
توفر أنظمة وحدة المعالجة المركزية فقط عددًا من المزايا للمهام العلمية المعقدة التي تجمع بين تدريب الذكاء الاصطناعي والحصول على كميات كبيرة من البيانات والمعالجة المسبقة.
ونظرًا لأن كل شيء يعمل على نفس وحدة المعالجة المركزية ومساحة الذاكرة، فإنها تتجنب عمليات نقل البيانات المكلفة والمستهلكة للنطاق الترددي بين وحدة المعالجة المركزية ووحدة معالجة الرسومات.
يمكن للأنظمة المتجانسة المعتمدة على وحدة المعالجة المركزية أيضًا توفير مجموعات أكبر ومتسقة من الذاكرة من خلال الجمع بين HBM وقدرات DDR الكبيرة.
يعد هذا مفيدًا للتعامل مع مجموعات البيانات العلمية الضخمة، وإنشاء عمليات بحث موسعة ونوافذ سياقية طويلة لا يمكن لقيود ذاكرة وحدة معالجة الرسومات التعامل معها بسهولة.
تحذير كبير مع هذا النهج
تميل أنظمة وحدة المعالجة المركزية (CPU) فقط إلى أن تكون أقل كفاءة في استخدام الطاقة وتوفر نطاقًا تردديًا أقل كثافة للذكاء الاصطناعي مقارنة بأجهزة الكمبيوتر العملاقة المعتمدة على وحدة معالجة الرسومات.
هذا هو السبب الرئيسي وراء اعتماد معظم الصناعة على بنيات وحدة المعالجة المركزية ووحدة معالجة الرسومات غير المتجانسة لأحمال عمل الذكاء الاصطناعي واسعة النطاق.
تتبع الصين هذا المسار بشكل رئيسي بسبب الحظر الذي تفرضه الولايات المتحدة على صادرات وحدات معالجة الرسومات، وليس لأن أنظمة وحدة المعالجة المركزية فقط أفضل من الناحية الفنية لمهام الذكاء الاصطناعي.
يُظهر بحث LineShine أن وحدات المعالجة المركزية يمكنها أداء مهام وحدة معالجة الرسومات بنجاح، لكن فجوة الأداء بين الطريقتين تظل كبيرة ومن غير المرجح أن تغلق في أي وقت قريب.
تجري الصين مقايضة استراتيجية، حيث تقبل أداءً أقل واستهلاكًا أعلى للطاقة مقابل الاستقلال عن النظم الإيكولوجية للأجهزة والبرمجيات الأجنبية مثل وحدات معالجة الرسوميات Nvidia وCUDA.
إن ما إذا كانت هذه المقايضة منطقية بالنسبة لتطوير الذكاء الاصطناعي على المدى الطويل يعتمد كليا على مدى السرعة التي يمكن بها للمصنعين الصينيين سد فجوة الأداء بتصميمات GPU الخاصة بهم.
وحتى ذلك الحين، سيظل LineShine إنجازًا هندسيًا رائعًا وضرورة عملية، لكنه على الأرجح لن يكون مخططًا لكيفية بناء معظم دول العالم لأجهزة الكمبيوتر العملاقة العاملة بالذكاء الاصطناعي.
بواسطة معدات تومز
اتبع TechRadar على أخبار جوجل و أضفنا كمصدرك المفضل لتلقي أخبار ومراجعات وآراء الخبراء حول قنواتك.











