إنتل توقع صفقة استدلال للذكاء الاصطناعي “متعددة السنوات” مع سامبانوفا بعد انتهاء محادثات الاستحواذ

بدعم من جولة تمويل جديدة بقيمة 350 مليون دولار من شركة Sambanova Systems، ذراع رأس المال الاستثماري لشركة Intel، تخطط الشركة الناشئة لشرائح الذكاء الاصطناعي للاستفادة من “المؤسسات العالمية والقنوات السحابية والشركاء” لشركة Intel لزيادة مبيعات العروض المشتركة من أجل “استدلال الذكاء الاصطناعي على نطاق سحابي”.

تخطط إنتل لاستخدام “قنواتها المؤسسية والسحابية والشركاءية” من أجل “تعاون استراتيجي جديد متعدد السنوات” مع شركة Sambanova Systems الناشئة لشرائح الذكاء الاصطناعي بعد محادثات الاستحواذ بين الشركتين التي اختتمت مؤخرًا.

أعلنت Sambanova يوم الثلاثاء عن الشراكة بجولة تمويل بقيمة 350 مليون دولار من السلسلة E، والتي قالت إنها تلقت “مشاركة قوية” من Intel Capital، وكشفت النقاب عن الجيل التالي من شريحة SN50 AI، والتي قالت إنها يمكن أن تتفوق على المنتجات المنافسة. وقادت جولة التمويل شركتا الأسهم الخاصة Vista Equity Partners وCambium Capital.

(ذات صلة: حصريًا: إنتل تستغل X-Arm وApache Exec لأنظمة مراكز البيانات بعد إعادة تنظيم الذكاء الاصطناعي)

ووصفت الشركة الناشئة التي يقع مقرها في سان خوسيه بولاية كاليفورنيا SN50 بأنها “الشريحة الأكثر كفاءة للذكاء الاصطناعي الوكيل”، وقالت إن الشريحة، التي من المتوقع أن يتم شحنها في وقت لاحق من هذا العام، أسرع بخمس مرات من الرقائق المنافسة ويمكنها تشغيل أعباء عمل الذكاء الاصطناعي الوكيل بثلاثة أضعاف تكلفة وحدة معالجة الرسومات.

وقال رودريجو ليانج، المؤسس المشارك والرئيس التنفيذي لشركة سامبانوفا، في بيان: “لم يعد الذكاء الاصطناعي منافسة لبناء أكبر نموذج”. “مع SN50 وتعاوننا العميق مع Intel، فإن السباق الحقيقي يدور حول من يمكنه إضاءة مراكز البيانات بأكملها بوكلاء الذكاء الاصطناعي الذين يستجيبون على الفور، ولا يتوقفون أبدًا، ويفعلون ذلك بتكلفة تحول الذكاء الاصطناعي من تجربة إلى المحرك الأكثر ربحية في السحابة.”

إنتل: تكامل Sambanova يكمل استراتيجية الذكاء الاصطناعي الخاصة بها

أعلنت سامبانوفا عن التمويل والشراكة الشهر الماضي بعد أن ذكرت بلومبرج أن مناقشات إنتل للاستحواذ على الشركة الناشئة قد توقفت. نشر المنشور لأول مرة عن محادثات الاستحواذ بين الشركتين في أكتوبر الماضي.

وقال متحدث باسم الشركة الناشئة إن صفقة الاستحواذ “ليست قيد المناقشة في هذه المرحلة”. ورفض متحدث باسم إنتل التعليق على الأمر.

وقال ممثل إنتل إن الشراكة الإستراتيجية للشركة مع Sambanova تهدف إلى استكمال إستراتيجية البنية التحتية للذكاء الاصطناعي، والتي تمتد من وحدات المعالجة المركزية Xeon إلى وحدات معالجة الرسومات. في العام الماضي، التزم عملاق أشباه الموصلات بخريطة طريق لوحدة معالجة الرسومات لمركز البيانات مع إيقاع إصدار سنوي قبل تعيين مهندس رئيسي جديد لوحدة معالجة الرسومات في يناير.

وقال كيفورك كيشيشيان، رئيس مجموعة مراكز البيانات في إنتل، في بيان: “يطالب العملاء بمزيد من الخيارات وطرق أكثر كفاءة لتوسيع نطاق الذكاء الاصطناعي”. “من خلال الجمع بين ريادة إنتل في مجال الحوسبة والشبكات والذاكرة وأنظمة الذكاء الاصطناعي الكاملة من Sambanova ومنصة Inference Cloud، فإننا نقدم خيارًا جذابًا للمؤسسات التي تبحث عن بدائل لوحدة معالجة الرسومات لنشر الذكاء الاصطناعي المتقدم على نطاق واسع.”

وفقًا لملفه الشخصي على LinkedIn، شغل الرئيس التنفيذي لشركة Intel، Lip-Boo Tan، منصب رئيس مجلس إدارة Sambanova منذ تأسيسها في عام 2017. وتعد شركتاه الاستثمارية، Celesta Capital وWalden International، مستثمرتين منذ فترة طويلة. وبينما رفض متحدث باسم Sambanova تحديد ما إذا كانت الشركتان قد شاركتا في جولة التمويل من السلسلة E أو تمتلكان حاليًا حصة في الشركة الناشئة، فقد وصفهما الممثل بـ “المستثمر القديم”.

وتأمل سامبانوفا في الدخول إلى قنوات مبيعات إنتل

وقال سامبانوفا إن جولة التمويل، إلى جانب شراكة إنتل الجديدة “لتقديم استدلال الذكاء الاصطناعي على نطاق سحابي”، وهو ما يسميه فرصة سوق بمليارات الدولارات، ستساعد في زيادة إنتاج وتسليم SN50.

سيركز التعاون متعدد السنوات بين سامبانوفا وإنتل على تقديم “حلول استدلال الذكاء الاصطناعي عالية الأداء وفعالة من حيث التكلفة للشركات المعتمدة على الذكاء الاصطناعي ومقدمي النماذج والمؤسسات والمنظمات الحكومية حول العالم”.

وسيشمل ذلك توسيع منصة سامبانوفا السحابية المتكاملة رأسياً للذكاء الاصطناعي باستخدام وحدات المعالجة المركزية Xeon من إنتل، والتي قالت إنها ستكون “مدعومة ببنيات مرجعية ومخططات نشر وشراكات مع متخصصي تكامل الأنظمة وبائعي البرامج”.

وقالت الشركة الناشئة إن الجمع بين أنظمتها مع وحدات المعالجة المركزية والمسرعات وتقنيات الشبكات من إنتل سيعمل على تشغيل “استدلال قابل للتطوير وجاهز للإنتاج للاستدلال وتوليد التعليمات البرمجية والتطبيقات متعددة الوسائط وسير العمل الوكيل”.

وتخطط الشركتان للانخراط في أنشطة البيع والتسويق المشترك لهذه العروض، وتأمل إنتل في تسريع اعتمادها عبر النظام البيئي للذكاء الاصطناعي باستخدام “قنوات المؤسسة العالمية والسحابة والشركاء”.

SN50: تم تعيين SoftBank كعميل أول؛ وصف الشريحة الأولي

وقالت سامبانوفا إن أول عميل لـ SN50 هو شركة الاستثمار اليابانية العملاقة SoftBank Group، التي تخطط لدمج الشريحة في مراكز بيانات الذكاء الاصطناعي من الجيل التالي في اليابان.

بالإضافة إلى حصصها الكبيرة في شركة Intel وشركة Arm المنافسة، استحوذت SoftBank العام الماضي على شركة Ampere Computing، التي تصمم وحدات المعالجة المركزية المتوافقة مع Arm، وشركة Graphcore الناشئة لشرائح الذكاء الاصطناعي كجزء من دفعة جديدة للبنية التحتية للذكاء الاصطناعي.

وقالت سامبانوفا إن SN50 يستخدم بنية وحدة البيانات القابلة لإعادة التشكيل (RDU) لتمكين “زمن الوصول المنخفض للغاية” من أجل “الاستجابة في الوقت الفعلي” في تطبيقات مثل المساعدين الصوتيين و”لتشغيل الآلاف من جلسات الذكاء الاصطناعي المتزامنة بأداء عالٍ باستمرار”.

قالت الشركة الناشئة سابقًا أن إحدى نقاط قوة بنية RDU هي القدرة على دمج عمليات متعددة في مكالمة kernel واحدة، مما يزيل الحمل الإضافي المرتبط بإطلاق مكالمات kernel متعددة ويؤدي إلى أداء أسرع.

وتقول أيضًا إن SN50 يتيح “استخدامًا أعلى للأجهزة” لتقليل تكلفة إنشاء الرموز وتحسين عائد الاستثمار لاستدلال الذكاء الاصطناعي.

بالإضافة إلى ذلك، قالت سامبانوفا إن SN50 يستخدم ثلاثة مستويات من الذاكرة – SRAM وHBM وDDR – لتوفير “قدرة نموذجية متقدمة”، مما يتيح القدرة على تشغيل النماذج بأكثر من 10 تريليون معلمة وأكثر من 10 ملايين طول سياق. وفقًا للشركة الناشئة، تم تحسين بنية الذاكرة ثلاثية الطبقات هذه من خلال “الذاكرة متعددة النماذج المقيمة والتخزين المؤقت الوكيل” للرقاقة لخفض تكاليف البنية التحتية لعمليات نشر الذكاء الاصطناعي على مستوى المؤسسة.

على الرغم من أن الشركة الناشئة لم تقدم الكثير من التفاصيل حول بنية الذاكرة ثلاثية الطبقات لـ SN50، إلا أنها أوضحت كيفية استخدام كل طبقة ذاكرة لشريحة SN40L من الجيل السابق: يوفر DDR القدرة على استضافة مئات النماذج وتبديلها بسرعة على مقبس واحد، ويحتفظ HBM “بالنموذج قيد التشغيل حاليًا ويخزن الآخرين مؤقتًا”، ويوزع SRAM “عبر اندماج النواة المكانية والتوازي على مستوى البنك”. “يتيح كثافة تشغيلية أعلى من.”

قال متحدث باسم Sambanova إن ادعاءاتها التنافسية بشأن الأداء والتكلفة الإجمالية للملكية “تعتمد على القياس الداخلي لـ SN50 مقابل أنظمة GPU من الجيل الحالي المنتشرة على نطاق واسع والتي تشغل نماذج لغوية كبيرة.”

في حين أن مطالبة تعزيز الأداء تعتمد على “مكاسب الإنتاجية الشاملة على أعباء عمل التقدير الحساسة لزمن الوصول”، فإن المطالبة المتعلقة بالتكاليف المنخفضة تعتمد على “النمذجة على مستوى النظام في نشر إنتاج نموذجي، بما في ذلك الأجهزة والطاقة والتبريد والشبكات والاستخدام المستمر،” كما قال الممثل.

رابط المصدر

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا