هل اكتشف الذكاء الاصطناعي للحوسبة دماغًا آخر؟

لقد زاد الطلب الهائل على أجهزة الكمبيوتر التي تشغل نماذج الذكاء الاصطناعي، ولكن هناك عقبتان رئيسيتان يجب على كل فرد في الشركة التغلب عليهما: الحصول على الرقائق المناسبة وإدخالها في مراكز البيانات حيث يمكنهم البدء في تحقيق الإيرادات.

لدى General Compute، شركة neocloud الجديدة للاستدلال – وهي شركة تأجير طاقة حوسبة تعمل بالذكاء الاصطناعي ومتخصصة في المرحلة التي يتم فيها تشغيل النماذج والاستجابة للمستخدمين، بدلاً من تدريبها – إجابات على هذه الأسئلة التي تلقي الضوء على الاتجاه الذي يتجه إليه النظام البيئي للذكاء الاصطناعي. وقد ساعدتها هذه الاستجابات في جمع جولة أولية بقيمة 15 مليون دولار أمريكي بتقييم ما بعد النقد بقيمة 60 مليون دولار أمريكي، بقيادة FUSE VC بمشاركة Carya Venture Partners وVillage Global Ventures.

أولا ما هي الشريحة الصحيحة؟ لقد ارتفع الطلب على وحدات معالجة الرسوميات بشكل كبير، ولكن الاعتقاد السائد هو أنه بمجرد تدريبها، فإنها ليست الرقائق الأكثر ملاءمة لتشغيل نماذج الذكاء الاصطناعي. إن مرحلة الذكاء الاصطناعي التي يولد فيها النموذج الاستجابات بشكل فعال لها متطلبات حسابية مختلفة عن التدريب، ويتم تصميم فئة جديدة من الرقائق خصيصًا لها. تشير صفقة Groq لشركة Nvidia بقيمة 20 مليار دولار في ديسمبر والاكتتاب العام الأولي لشركة Cerebras بقيمة 57 مليار دولار الأسبوع الماضي إلى الطريق.

في مواجهة قدرات الإنتاج المحدودة في كلتا الشركتين، وجد المؤسسون المشاركون لشركة General Compute، الرئيس التنفيذي Finn Puklowski وCTO Jason Goodison، خيارًا آخر. إنهم يتحولون إلى الرقائق المتخصصة التي تصنعها شركة SambaNova، وهي شركة تصنيع الرقائق المدعومة من شركة إنتل والتي تركز على الاستدلال، والتي خرجت إلى حد ما من محادثات وادي السيليكون.

وقد يتغير هذا عندما تقوم SambaNova بإصدار شرائح جديدة هذا العام. تعتبر البنية أكثر مرونة وتستخدم المزيد من الذاكرة لتخزين السياق أثناء حسابات الاستدلال، وتدعي SambaNova أنها لا تتفوق في الأداء على وحدات معالجة الرسومات فحسب، بل تتفوق أيضًا على الشرائح المتخصصة الأخرى التي تصنعها شركات مثل Groq وCerebras. يقول بوكلوسكي إن الرقائق الجديدة ستولد ما بين 600 إلى 700 رمزًا في الثانية، مقارنة بحوالي 250 رمزًا في الثانية لوحدات معالجة الرسوميات.

طلبت شركة General Compute شرائح SN50 بقيمة 300 مليون دولار، وتقول إنها ستكون أول سحابة جديدة تنشرها.

تساعد هذه الرقائق أيضًا في حل المشكلة الكبيرة الثانية – مكان وضعها – بالنسبة للحوسبة العامة: فهي مبردة بالهواء بدلاً من مبردة بالماء وتستهلك طاقة أقل، لذا يمكن تركيبها في مراكز البيانات الحالية دون الحاجة إلى استثمارات جديدة في البنية التحتية.

يسعى Puklowski إلى تنفيذ اتفاقيات التجميع – الاتفاقيات التي تقوم فيها شركة General Compute بتثبيت معداتها في منشأة شخص آخر – ليس فقط مع موفري مراكز البيانات، ولكن أيضًا مع القائمين بتعدين العملات المشفرة الذين يرغبون في إعادة استخدام بنيتهم ​​التحتية لأن تكلفة إنتاج البيتكوين غالبًا ما تتجاوز سعره.

أطلقت شركة General Compute عروضها السحابية الأسبوع الماضي، قائلة إنها بالفعل الأسرع في دعم MiniMax 2.7، وهي أداة LLM القوية مفتوحة المصدر.

جو هاسليمان هو مستثمر مغامر دخل طفرة الاستدلال من خلال الاستثمار في Groq في عام 2021. أطلق هذا العام صندوقًا جديدًا، Evercrest Partners، يركز على مجال الذكاء الاصطناعي، وجعل General Compute أول استثمار له. ويرى هاسلمان أن شراكة SambaNova مع General Compute تشبه علاقة Coreweave مع Nvidia ودمج إنتاج الرقائق الخاص بشركة Groq مع عروضها السحابية السابقة.

وقال هاسلمان: “إنهم بحاجة إلى مزيج صحي من العملاء لوضع شرائحهم في بيئات عالية النمو”. “تمامًا كما تراهن شركة General Compute على SambaNova، فإن SambaNova تراهن على General Compute.”

والسؤال هو ما هو نوع بنية الكمبيوتر التي ستوفر أكبر قيمة في مستقبل الذكاء الاصطناعي. السحب الاستدلالية هي رهانات مخفية على عالم متعدد النماذج ومتعدد الوكلاء، حيث لا يهيمن بائع واحد، وتصبح سرعة الاستدلال والتكلفة متغيرات تنافسية رئيسية. خذ بعين الاعتبار زيادة السلسلة B البالغة 113 مليون دولار أمريكي لـ OpenRouter هذا الأسبوع، مما يعكس قدرة الشركة على تزويد العملاء بإمكانية الوصول إلى نماذج متعددة لتحسين إنفاق الرمز المميز.

السرعة والسعر والإمكانيات مهمة في هذه الحسابات. يريد Puklowski تحويل المهام التي تستغرق ساعة لوكلاء الترميز إلى مهام مدتها خمس أو 10 دقائق وإنشاء وكلاء خدمة عملاء صوتيين يحتاجون إلى استنتاج أسرع للتواصل بفعالية وفعالية من حيث التكلفة.

قال بوكلوفسكي لـ TechCrunch: “إذا كنت تستخدم ChatGPT وتوفر 50 رمزًا في الثانية، فلا يزال هذا أسرع بكثير مما يمكننا قراءته”. “الآن بعد أن انتقلت الأمور من وكيل إلى وكيل، حيث يقرأ الوكلاء نيابةً عنا أو قواعد بيانات ping، فإنهم بحاجة إلى التحرك بشكل أسرع.”

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. وهذا لا يؤثر على استقلالنا التحريري.

رابط المصدر