إنه شهر مايو فقط وقد أنفقت بعض أكبر الشركات في العالم بالفعل ميزانيتها السنوية للذكاء الاصطناعي بالكامل. هذا ليس إسقاطا. هذا ما يقوله مديرو تكنولوجيا المعلومات لبعضهم البعض الآن.
سمعت Google هذه المحادثة وقررت الرد علنًا في أكبر حدث لهذا العام.
ما أعلنته جوجل ولماذا كان التوقيت متعمدا
في Google I/O في 20 مايو الأبجدية أعلن الرئيس التنفيذي ساندر بيتشاي عن إطلاق برنامج Gemini 3.5 Flash، وهو نموذج ذكاء اصطناعي أسرع وأرخص مصمم خصيصًا لأعباء العمل في المؤسسات، وفقًا لما ذكره موقع Business Insider. مدونة جوجل.
كانت الرسالة التي سلمها Pichai مع الإصدار مباشرة بشكل غير عادي.
وقال: “نسمع أن العديد من الشركات تنفق بالفعل ميزانياتها السنوية الرمزية، ونحن في شهر مايو فقط”. “إذا استخدمت الشركات مجموعة من نماذج Flash وغيرها من النماذج المتطورة، فيمكنها توفير الكثير من المال.”
ثم وضع رقما عليه. تقوم الشركات الكبرى الآن بمعالجة ما يقرب من تريليون رمز يوميًا على Google Cloud. إذا نقلت هذه الشركات 80% من أعباء عملها من النماذج الحدودية باهظة الثمن إلى مزيج من نماذج Gemini 3.5 Flash والنماذج الحدودية، فإنها ستوفر أكثر من مليار دولار سنويًا، وفقًا لـ فينشربيت.
لماذا ترتفع فواتير الذكاء الاصطناعي للمؤسسات وما الذي يدفعها؟
مشكلة ميزانية الرمز المميز حقيقية ومتسارعة.
الرموز هي وحدات البيانات التي تعالجها نماذج الذكاء الاصطناعي مع كل مطالبة واستجابة وتوليد التعليمات البرمجية وتفاعل الوكيل.
بالنسبة لمستخدم واحد يقوم بتشغيل استعلامات عرضية، تكون التكلفة ضئيلة. بالنسبة لشركة تقوم بنشر وكلاء الذكاء الاصطناعي عبر الآلاف من مسارات العمل في وقت واحد، تتغير الحسابات تمامًا.
المزيد من الذكاء الاصطناعي:
- ميكرون في قلب ارتفاع مزدهر للرقائق
- الرئيس التنفيذي لشركة IBM يرسل رسالة قوية حول الذكاء الاصطناعي والحوسبة الكمومية
- الرئيس التنفيذي لشركة Anthropic يقدم اعترافًا صادمًا بشأن الذكاء الاصطناعي
وكلاء الذكاء الاصطناعي هم المحرك الأكبر. على عكس تفاعلات chatbot ذات الدورة الواحدة، يقوم الوكلاء بتنفيذ مهام معقدة ومتعددة الخطوات يمكن أن تتضمن العشرات من استدعاءات النماذج ونوافذ السياق الموسعة ودورات التفكير التي تستهلك الحوسبة بوتيرة يمكن أن تفاجئ حتى فرق التمويل المعدة جيدًا.
تجد الشركات التي خصصت ميزانية للذكاء الاصطناعي كتجربة إنتاجية أنها قللت من تكلفة الذكاء الاصطناعي كبنية تحتية تشغيلية.
لقد أصبحت المشكلة واضحة بما يكفي لتشكيل قرارات الشراء. استهلكت شركة Uber ميزانية Claude Code وCursor بالكامل لعام 2026 خلال أربعة أشهر.
ألغت شركة Microsoft تراخيص Claude Code في قسم التجارب والأجهزة، ويرجع ذلك جزئيًا إلى التكلفة. فاتورة الذكاء الاصطناعي للمؤسسة، والتي كانت تبدو في السابق وكأنها خطأ تقريبي، تظهر الآن كبند مادي في المراجعات ربع السنوية، وفقًا لـ فينشربيت.
ما الذي يجعل Gemini 3.5 Flash مختلفًا عن الموديلات الأرخص الأخرى؟
نماذج الذكاء الاصطناعي الأرخص ليست جديدة. شهد السوق موجة من الخيارات الأصغر والأسرع والأقل تكلفة في جميع المختبرات الرئيسية.
وما يميز اقتراح جوجل هو الجمع بين النموذج نفسه واقتصاديات البنية التحتية التي تقف وراءه.
وقال بيتشاي للصحفيين في مؤتمر صحفي سابق إن Gemini 3.5 Flash يطابق أداء الأنظمة المتطورة الأخرى بما يصل إلى ثلث السعر، وفقًا لما ذكره موقع “the verge”. Tecnologia.org. والادعاء هو أن الشركات لا تحتاج إلى التضحية بقدرتها بشكل كبير لتحقيق وفورات في التكاليف.
قامت Google أيضًا بتخفيض أسعار المستهلكين في نفس الحدث. انخفضت خطة الاشتراك AI Ultra، التي تتيح للمستخدمين الوصول إلى حدود استخدام أعلى ونماذج أكثر قدرة، من 250 دولارًا إلى 200 دولار شهريًا. تمت إضافة مستوى جديد بقيمة 100 دولار شهريًا للمطورين والمستخدمين المحترفين.
ومن المتوقع أن يتم إطلاق Gemini 3.5 Pro، أقوى طراز في العائلة، الشهر المقبل. تقول Google إنها تستخدمه بالفعل داخليًا وشهدت “تحسينات هائلة”.
صور فانجوي / جيتي
كيف توفر البنية التحتية لـ Google ميزة التكلفة الهيكلية
إن المطالبة بتوفير مليار دولار لن تنجح إلا إذا تمكنت Google بالفعل من توفير نماذج بتكاليف أقل من المنافسين.
يعتمد سبب حدوث ذلك على البنية التحتية. تصمم Google وحدات معالجة Tensor الخاصة بها من السيليكون، وتعمل على تطوير برنامج الرقائق هذا بقوة منذ سنوات.
وتعهدت الشركة بنفقات رأسمالية تصل إلى 190 مليار دولار في عام 2026، وهي زيادة كبيرة من 31 مليار دولار في عام 2022، وهو العام الذي تم فيه إطلاق ChatGPT وبدء السباق نحو الذكاء الاصطناعي التوليدي، وفقًا لـ الوطنية.
هذا النطاق من الاستثمار في البنية التحتية، إلى جانب ملكية المجموعة بأكملها، بدءًا من الرقائق إلى السحابة وحتى النماذج، يمنح Google مساحة أكبر للتحكم في تكاليف الاستدلال مقارنة بالمنافسين الذين يؤجرون الحوسبة من موردي الطرف الثالث.
التشبيه الذي يجريه Pichai هو مع بحث Google. لم يكن البحث ناجحًا لأنه كان محرك البحث الوحيد، بل لأنه كان سريعًا وفعالًا ورخيصًا بما يكفي للعمل على نطاق عالمي. الرهان في Gemini 3.5 Flash هو أنه يمكن تطبيق نفس الاقتصاد على استنتاج الذكاء الاصطناعي.
الأرقام الرئيسية حول ارتفاع تكاليف الذكاء الاصطناعي في Google وGemini 3.5 Flash:
- أزمة ميزانية الرمز المميز: تنفد ميزانيات رمز الذكاء الاصطناعي السنوية لدى الشركات بالفعل حتى مايو 2026؛ يقوم العملاء الرئيسيون بمعالجة ما يقرب من تريليون رمز يوميًا، وفقًا لـ جوجل توك
- تقدير التوفير: إن نقل 80% من أعباء عمل النموذج الحدودي إلى مزيج من Flash وfrontier يمكن أن يوفر للشركات أكثر من مليار دولار سنويًا، وفقًا لـ فينشربيت
- تغيرات الأسعار: تم تخفيض اشتراك AI Ultra من 250 دولارًا إلى 200 دولار شهريًا؛ تمت إضافة طبقة مطور جديدة بقيمة 100 دولار شهريًا؛ يتوفر Gemini 3.5 Flash على الفور عبر واجهات برمجة التطبيقات والمنتجات، وفقًا لـ عالم الأعمال
- مطالبة الأداء: يطابق Gemini 3.5 Flash أداء الطراز المتطور بما يصل إلى ثلث السعر، وفقًا لـ Tecnologia.org
- استثمار Google: تم الالتزام بما يصل إلى 190 مليار دولار أمريكي لعام 2026، ارتفاعًا من 31 مليار دولار أمريكي في عام 2022؛ نهج ثنائي الشريحة مع وحدات TPU المخصصة للتدريب والاستدلال، وفقًا لـ الوطنية
- نمو المستخدمين: تضاعف عدد مستخدمي جيميني إلى حوالي 900 مليون في العام الماضي، وأكد الوطني
- التالي: من المتوقع إصدار Gemini 3.5 Pro الشهر المقبل؛ وتقول جوجل إن الاختبارات الداخلية تظهر “تحسينات هائلة”، وفقًا لما ذكرته شركة جوجل مدونة جوجل I/O
ماذا يعني هذا بالنسبة للشركات التي تتخذ قرارات الإنفاق على الذكاء الاصطناعي الآن
ويأتي إعلان جوجل في وقت تضطر فيه صناعة الذكاء الاصطناعي إلى الإجابة على سؤال تجنبته خلال مرحلة التبني المبكر: ما هي تكلفة هذا بالفعل على نطاق واسع، وهل يستحق العائد ذلك؟
بالنسبة للشركات المقيدة حاليًا بعقود نموذجية باهظة الثمن، فإن عرض Gemini 3.5 Flash يعيد صياغة القرار كمسألة تتعلق بالميزانية بدلاً من مسألة القدرة. لا تتطلب كل مهمة النموذج الأقوى.
إن توجيه المهام الروتينية ذات الحجم الكبير إلى نموذج أرخص مع الاحتفاظ بالحوسبة الطرفية للتفكير المعقد هو نفس المنطق الذي طبقه مهندسو السحابة على مستويات الحوسبة لسنوات. تطبق Google هذا المنطق على الذكاء الاصطناعي.
والنتيجة الأوسع هي أن إدارة تكاليف الذكاء الاصطناعي أصبحت نظامًا في حد ذاته. الشركات التي تكتشف كيفية التوفيق بين قوة النموذج وتعقيد المهام، ستحظى بميزة التكلفة الهيكلية مقارنة بتلك التي تطبق النموذج الأقوى لكل شيء.
تقوم Google بوضع Gemini 3.5 Flash كأداة تجعل هذا التحسين ممكنًا. يعتمد تحقيق الوفورات كما تم الإعلان عنها على مدى رغبة الشركات المنضبطة في إعادة هيكلة سير عمل الذكاء الاصطناعي لديها حول التكاليف بدلاً من القدرة.
ذات صلة: Wells Fargo يجدد هدف سعر سهم Google بعد تغيير كبير في الذكاء الاصطناعي









