معهد ألين للذكاء الاصطناعي (أ2) جيلًا جديدًا من نموذجها اللغوي الكبير الرائد، المصمم ليكون أكثر قدرة على المنافسة مع عمالقة الصناعة والأكاديميين.
منظمة غير ربحية مقرها سياتل الكشف عن أولمو 3مجموعة من نماذج اللغات المفتوحة التي يُقال إنها تتفوق في الأداء على النماذج المفتوحة بالكامل مثل MARIN من جامعة ستانفورد والنماذج التجارية مفتوحة الوزن مثل Meta’s Llama 3.1.
تم تصميم الإصدارات السابقة من OLMO في المقام الأول كأدوات علمية لفهم كيفية بناء نماذج الذكاء الاصطناعي. مع Olmo 3، تعمل AI2 على توسيع نطاق تركيزها، حيث تضع النماذج كأنظمة قوية وفعالة وشفافة مناسبة للاستخدام في العالم الحقيقي، بما في ذلك تطبيقات الأعمال.
وقال علي فرهادي، الرئيس التنفيذي لشركة AI2، في بيان صحفي صباح الخميس أعلن فيه عن النماذج الجديدة: “يثبت Olmo 3 أن الانفتاح والأداء يمكن أن يسيرا معًا”.
وهذا جزء من التطورات الأوسع في عالم الذكاء الاصطناعي. في العام الماضي، بدأت النماذج المفتوحة القوية بشكل متزايد من الشركات والجامعات بما في ذلك ميتا، وديب سيك، وكوين، وستانفورد، في منافسة أداء الأنظمة الاحتكارية من شركات التكنولوجيا الكبرى.
تم تصميم العديد من أحدث النماذج المفتوحة لإظهار منطقها خطوة بخطوة – والتي يطلق عليها عادةً نماذج “التفكير” – والتي أصبحت معيارًا رئيسيًا في هذا المجال.
تقوم AI2 بإصدار Olmo 3 في عدة إصدارات: Olmo 3 Base (نموذج الأساس الأساسي)؛ تعليمات Olmo 3 (جاهزة لاتباع تعليمات المستخدم)؛ Olmo 3Think (مصمم لإظهار تفكير أكثر وضوحًا)؛ وOLMO3 RL Zero (نموذج تجريبي تم تدريبه على التعلم المعزز).
تكتسب النماذج المفتوحة زخمًا بين الشركات الناشئة والشركات التي تريد المزيد من التحكم في التكاليف والبيانات، بالإضافة إلى رؤية واضحة لكيفية عمل التكنولوجيا.
تتابع AI2 نموذج Olmo 3 من خلال إطلاق “تدفق النموذج” الكامل خلفه – مجموعة من اللقطات التي توضح كيفية تقدم النموذج خلال كل مرحلة من مراحل التدريب. بالإضافة إلى ذلك، ستسمح أداة Olmotrace المحدثة للباحثين بربط الخطوات المنطقية للنموذج بالبيانات المحددة وقرارات التدريب التي أثرت عليها.
فيما يتعلق بالطاقة وكفاءة التكلفة، تقول AI2 إن نموذج Olmo الأساسي الجديد أكثر كفاءة في التدريب بمقدار 2.5 مرة من Meta’s Llama 3.1 (على أساس كل ساعة GPU، تتم مقارنة قاعدة Olmo 3 بنموذج Meta 8B بعد التدريب). يأتي جزء كبير من هذه الفائدة من تدريب OLMO3 على عدد أقل بكثير من الرموز المميزة مقارنة بالأنظمة المماثلة، وفي بعض الحالات أقل بست مرات من النماذج المنافسة.
ومن بين التحسينات الأخرى، يقول AI2 أن Olmo 3 يمكنه قراءة أو تحليل مستندات طويلة جدًا في وقت واحد، مع دعم لإدخال ما يصل إلى 65000 رمزًا، أي ما يعادل طول فصل صغير من كتاب.
تأسست Ai2 في عام 2014 على يد المؤسس المشارك الراحل لشركة Microsoft بول ألين، وتعمل منذ فترة طويلة كمنظمة غير ربحية تركز على الأبحاث، وتقوم بتطوير أدوات ونماذج مفتوحة المصدر بينما تستحوذ المختبرات التجارية الأكبر على الأضواء. اتخذ المعهد عدة خطوات هذا العام لرفع مستوى مكانته مع الحفاظ على مهمته المتمثلة في تطوير الذكاء الاصطناعي لحل أكبر المشكلات في العالم.
في أغسطس، تم اختيار AI2 من قبل مؤسسة العلوم الوطنية وNvidia لمبادرة تاريخية بقيمة 152 مليون دولار لبناء نماذج ذكاء اصطناعي متعددة الوسائط مفتوحة بالكامل للبحث العلمي، مما يسمح للمعهد بالعمل كمساهم رئيسي في العمود الفقري للذكاء الاصطناعي في البلاد.
كما أنها بمثابة الشريك التكنولوجي الرائد لتحالف Cancer AI Alliance، حيث تساعد فريد هاتش وغيره من مراكز السرطان الكبرى في الولايات المتحدة على تدريب نماذج الذكاء الاصطناعي على البيانات السريرية دون الكشف عن سجلات المرضى.
Olmo 3 متوفر الآن على Hugging Face و ملعب Ai2 النموذجي,












