تعمل Microsoft على توسيع قائمتها من نماذج الذكاء الاصطناعي الداخلية، حيث تطلق نظامًا جديدًا لتحويل الكلام إلى نص وتجعل نموذجين موجودين متاحين على نطاق واسع للمطورين لأول مرة.
تعد تحركات Microsoft AI (MAI) جزءًا من جهد أوسع تبذله الشركة لتوسيع قدرات الذكاء الاصطناعي الخاصة بها بما يتجاوز شراكتها مع OpenAI، مما يمنح Microsoft مزيدًا من التحكم في مصيرها في المنافسة ضد Google وAmazon وغيرهما.
مايكروسوفت أعلن قدم يوم الخميس MAI-Transcribe-1، وهو نموذج لتحويل الكلام إلى نص، والذي يقول إنه الأكثر دقة المتاحة حاليًا. أصدرت الشركة أيضًا نماذجها الحالية لتوليد الصوت والصورة، والمعروفة باسم MAI-Voice-1 وMAI-Image-2، للاستخدام التجاري على نطاق واسع.
هذا هو أول إصدار رئيسي لنموذج من Microsoft منذ إعادة التنظيم في مارس التي أعلنها الرئيس التنفيذي ساتيا ناديلا، والتي تحول فيها الرئيس التنفيذي لشركة Microsoft AI مصطفى سليمان بعيدًا عن الإشراف اليومي لمساعد الطيار للتركيز على تطوير النماذج الحدودية والذكاء الفائق.
سليمان قال الحافة يعمل نموذج النسخ “بنصف تكلفة وحدة معالجة الرسومات للنماذج الحديثة الأخرى”. هو قال لـ VentureBeat تم إنشاء هذا النموذج بواسطة فريق مكون من 10 أشخاص فقط، وتخطط Microsoft في النهاية لبناء نموذج لغة كبير رائد ليكون “مستقلًا تمامًا” إذا لزم الأمر.
كما ذكرت GeekWire الأسبوع الماضي، قامت Microsoft مؤخرًا بتعيين الرئيس التنفيذي السابق لمعهد Allen علي فرهادي وغيره من كبار الباحثين في مجال الذكاء الاصطناعي من المعهد الذي يقع مقره في سياتل لتعزيز فريق سليمان بشكل أكبر.
تم تصميم MAI-Transcribe-1 للتعامل مع مواقف العالم الحقيقي الصاخبة مثل مراكز الاتصال وقاعات المؤتمرات، وتقول Microsoft إنها تختبر التكامل مع Copilot وTeams. تقول Microsoft إنها تقدم أفضل أداء من حيث السعر لأي مزود سحابي رئيسي، وتتنافس مباشرة مع Whisper من OpenAI وGemini من Google على معيار FLEURS.
في مشاركة مدونةووصف سليمان النموذج بأنه “ليس الأكثر دقة فحسب، بل أيضا بسرعة البرق”.
يُنشئ MAI-Voice-1 كلامًا يبدو طبيعيًا ويتيح الآن للمطورين إنشاء أصوات مخصصة من مقتطفات قصيرة من عينة الصوت. MAI-Image-2 موجود في المراكز الثلاثة الأولى في لوحة صدارة إنشاء الصور Arena.ai وهو رائج في Bing وPowerPoint.
الثلاثة متاحة على Microsoft Foundry Developer AI Platform وMAI Playground.












