يعد RynnBrain التابع لشركة Alibaba وSeedance 2.0 من ByteDance من بين أنظمة الذكاء الاصطناعي الصينية الجديدة

تقف علي بابا في المؤتمر العالمي للذكاء الاصطناعي في مركز شنغهاي للمعارض العالمية في 5 يوليو 2024 في شنغهاي، الصين.

نورفوتو نورفوتو جيتي إيماجيس

وبينما تركز الأسواق الأمريكية على تأثير الأدوات المجسمة والإيثارية في البرمجيات والخدمات المالية، أصدرت شركات التكنولوجيا العملاقة في الصين نماذج للذكاء الاصطناعي هذا الأسبوع أظهرت تقدما في مجال الروبوتات وإنشاء الفيديو.

بابامنشئ TikTok ByteDance ومنصة الفيديو القصير كويشووقد أصدرت جميعها نماذج جديدة للذكاء الاصطناعي توضح كيف تواكب الشركات الصينية نظيراتها في الولايات المتحدة

صرح ديميس هاسابيس، رئيس شركة Google DeepMind، لشبكة CNBC أن نماذج الذكاء الاصطناعي الصينية تتخلف عن المنافسين الغربيين ببضعة أشهر فقط.

وتتنافس هذه النماذج من الصين بشكل مباشر مع نماذج توليد الفيديو مثل Sora من OpenAI، بالإضافة إلى نماذج الروبوتات. نفيديا و جوجل.

وهنا المتهدمة من النماذج.

علي بابا RynnBrain

أكاديمية دامو علي بابا كشف هذا الأسبوع النقاب عن RynnBrain، وهو نموذج للذكاء الاصطناعي مصمم لمساعدة الروبوتات على فهم العالم المادي من حولهم وتحديد الأشياء.

وفي عرض فيديو تجريبي، أظهرت شركة علي بابا روبوتًا مزودًا بكماشات للأيدي يبدو أنه قادر على عد البرتقال والتقاطه ووضعه في سلة. ويظهر أيضًا الحليب الذي يتم إخراجه من الثلاجة.

يتطلب التواصل مع النماذج تدريبًا مكثفًا لتمكينهم من التعرف على الأشياء اليومية، مما يعني أن المهام البسيطة مثل قطف الفاكهة يمكن أن تشكل تحديًا في مجال الروبوتات.

RynnBrain تتنافس الآن مع أمثال علي بابا نفيديا و جوجل الأشخاص الذين يقومون ببناء نماذج الذكاء الاصطناعي الخاصة بهم للروبوتات.

وقالت أدينا ياكيفو، الباحثة في Hugging Face، لـ CNBC: “أحد ابتكاراتها الرئيسية هو الوعي المدمج بالزمان والمكان”.

“بدلاً من مجرد الاستجابة للمدخلات الفورية، يمكن للروبوت أن يتذكر متى وأين وقعت الأحداث، ويتتبع تقدم العمل، ويستمر عبر خطوات متعددة. وهذا يجعله أكثر موثوقية وتماسكًا في بيئات العالم الحقيقي المعقدة.”

وأضاف ياكيفو أن “الطموح الأكبر” لشركة علي بابا هو “إنشاء طبقة ذكاء أساسية للأنظمة المجسدة”.

الجلسة 2.0 من ByteDance

Seedance 2.0 هو نموذج AI لتوليد الفيديو قادر على إنشاء فيديو واقعي من مجرد رسالة نصية من المستخدم. ولكن يمكن أن تحتوي المطالبات أيضًا على مقاطع فيديو وصور أخرى.

تعرض مقاطع الفيديو التي تم إنشاؤها باستخدام Seedance 2.0 ومراجعتها بواسطة CNBC صورًا ومقاطع فيديو واقعية جدًا تم إنشاؤها بالكامل باستخدام الذكاء الاصطناعي.

استخدم بيلي بومان، الذي يقيم في ستوكهولم بالسويد ويدير وكالة إعلانات إبداعية تنتج محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي، Sedence 2.0.

وقال إن إنتاج فيديو الذكاء الاصطناعي قد حقق تقدمًا كبيرًا في العامين الماضيين مع التحسينات السريعة في جميع أنحاء الصناعة.

وقال بومان في مقابلة على قناة سي إن بي سي: “في عام 2023… كان من الصعب جعل شخص ما يركض أو يمشي. أي نوع من الواقع كان (مقتصرًا) على مقاطع قصيرة جدًا، كل شيء كان بطيئًا للغاية، وملمس سيئ، ولا يوجد ملمس للجلد، ونقص في التفاصيل. الآن انقلب السيناريو. الآن يمكنني فعل أي شيء. لا شيء استثنائي، تقدم تكنولوجي”.

وأضاف Yakefu من Hugging Face أن نموذج Sideense 2.0 أظهر تقدمًا مقارنة بالجيل السابق في “إمكانية التحكم والسرعة وكفاءة التصنيع”.

“يعد Sidence 2.0 واحدًا من أفضل نماذج إنشاء الفيديو التي اختبرتها حتى الآن. لقد فاجأني حقًا بتقديم نتائج مرضية من المحاولة الأولى، حتى مع مطالبة بسيطة. قال Yakefu: “تجتمع العناصر المرئية والموسيقى والتصوير السينمائي معًا بطريقة تبدو مصقولة دون أن تكون تجريبية”.

ومع ذلك، في حين أن المستخدمين يقدرون هذه التكنولوجيا، فقد واجه Sideense مشاكل. وسائل الإعلام الصينية المحلية تقرير طرحت شركة Sedens ميزة تسمح للذكاء الاصطناعي بإنشاء صوت الشخص بناءً على الصورة التي يقوم بتحميلها. يأتي ذلك بعد أن أثار أحد المدونين في الصين مخاوف بشأن توليد الصوت دون موافقة.

ولم يكن ByteDance متاحًا على الفور للتعليق عندما اتصلت به CNBC.

كويشور كلينج 3.0

تم إصدار Kuaishou’s Kling 3.0 الأسبوع الماضي، وهو نموذج آخر لتوليد الفيديو ينافس ByteDance.

يتميز Kling 3.0″ بترقيات كبيرة في التوافق، والإخراج الواقعي، ومدة فيديو ممتدة تصل إلى 15 ثانية، وتوليد الصوت الأصلي بلغات ولهجات ولهجات متعددة.

وقال كوايشو إن النموذج متاح فقط للعملاء الذين يدفعون الثمن، ولكنه سيكون متاحًا للجمهور قريبًا.

يعد نجاح Kuaishou مع نموذج Kling عاملاً رئيسيًا وراء الزيادة التي تزيد عن 50% في سعر سهمها خلال العام الماضي.

أيقونة الرسم البياني للأسهمأيقونة الرسم البياني للأسهم

Kuaishou يقسم التاريخ من السنة

إصدارات رئيسية أخرى لنماذج الذكاء الاصطناعي

Zhipu AI — العمل كما هو شهدت شركة أطلس المعرفة للتكنولوجيا، ومقرها هونج كونج، ارتفاعًا في أسهمها يوم الخميس بعد إطلاق GLM-5، وهو نموذج مفتوح المصدر واسع اللغة يتمتع بقدرات ترميز محسنة ومهام وكيل طويلة الأمد.

نموذج للمنظمة الأنثروبي كلود أوبوس يقترب من 4.5 في بعض الاختبارات تفوقت على Google Gemini 3 Pro في معايير الترميز. ولم تتمكن CNBC من التحقق من هذه الادعاءات.

كما قفزت أسهم Minimax بعد ذلك يوم الخميس طرح M2.5 المحدث نموذج مفتوح المصدر مع أدوات وكيل الذكاء الاصطناعي المتقدمة. يشير مصطلح “الوكيل” أو “الذكاء الاصطناعي الوكيل” إلى أدوات الذكاء الاصطناعي المصممة لأتمتة المهام.

ساهم في هذا التقرير أنيك باو وديلان بوتس من سي إن بي سي.

رابط المصدر

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا