- قدمت جوجل برنامج Gemini Omni Flash
- ويهدف إلى جعل إنشاء الفيديو أسهل من خلال السماح للمستخدمين بتحسين مشاريعهم بشكل طبيعي بدلاً من استخدام برامج التحرير
- ويؤكد على الشفافية والأمن من خلال العلامات المائية للذكاء الاصطناعي وحماية الهوية
تهدف خطوة Google الكبيرة التالية في مجال الذكاء الاصطناعي إلى الإبداع بشكل مباشر. كشفت الشركة عن Gemini Omni في Google I/O 2026 كجزء من مجموعة ضخمة من ميزات Gemini الجديدة.
تم تصميم Omni للجمع بين قدرات Gemini الاستدلالية وأدوات إنشاء الوسائط المتعددة التي يمكنها إنشاء المحتوى وتحريره بتنسيقات متنوعة.
الإصدار الأول، Gemini Omni Flash، يركز على الفيديو وله هدف طموح للغاية. تريد Google من الأشخاص إنشاء محتوى استنادًا إلى أي نوع من المدخلات تقريبًا، سواء كان ذلك يبدأ بالنص أو الصور أو الصوت أو الفيديو الموجود.
أصبح Gemini Omni Flash متاحًا عبر تطبيق Gemini، Google Flow، YouTube Shorts وYouTube Create، مع التخطيط لتوسعة أوسع للمطورين وعملاء المؤسسات في المستقبل.
يعتمد هذا الإعلان على العمل الذي قامت به Google بالفعل بشأن العناصر المرئية التي تم إنشاؤها بواسطة الذكاء الاصطناعي. في عام 2025، قامت Nano Banana بتوسيع قدرات التصوير لدى Gemini وأصبحت أداة عملية بشكل مدهش لكل شيء بدءًا من استعادة الصور الفوتوغرافية القديمة وحتى تحويل الرسومات الأولية إلى مفاهيم مصقولة.
Gemini Omni هي محاولة Google لدفع هذه الفكرة إلى أبعد من ذلك بكثير. وصفت الشركة برنامج Gemini Omni بأنه وسيلة لاستبدال برامج التحرير التقليدية بمحادثة يمكنها تحسين الفيديو بشكل مستمر.
تحرير المحادثة
إحدى أكبر أفكار Gemini Omni هي إزالة التعقيد من التحرير. وتقول جوجل إن المستخدمين يمكنهم تعديل مقاطع الفيديو باستخدام اللغة الطبيعية، والحفاظ على الاتساق بين التغييرات.
تظل الشخصيات معروفة. تحافظ المشاهد على الاستمرارية. تظل الحركة ثابتة بدلاً من إعادة الضبط في كل مرة تتغير فيها المطالبة. تم تصميم النظام أيضًا لفهم كيفية تصرف الأشياء في العالم المادي بشكل أفضل، بما في ذلك تحسين التعامل مع الحركة والجاذبية وديناميكيات الحركة.
هذه هي الطريقة التي تتموج بها المرآة الموجودة فوقها مثل السائل عندما يلمسها شخص ما، أو هذه هي الطريقة التي يمكنك من خلالها بناء منحوتة فقاعية. تحاول Google وضع Gemini Omni كشيء أكبر من مجرد مولد فيديو.
وهذا يضع Google في المنافسة المتنامية بسرعة حول أدوات وسائط الذكاء الاصطناعي. لكن السباق مستمر لجعل أدوات الفيديو المدعومة بالذكاء الاصطناعي بديهية بدرجة كافية بحيث يرغب الأشخاص العاديون في استخدامها مثل أي شيء آخر. يبدو أن استجابة Google محادثة.
في نهاية المطاف، قالت جوجل إن Gemini Omni يتجاوز الفيديو. من المتوقع أن تدعم الإصدارات المستقبلية مجموعات من الصور وتلميحات الأدوات والموسيقى والمراجع في مشروع واحد.
الثقة في إبداعات الذكاء الاصطناعي
ويشكل الذكاء الاصطناعي الإبداعي القوي تحديًا للثقة، كما اعترفت جوجل. تود الشركة التأكيد على أن مقاطع الفيديو التي تم إنشاؤها باستخدام Gemini Omni تستخدم تقنية العلامة المائية SynthID، المصممة لتحديد الوسائط الناتجة عن الذكاء الاصطناعي. وتقول الشركة أيضًا إن أدوات التحقق الخاصة بها ستعمل عبر Gemini وChrome وSearch كجزء من جهود الشفافية الأوسع.
سيتمكن المستخدمون في البداية من إنشاء صور رمزية للفيديو بناءً على أنفسهم، بما في ذلك أصواتهم. ومع ذلك، تظل القدرات المتقدمة التي تتضمن تعديل الكلام قيد التقييم بينما تعمل Google على مراعاة الاعتبارات الأمنية.
ويعكس هذا النهج الحذر عملية التوازن المتزايدة الصعوبة التي تواجه كل شركة كبرى في مجال الذكاء الاصطناعي. إن بناء أنظمة أكثر كفاءة لا يعني بناء الثقة فيها بالتوازي.
اتبع TechRadar على أخبار جوجل و أضفنا كمصدرك المفضل لتلقي أخبار ومراجعات وآراء الخبراء حول قنواتك.
أفضل أجهزة الكمبيوتر المحمولة للأعمال لكل ميزانية










