لقد قمنا جميعًا بإظهار ميزة “التجوّل الافتراضي” على خرائط Google لنظهر لصديق كيف كان يبدو منزل طفولتنا، أو أسقطنا رمزًا صغيرًا لشخصية ما في شوارع باريس لمعرفة ما إذا كنا قد حجزنا فندقًا في منطقة رائعة. تخيل أنك قادر على القيام بذلك، ولكن بطريقة أكثر غامرة وتفاعلية تسمح لك بمحاكاة الشارع والمناطق المحيطة به، وحتى ضبط الطقس أو رؤية كيف سيبدو في سيناريو “اليوم التالي للغد”.
يعد هذا أحد أهداف التكامل الأخير لـ Google. بدءًا من اليوم، يجمع Google DeepMind بين ميزة Street View وProject Genie، وهو النموذج العالمي للأغراض العامة للشركة والذي يمكنه إنشاء بيئات تفاعلية متنوعة. تم تقديم الميزة الجديدة في مؤتمر مطوري Google I/O.
قال جاك باركر هولدر، وهو عالم في فريق الانفتاح في DeepMind، لـ TechCrunch: “إنها قوية حقًا لكل من العميل (والروبوتات) وللبشر للعب بها، وكانت هذه دائمًا أطروحة الجني”.
وضرب مثالا بالروبوت الجديد المنتشر في لندن والذي نادرا ما يرى الشمس. يقول باركر هولدر إن جيني يمكنه محاكاة تلك المناسبات النادرة عندما تنعكس الشمس عن الغلاف الفيكتوري، لذلك لا تصدم الأشعة الروبوت عند حدوث ذلك.
وتابع: «في الوقت نفسه، يمكنك أن تقول: أنا ذاهب إلى نيويورك، ولكن ليس في هذا الوقت من العام». “”سيكون هناك ثلج. أريد أن أرى كيف تبدو هذه الكتلة في الثلج.””
تقوم جوجل بجمع بيانات التجوّل الافتراضي منذ 20 عامًا من خلال السيارات المجهزة بالكاميرات والأشخاص المربوطين بـ “حقائب الظهر المخصصة للتعقب”. جمعت شركة التكنولوجيا العملاقة أكثر من 280 مليار صورة من 110 دولة وسبع قارات.
قال جاك: “بفضل ميزة التجوّل الافتراضي، أصبح لدينا صور من عدد كبير من الأماكن حول العالم”. “يمكنك أن تتخيل مدى قوة الجمع بين هذا المصدر الغني للمعلومات والبيانات الواقعية مع القدرة على محاكاة العوالم.”
في أغسطس الماضي، أصدرت جوجل أحدث نموذج عالمي لـ Genie 3 لأغراض البحث، وفي يناير أتاحت الأداة لمشتركي Google AI Ultra في الولايات المتحدة، مما يسمح للعملاء بإنشاء عوالم ألعاب تفاعلية باستخدام الرسائل النصية أو الصور. الهدف هو استخدام Genie للأغراض التعليمية والألعاب والتدريب على الروبوتات.
Genie 3 يساعد بالفعل في الحصول على القوة أحد محاكيات Waymo تدريب سياراتها ذاتية القيادة على “الأحداث النادرة للغاية” مثل الأعاصير والمواجهات العرضية مع الأفيال. يمكن أن تساعد إضافة بيانات Street View إلى هذا المزيج Waymo على الاستعداد لإطلاقه في المزيد من المدن حول العالم.
لدى Waymo جهاز محاكاة خاص بها، حيث توسعت في 11 مدينة أمريكية واختبرت برنامج تشغيل الذكاء الاصطناعي الخاص بها في عدة مدن أخرى. يقول باركر هولدر إن الفرق مع الجني هو أن الأمر كله يأتي من وجهة نظر السيارة. تتيح لك ميزة Street View ليس فقط محاكاة العالم المثبت في مكان حقيقي، ولكن أيضًا نقل وجهة النظر إلى أنواع أخرى من الوكلاء، على سبيل المثال. إنسان أو روبوت.
بدءًا من اليوم، تطرح Google ميزة Street View في Genie لبعض مستخدمي Ultra في الولايات المتحدة، مع طرح إمكانية الوصول تدريجيًا. وفقًا للشركة، سيتمكن مستخدمو Global Ultra من الوصول في الأسابيع القليلة المقبلة.
هدف الباحثين هو وضع هذه القدرة الجديدة في متناول أكبر عدد ممكن من الأيدي، وفقًا لدييجو ريفاس، مدير المنتج في DeepMind. ونبه إلى أن ميزة Street View بشكل خاص وGenie بشكل عام ما زالتا في مرحلة تجريبية، لذا هناك مجال كبير للتحسين من حيث الدقة.
في العينات التي أظهرها لي فريق Google – بما في ذلك محاكاة تحت الماء للمنطقة التي كنت أعيش فيها – كانت النتائج مثيرة للإعجاب ويمكن التعرف عليها، ولكنها لا تزال تتمتع بجودة ألعاب الفيديو بدلاً من جودة الصور الواقعية. النماذج ليست على دراية بالفيزياء بعد، مما يعني أنها لا تفهم السبب والنتيجة بعد. على سبيل المثال، في محاكاة لامرأة تجري عبر شجرة جوشوا المغطاة بالثلوج، ركضت عبر الصبار والشجيرات.
قارن ذلك بمولد الصور Nano Banana من Google، والذي يمكنه الآن إنشاء نص رائع للرسوم البيانية، أو بمولد الفيديو من Veo، الذي يفهم أن القوارب الورقية تطفو على تيارات المياه، والدخان يتصاعد في الهواء، والنسيج يحجب الأشكال.
لم يتم ترميز الفيزياء في هذه النماذج؛ إنهم يتعلمون ذلك بشكل حدسي مع مرور الوقت من خلال الملاحظة السلبية، تمامًا كما يفعل أي كائن حي.
وقال باركر هولدر: “أعتقد أنه مع هذا النوع من النماذج، يمكن أن يكون التأخر عن الفيديو من حيث الدقة والجودة من ستة إلى 12 شهرًا، لذلك أعتقد أن هذه مشكلة سنحلها”.
وقال جوناثان هربرت، مدير خرائط جوجل الذي انضم إلى فريق التجوّل الافتراضي كمتدرب منذ 12 عامًا، إن شركة جيني ليست قادرة بعد على إنشاء إعادة بناء حقيقية للشارع. وهو يعتقد أن الاختراق الحقيقي هو الاستمرارية المكانية للذكاء الاصطناعي. إذا قمت بالتدوير 360 درجة، فإن الذكاء الاصطناعي يتذكر بشكل صحيح ويحاكي البيئة خلفك. ومن هذه النقطة فصاعدًا، يستطيع النموذج بناء بيئة جديدة فوقه.
قال هربرت: “لقد كنا نتساءل منذ فترة طويلة عن كيفية بناء أفضل وأغنى نموذج للعالم استنادًا إلى بيانات ميزة Street View”. “لقد كانت بالتأكيد فكرتنا لفترة طويلة لاستخدام بيانات الخرائط بطرق جديدة ولأنواع جديدة من أبحاث الذكاء الاصطناعي.”
عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. وهذا لا يؤثر على استقلالنا التحريري.











