جوجل تعيد تصميم Gemini AI لكسر “جدار النص العملاق”

لقد اقترب عصر سجلات الدردشة الخاصة بالذكاء الاصطناعي من نهايته.

أصدرت شركة جوجل للتو نسخة جديدة من مساعدها AI، التوائموالذي يعيد التفكير بشكل جذري في واجهة الاستجابة السريعة التي كانت الدعامة الأساسية للسنوات الأولى من الذكاء الاصطناعي التوليدي المتاح على نطاق واسع.

بدلاً من قيام المستخدمين بكتابة الأسئلة أو الطلبات وتلقي ردود مكتوبة مفصلة – “جدار النص العملاق”، كما تقول Jenny Blackburn، رئيسة UI/UX في Gemini – ستستجيب Gemini الآن بمجموعة متنوعة من المحتوى، بدءًا من العناصر المرئية الغنية إلى العناصر التفاعلية والتخطيطات الرسومية الشبيهة بالمجلات. اعتمادًا على الطلب أو الاستعلام، سوف يستجيب الجوزاء بشكل طبيعي بالمستوى الأكثر ملاءمة من التفاصيل في تنسيق العرض الذي يتناسب مع السياق بشكل أكبر.

(الصورة: جوجل)

يقول بلاكبيرن: “يبدو الأمر وكأنك تتصفح سجل الدردشة الذي لا نهاية له، وتشعر وكأن الواجهة تتكيف بشكل عضوي مع المعلومات التي يتم إنشاؤها”.

تم الإعلان عنه في مؤتمر مطوري Google السنوي، جوجل آي/أوتعد إعادة تصميم Gemini تغييرًا كبيرًا في واجهة مستخدم الذكاء الاصطناعي في السوق الشامل. مع حوالي 900 مليون مستخدم شهريًا، تعد Gemini إحدى الطرق الرئيسية التي يتفاعل بها الأشخاص مع الذكاء الاصطناعي بشكل مباشر.

حتى الآن، كانت هذه التفاعلات مقيدة بمعلمات تنسيق الدردشة، وهي محادثة محرجة في بعض الأحيان قد تتطلب طرح سؤال وإعادة طرحه على الذكاء الاصطناعي لإرجاع كتلة مفيدة من المعلومات غير المجنونة. تم تصميم تطبيق Gemini الجديد وتجربة سطح المكتب على أساس القدرة على التكيف، مع عناصر تحكم وميزات أكثر سهولة، والمزيد من الطرق لإدخال المعلومات أو التفاصيل الجانبية في استجابات سريعة وأكثر مرونة.

(الصورة: جوجل)

يقول بلاكبيرن: “نعتقد أنه مع زيادة قدرة هذه التكنولوجيا، يجب أن تصبح الواجهة أكثر بساطة”. “بدلاً من أن تتعلم كمستخدم البرنامج وتتكيف معه، كما كان الحال دائمًا مع البرنامج، فإننا نرى حقًا مستقبلًا حيث يتكيف البرنامج مع المستخدم ويأخذ احتياجاته الخاصة في الاعتبار.”

اعتمد بلاكبيرن وفريقه على الكثير من البيانات وتعليقات المستخدمين لتوجيه تدخلاتهم. كان الطلب الرئيسي من المستخدمين هو أن يتمكنوا من التبديل بسهولة بين أوضاع الإدخال، والانتقال من كتابة استعلام إلى التحدث وتحميل المستندات أو الصور المرجعية.

يقول بلاكبيرن: “إن تعدد الوسائط مهم جدًا”. “نرى، خاصة على الهواتف، أن الأشخاص يستخدمون الكاميرا كثيرًا لإعطاء السياق لـ Gemini. كما أنهم يحبون حقًا التبديل بين الصوت والكتابة. وكانوا يخبروننا أنك بحاجة إلى تسهيل ذلك.” يعمل Gemini المعاد تصميمه على تبسيط واجهة الكتابة من خلال عرض مربع النص ولوحة المفاتيح فقط أثناء المطالبات المكتوبة، ويحتوي على قائمة منفصلة مع شبكة بسيطة من الرموز لاختيار أشكال أخرى من الإدخال.

(الصورة: جوجل)

يقول بلاكبيرن إن إعادة تصميم Gemini كانت فرصة لإعادة تشكيل تجربة الذكاء الاصطناعي، حيث لم تقدم فقط لمعانًا سطحيًا ولكن أيضًا هيكل تصميم أكثر تفكيرًا يدعم عملية طلب الاستجابة وتلقيها برمتها. طورت هي وفريقها مفهومًا مرئيًا لبرج الجوزاء الجديد يشير إلى حركة الطاقة على المستوى الذري والوحدات البسيطة المترابطة التي تعمل معًا كنظام.

وتقول: “هذه إشارة دقيقة إلى ما يحدث خلف الزجاج. وتهدف إلى التقاط الزخم السائل للنموذج أثناء معالجته للبيانات”. أطلقوا على لغة التصميم الناتجة اسم Neural Expressive. وتقول: “أردنا أن نخلق إحساسًا برؤية الخلايا العصبية تنشط”.

ويظهر هذا بعدة طرق، بدءًا من الخلفية المتحركة التي تم إنشاؤها إجرائيًا على شاشة الاستعلام الرئيسية وحتى الحركة في القائمة عندما يستمع النظام إلى استعلام أو يعالج معلومات.

تتحكم لغة التصميم أيضًا في كيفية عرض استجابات جيميني في ذلك التخطيط المرئي الذي يكسر جدران النص، ويعطي المعلومات تسلسلًا هرميًا وينظمها بطريقة تسهل معالجة كميات كبيرة من المعلومات.

بالنسبة للاستعلام النموذجي، يتم عرض إجابة بسيطة وشاملة في أعلى الصفحة، مع معلومات إضافية مقدمة في تخطيطات سهلة الفهم، مثل أجزاء من النص مقسمة بواسطة صور أو مقاطع فيديو مضمنة، ورموز نقطية تلخص النتائج الرئيسية.

يقول بلاكبيرن: “لقد تم تصميم كل تغيير قمنا به بالفعل لجعله أكثر قابلية للفحص، وتقليل إرهاق القراءة، وتسهيل التعمق في المحتوى بشكل أسهل وأسهل”.

ومن ناحية الصور، فإن جزءًا مما سيعرضه Gemini للمستخدمين سيكون صورًا حقيقية، مثل صور المنتجات الحقيقية ردًا على استعلام الشراء. وفي أحيان أخرى، كما هو الحال عندما يقوم الرسم التخطيطي بعمل أفضل من النص في شرح مفهوم علمي، سيتم إنشاء الصور على الفور باستخدام Google نانوبانانا مولد الصور بالذكاء الاصطناعي.

يقول بلاكبيرن إن وظيفة Gemini الإضافية هذه تعمل دون زيادة التحميل على النظام أو استغراق الوقت للرد على الاستعلام. وتقول: “فكرت في الأمر: لا يمكن أن يكون الأمر أبطأ. إذا اضطر الناس إلى الانتظار، فستكون مقايضة صعبة للغاية”. “لقد أجرينا الكثير من الاختبارات الصارمة للتأكد من أن هذه الاستجابات ليست أبطأ لأنها تحتوي على هذه السمات الجديدة.”

تختلف إعادة تصميم Gemini تمامًا عن واجهة الذكاء الاصطناعي النموذجية بحيث يمكن أن تضع معيارًا جديدًا. على أقل تقدير، سيجعل ذلك من Gemini أداة ذكاء اصطناعي أقل صرامة بالنسبة للعديد من مستخدميها.

يقول بلاكبيرن: “إنه ليس مجرد تحديث تجميلي. إنه في الحقيقة نوع من إعادة تصور عميق للتجربة”. “بما أن الاستجابات أصبحت أكثر ملاءمة لاحتياجات المستخدم، فإنها ستغير كيفية استخدامهم للمنتج.”

رابط المصدر