يبدو أن سماعات الأذن اللاسلكية ظهرت من العدم. أصبحت هذه السماعات مشهورة بفضل سماعات AirPods من شركة Apple، وأصبحت فجأة في كل مكان – في مترو الأنفاق، في متجر البقالة، في أذني الشخص الذي يجلس مقابلك – حتى في مكان ما على طول الطريق، أصبحت شيئًا يرتديه الجميع تقريبًا دون تفكير.
هل يمكن لهذه الشعبية أن تجعل سماعات الأذن أفضل من النظارات الذكية للذكاء الاصطناعي؟ هذه هي الحصة وراء VueBuds، وهو نموذج أولي طوره باحثون في جامعة واشنطن، حيث قاموا بتركيب كاميرا بحجم حبة الأرز في كل سماعة أذن لزوج قياسي من سماعات الأذن اللاسلكية من سوني. والنتيجة هي مساعد بصري للذكاء الاصطناعي يختبئ على مرأى من الجميع: انظر إلى علبة الطعام واسأل عن عدد السعرات الحرارية الموجودة فيها، واحصل على أداة مطبخ غير مألوفة واحصل على إجابة في حوالي ثانية.
يقوم النظام بمعالجة الصور الموجودة على الجهاز ويستجيب عبر نماذج الذكاء الاصطناعي المتصلة – لا يتطلب استخدام السحابة ولا يتم تخزين الصور.
يعتقد فريق UW أنه أول من قام بدمج الكاميرات مباشرة في سماعات الأذن اللاسلكية التجارية.
لا تتذكر سماعات الأذن أي شيء، ولكن من المحتمل أن الأشخاص من حولك لا يعرفون ذلك. هذا التوتر هو جوهر ما ابتكره فريق جامعة ويسكونسن ويطرح سؤالاً يأخذه الباحثون على محمل الجد: ما هي الأعراف الاجتماعية عندما تكون الكاميرات مدمجة في أشياء لا يفهمها أحد أنها كاميرات؟
إجابة الفريق هي التركيز أكثر على تقليل جمع البيانات. تتم معالجة الصور والتخلص منها؛ لم يبق شيء. لكن النظام لا يعطي أي إشارة خارجية للمشاهدين إلى وجود كاميرا، وهو ما يعترف الباحثون بأنه يمثل تحديًا مفتوحًا أكثر من كونه تحديًا تم حله.
ولكسب الثقة في مثل هذه التكنولوجيا، قال باحثون وخبراء بارزون مثل بول جي. مارويتشي كيم، طالب الدكتوراه في جامعة ويسكونسن في كلية ألين لعلوم الكمبيوتر والهندسة، إن الخصوصية لا يمكن أن تكون فكرة لاحقة.
وقال كيم: “نحن لا نؤيد حفظ الصور”. “إن الهدف الأساسي منها هو ربط المحادثة بين الشخص والوصول إلى الذكاء الاصطناعي أثناء التنقل، خاصة في السيناريوهات التي لا تتطلب استخدام اليدين.”
وتدور الحجة المركزية الأخرى للفريق حول عامل الشكل، وهو يمثل تحديًا واضحًا لشركة Meta، التي أمضت سنوات وأنفقت ملايين الدولارات في محاولة لجعل نظارات الكاميرا منتجًا رئيسيًا.
موقف فريق جامعة ويسكونسن هو أن النظارات الذكية لن تتخلص أبدًا من أعبائها الاجتماعية تمامًا: ذاكرة Google Glass، وعدم الراحة من الرؤية، والإشارات المرئية التي تشير إلى أن مرتديها قد اختار شيئًا لم يكن معظم الناس ليختاروه. سماعات الأذن ليس لها مثل هذا التاريخ.
وقال كيم: “منذ البداية، لم نرغب في أن نكون مرتبطين بذلك”.
لتثبيت الكاميرات في سماعات الأذن، كان من الضروري حل مشكلة الطاقة أولاً. تستهلك الكاميرات طاقة أكثر بكثير من الميكروفونات، لذلك اختار الفريق مستشعرًا منخفض الطاقة يلتقط حوالي إطارًا واحدًا في الثانية بالأبيض والأسود – وهو بطيء وفقًا لمعايير الفيديو، ولكنه سريع بما يكفي لأسلوب الأسئلة والأجوبة في المحادثة التي كان الباحثون في ذهنهم.
تميل الكاميرات إلى الخارج بمقدار 5 إلى 10 درجات، مما يوفر مجال رؤية يتراوح بين 98 إلى 108 درجة، ويتم تجميع الصور من كلتا سماعات الأذن في إطار واحد قبل المعالجة، مما يقلل أوقات الاستجابة بحوالي ثانية واحدة.
تتراوح التطبيقات من العملية إلى الحرجة. ويمكن للنظام قراءة النص الموجود على أغلفة المواد الغذائية وتحديد الأشياء وترجمة اللغة الكورية المكتوبة. ولكن بالنسبة للأشخاص الذين يعانون من ضعف الرؤية أو إعتام عدسة العين، فإن التأثير يكون أكثر عمقا.
تلقى الفريق أكثر من اثنتي عشرة رسائل بريد إلكتروني من أشخاص يعانون من إعاقات بصرية يصفون الغرض الذي سيستخدمونه من أجله: فهم تعبيرات الوجه، وقراءة الكتب، ومشاهدة التلفزيون – وهي مهام لا يمكن لأدوات الذكاء الاصطناعي الحالية دعمها بسهولة دون استخدام اليدين، وبطريقة محيطة.
يرى كيم مجموعة محرومة أخرى في القوى العاملة. غالبًا ما لا يتوقف الكهربائيون والسباكون والعاملون في البيئات الصناعية عن إخراج هواتفهم في منتصف العمل – حيث يتم تثبيت تركيب الأنابيب في مكانه، وهو سلك حي يتطلب كلتا اليدين.
بالنسبة لهؤلاء العمال، فإن المساعد البصري الذي يمكن طلبه صوتيًا ولا يتطلب لمس الشاشة هو الفرق بين الوصول إلى الذكاء الاصطناعي وعدم الحصول عليه على الإطلاق.
وقال كيم: “هناك الكثير من الوظائف العمالية حيث لا يستطيع هؤلاء الأشخاص الاستفادة من التطورات الحديثة في الذكاء الاصطناعي”. “لا يمكنهم إخراج هواتفهم والتقاط صورة.”
يعد التأطير بدون استخدام اليدين منتشرًا على نطاق واسع: الجراحون والطهاة وأي شخص حاول اتباع وصفة بأيدٍ مبتلة.
يظل النظام تجريبيًا وغير متاح للشراء. وقال شيام جولاكوتا، الأستاذ في مدرسة ألين وكبير الباحثين في المشروع، إن اهتمام شركات التكنولوجيا كان كبيرًا، ويمكن أن تصل سماعات الأذن المجهزة بالكاميرا إلى المستهلكين في غضون بضع سنوات.
وفيما يتعلق بالتكلفة، فإن جولاكوتا متفائل. وقال إن مستشعر الكاميرا نفسه يمكن أن يعمل بأقل من دولار على مستوى المكونات، مما يعني أنه على نطاق إحدى الشركات المصنعة الكبرى للإلكترونيات الاستهلاكية، فإن علاوة السعر مقارنة بسماعات الأذن القياسية ستكون متواضعة.
يشير رقم 10 دولارات الذي نقلته جولاكوتا إلى تقدير أكثر تحفظًا لأحجام الإنتاج الأصغر.
قال جولاكوتا: “ما نفعله في الجامعات هو إظهار أنه يمكنك حل المشكلات التقنية. “ثم نوضح الطريق لهذه الشركات وغيرها لتقول إن هذا ممكن بالفعل.”











