تشكل نماذج الرؤية واللغة والحركة أحدث ما توصلت إليه التكنولوجيا في مجال التلاعب بالروبوتات. ما زالوا غير قادرين على التقاط شريحة البطاطس دون سحقها.
هذه هي النتيجة التي نشرها الفريق في وقت سابق من هذا العام لمس نموذج تشغيل الفيديو (فتام). بالنسبة لمهمة التقاط شرائح البطاطس ووضعها – وهي مهمة تتطلب وعيًا عالي الدقة بالقوة حيث لا تستطيع الرؤية وحدها التمييز بين القبضة الساحقة والإمساك بها – تفوق أداء VTAM على خط الأساس π0.5 بنسبة 80%. وفي مجموعة مقارنة أوسع مع عدد كبير من جهات الاتصال، بلغ متوسط معدل نجاح VTAM 90%.¹
تعتبر الشريحة مثالًا عدائيًا ولهذا فهي الاختبار المناسب. في لحظة الالتقاط، فإن ديناميكيات الاتصال فقط هي التي تحمل إشارات مفيدة. إن الضغط والاهتزاز والقوة/عزم الدوران يخبران السياسة بما يحدث، ويصححان أخطاء التقدير البصري التي لا تستطيع نماذج الرؤية فقط اكتشافها بمفردها. الكاميرا، مهما كانت دقتها عالية، لا يمكنها القيام بذلك.
اللمس ليس حلاً للتوصيل والتشغيل
لا تعمل أجهزة استشعار اللمس في حد ذاتها على تحسين أداء النموذج. تعتمد معظم مسارات التعلم الحديثة على الرؤية واللغة؛ طريقتان مع أكبر مجموعات البيانات والبنى الأكثر نضجا. عندما يتم تضمين إشارات اللمس في مسار الرؤية دون تصميم متعمد، فإنها تميل إلى أن تصبح خفيفة الوزن أو محشورة أو مفقودة أثناء التدريب. يعمل VTAM لأن البنية تجبر النموذج على التنبؤ بديناميكيات الرؤية واللمس في نفس الوقت، وبالتالي فإن إشارة اللمس تشكل السياسة المستفادة بشكل مباشر بدلاً من استيعابها بواسطة الصورة واللغة. لا تكون لبيانات اللمس قيمة إلا عندما يتم تضمينها بذكاء.
وهذا النمط ثابت الآن في جميع الأدبيات
الشريحة هي أحد طرفي الطيف، وهي الحالة التي تفشل فيها الرؤية تمامًا وينقل اللمس وحده الإشارة. تقع معظم مهام العالم الحقيقي ضمن هذا النطاق، حيث تساهم الرؤية واللمس على حد سواء، والتآزر بين الاثنين هو ما يدفع فعالية التدريب. وهذا النمط ثابت الآن في جميع الأدبيات.
VTAM ليس وحده. ال مانيسكيل-فيتاك 2025 يقوم المعيار بإضفاء الطابع الرسمي على التقييم المعزز عن طريق اللمس للمهام التي تنطوي على الإدراج، واستخدام الأداة، والتجميع الدقيق. وأظهرت الأبحاث المستقلة حول تكوينات أجهزة الاستشعار اللمسية وفعالية التعلم الاستيعابية² نفس الزيادة. تتفوق المبادئ التي تجمع بين الرؤية والتغذية المرتدة اللمسية باستمرار على نظيراتها التي تعتمد على الرؤية فقط في المهام التي تتطلب اتصالًا عاليًا وتحقق عادةً نفس عتبة النجاح مع عدد أقل من العروض التوضيحية.
اكتشاف الفشل هو الجائزة الثانية
يسجل مبدأ اللمس المشروط الانزلاق الأولي كتوقيع اهتزازي يتراوح مدته من عشرات إلى مئات المللي ثانية قبل أن يتحرك الجسم فعليًا. هذه النافذة هي الفرق بين الاستعادة وإعادة التشغيل الكامل – في أي مكان من 95% إلى 99% من الوقت الذي يتم فيه التشغيل على نفس الخط. من الصعب تجاهل المشكلة التشغيلية عبر الأسطول.
يعد اكتشاف الفشل أحد أكبر الفرص: إنشاء ملصقات دقيقة وعالية الدقة تمثل ما حدث بالفعل أثناء الالتقاط. تعمل تسمية النجاح/الفشل الثنائية على طي المعلومات التي يمكن استخدامها في مسار التدريب. هل كانت عملية الالتقاط ناجحة، أم أنها كانت عبارة عن انزلاق داخلي سمح لوحدة التحكم بالتعافي؟ هل استقرت السلعة بشكل آمن أم أنها تغيرت أثناء الشحن؟ يمكن لحاسة اللمس التمييز بين هذه الحالات، ويمكن لإدراك الاتصال المدمج الإبلاغ عنها على الجهاز، وتحويل كل حلقة إلى مثال تدريبي أكثر إفادة، وليس فقط تلك التي حدثت بشكل خاطئ.
الشكل 1. يجمع VTAM بين نموذج اللغة، والنموذج التنبؤي للعالم البصري واللمسي، وسياسة التشغيل القائمة على النشر. وبعد 10 دقائق فقط من التشغيل عن بعد لكل مهمة، يتعلم التنبؤ بالإجراءات والحالات والقوى المستقبلية، مما يتيح مهام عالية الاتصال مثل التقاط الشريحة ووضعها، والمسح الديناميكي والتقشير المستقر. مصدر: أرخايف:2603.23481.
ماذا يعني هذا بالنسبة للبناة؟
لقد تحول استشعار اللمس من كونه وظيفة إضافية مفيدة إلى مطلب يمكن الدفاع عنه لأي فريق يستهدف التلاعب بمستوى الإنتاج والاتصال العالي. السؤال لم يعد ما إذا كان يجب استخدام الصك. ما إذا كان سيتم تنفيذ الأدوات الآن أو الدفع لاحقًا في شكل مجموعات بيانات مُعاد بناؤها ونماذج مُعاد معايرتها.
أبلغت VTAM عن الأرقام الحقيقية حول هذا الموضوع، ونقاط عمل أخرى حديثة في نفس الاتجاه. سيتم بناء الجيل القادم من النماذج الأساسية على البيانات التي تلتقط الاتصال، وليس الرؤية فقط.
هل أنت مستعد للخطوة التالية؟
تحدث إلى فريقنا الفني حول تكامل اللمس في عملية المعالجة ومعرفة المزيد عن كيفية القيام بذلك يمكن لـ Robotiq تمكين التطبيق الخاص بك.
¹نموذج إجراء اللمس بالفيديو (VTAM)، أرخايف:2603.23481.
² تشمل النتائج التمثيلية الروبوتات التي تعمل باللمس: الآفاق (أرخايف) ونشر أعمالًا حول تأثير تكوينات مستشعر اللمس على فعالية تعلم الاستيعاب.












