- تتعرض آلة Wayback. مرة أخرى للتهديد من قبل الذكاء الاصطناعي
- لقد أدى ازدهار الذكاء الاصطناعي إلى مضاعفة سعر محركات الأقراص الصلبة الكبيرة اللازمة لدعم أرشيف الشبكة الموسع هذا ثلاث مرات
- يعد هذا تهديدًا آخر لـ Wayback Machine، والتي تواجه أيضًا مشكلة بسبب قيام وسائل الإعلام بحظر الزاحف الخاص بها، والذي يحدث مرة أخرى بسبب الذكاء الاصطناعي.
إنه وقت يائس بشكل متزايد لأولئك الذين يحاولون تسجيل تاريخ الويب، حيث أثبت الذكاء الاصطناعي مرة أخرى أنه عقبة رئيسية أمام جهود شركات مثل Internet Archive – وهذه المرة يتعلق الأمر بالارتفاع الكبير في أسعار محركات الأقراص الثابتة.
ربما تتذكر أننا ناقشنا الشهر الماضي من منظور مختلف الصعوبات التي يسببها الذكاء الاصطناعي لآلة Wayback الخاصة بأرشيف الإنترنت. هذا هو تاريخ هذه الشبكة غير الربحية. والمشكلة هي أنه كجزء من الجهود الرامية إلى إحباط الزحف إلى محتوى الذكاء الاصطناعي، تعمل المواقع الإخبارية على الإنترنت على نحو متزايد على حظر برامج زحف الويب التي يستخدمها أرشيف الإنترنت لتجميع لقطات شاشة لصفحات الويب الخاصة بالأرشيف.
والآن، 404 تقارير إعلامية (بواسطة معدات توم) أن أرشيف الإنترنت يعاني من نقص في محركات الأقراص الثابتة المعتمدة على الذكاء الاصطناعي (لأن مراكز البيانات تحتاج إلى المزيد من محركات الأقراص الكبيرة لدعم أعباء عمل الذكاء الاصطناعي).
نعم، إن طفرة الذكاء الاصطناعي لا تقتصر فقط على تناول LLMs (نماذج اللغات الكبيرة) لذاكرة الوصول العشوائي (RAM) ومحركات أقراص الحالة الصلبة (SSD)، ولكن أيضًا على محركات الأقراص الثابتة (بالإضافة إلى التأثير بشكل غير مباشر على المكونات الأخرى).
إن محركات الأقراص الصلبة الضخمة – التي تصل سعتها إلى 30 تيرابايت – التي يحتاجها أرشيف الإنترنت لتخزين بيانات Wayback Machine التاريخية، أصبحت الآن أكثر تكلفة بما يصل إلى ثلاثة أضعاف أو حتى غير متوفرة تمامًا. وبالتالي، فإن طفرة الذكاء الاصطناعي أصبحت الآن “مشكلة حقيقية للغاية تكلفنا الوقت والمال”، كما علق مؤسس أرشيف الإنترنت بروستر كالي لـ 404 ميديا.
من خلال مكتبة تضم ما يقرب من 210 بيتابايت (210.000 تيرابايت) من لقطات موقع الويب، والتي تنمو بمقدار 100 تيرابايت يوميًا، يمكنك تقدير مدى أرشفة الويب التي تتم هنا.
يُقال إن مؤسسة ويكيبيديا، المؤسسة غير الربحية الأم لويكيبيديا، تعاني من مشكلات مماثلة كما قد تتخيل. يحتوي على ما يقرب من 65 مليون مقالة، وهو ما يشغل مساحة كبيرة على القرص. صرح متحدث باسم مؤسسة ويكيميديا لـ 404 Media أن المشكلات الرئيسية هي “شراء الذاكرة والأقراص الصلبة”، ولكن أيضًا الوقت اللازم لتسليم الخادم.
التحليل: هناك الكثير من الحلول – ولكن ماذا عن الشريط اللاصق؟
هل آلة Wayback في خطر حقًا؟ هل سنرى “التاريخ الحي للإنترنت” يبدأ بالابتعاد عن الواقع؟ حسنًا، لا يوجد تهديد فوري، لأنه من الواضح أن الجهات المانحة والمجتمع المحيط بـ Wayback Machine يجتمعون معًا لحل مشكلة ارتفاع تكاليف الركوب.
ومع ذلك، من الواضح أن هذه مشكلة مستقبلية، كما أن حظر زاحف أرشيف الإنترنت يعد أكثر خطورة. تكمن المشكلة في أن المواقع الإخبارية تحجب عمليات الاستخلاص باستخدام الذكاء الاصطناعي، ولكن يمكن تجاوز هذه الحجب إذا كان مالك الذكاء الاصطناعي يستهدف المحتوى عبر Wayback Machine بدلاً من ذلك. هذه مسألة حساسة، لكن المحادثات مستمرة وآمل أن يجد الجانبان حلاً.
أما بالنسبة لمحرك الأقراص، إذا كنت تتساءل عن سبب عدم قدرتك على التبديل إلى أرشيف الإنترنت الشريط كوسيلة تخزين، المهم هو أنه أرشيف “حي” للويب – مثل الإنترنت، مما يسمح للأشخاص بالوصول إلى لقطات من صفحات الويب عند الطلب. لذلك، هناك حاجة إلى محركات الأقراص الثابتة للوصول سريع الاستجابة. في هذه الحالة، الشريط ببساطة لا يستطيع التعامل مع الأداء.
يستخدم أرشيف الإنترنت الشريط لإنشاء نسخ احتياطية طويلة المدى للمحتوى، لكنه في هذا الصدد ليس سوى جزء من اللغز. تعد محركات الأقراص الثابتة ضرورية للتشغيل اليومي لـ Wayback Machine كما نعرفها، لأنها تتيح للمستخدمين تقديم المحتوى الذي يحتاجونه على الإنترنت بسرعة.
أفضل أجهزة الكمبيوتر المحمولة لكل ميزانية
اتبع TechRadar على أخبار جوجل و أضفنا كمصدرك المفضل لتلقي أخبار ومراجعات وآراء الخبراء حول قنواتك.











