Sveriges mest populära poddar
النشرة الرقمية

ذاكرة الإنترنت إلى النسيان: أرشيف الويب مهدد بالاختفاء بين نهم الذكاء الاصطناعي وجشع الناشرين

8 min21 maj 2026

تتطرق نايلة الصليبي في "النشرة الرقمية" إلى التهديدات التي تواجة ذاكرة البشرية الرقمية ، ففي حال عدم الوصول إلى حلول، ستشهد البشرية تدمير أحد أهم أدوات حفظ التاريخ الرقمي، لأن اختفاء الأرشيفات المفتوحة لا يعني فقط فقدان صفحات ويب، بل فقدان جزء من الذاكرة الجماعية للعصر الرقمي.

أرشيف الإنترنت.. ذاكرة رقمية تواجه الخطر

يسعى Internet Archive إلى حماية مليارات صفحات الويب المهددة بالاختفاء. ففي مايو ۱۹۹٦، أسّس بريستر كاهل Internet Archive "أرشيف الإنترنت" بهدف حفظ محتوى الويب بأكمله إلى الأبد. وبعد ثلاثة عقود، أصبحت Wayback Machine"آلة الزمن" تخزن ۱۱٠بيتابايت من البيانات، وبلغ عدد صفحاتها المؤرشفة تريليون صفحة بحلول نهاية عام ٢٠٢٥. ويدير نحو ٢٠٠ شخص عملية الأرشفة من كنيسة سابقة في سان فرانسيسكو، جرى تحويلها إلى غرفة خوادم-"سيرفرز".

Wayback Machine الملاذ الأخير للمحتوى المحذوف

عندما حذفت إدارة الرئيس الأمريكي دونالد ترامب مئات الصفحات الحكومية في يناير ٢٠٢٥، كانت Wayback Machine المكان الوحيد الذي يمكن الوصول من خلاله إلى هذه المعلومات.ويعتمد الصحفيون عليها للكشف عن المقالات المعدّلة، ويستخدمها الباحثون لاسترجاع البيانات العامة المحذوفة، كما يلجأ إليها المواطنون لمعرفة ما أعلنه مسؤولوهم المنتخبون سابقًا. إلا أن هذا الدور بات اليوم مهددًا من جهات عدة.

الذكاء الاصطناعي يستنزف الأرشيف

تُعد شركات الذكاء الاصطناعي من أبرز أسباب هذا التهديد، إذ تستعين بأرشيفات Wayback Machine لتدريب نماذجها، خصوصًا عندما تُحجب عنها المواقع الأصلية. ويحتوي أرشيف الإنترنت على أكثر من تريليون صفحة ويب منذ عام ۱۹۹٦.

وتشكّل مقالات المؤسسات الإعلامية الكبرى كنزًا للمؤرخين والباحثين ومدققي الحقائق، لكنها تحولت أيضًا إلى مصدر مفتوح لشركات الذكاء الاصطناعي. وقد وثّقت شركة Originality AI إدراج جزء كبير من هذا الأرشيف ضمن مجموعات البيانات المستخدمة لتدريب النماذج الضخمة، من دون تفاوض على تراخيص أو دفع أي تعويضات.

أزمة التخزين تضاعف الضغوط

لا تقتصر التداعيات على الجانب المعلوماتي، إذ تسبب الذكاء الاصطناعي أيضًا في إنهاك سوق التخزين. فقد أكدت شركة Western Digital نفاد مخزونها من محركات الأقراص بسعات ٢۸و٣٠ تيرابايت طوال عام ٢٠٢٦، فيما تضاعفت الأسعار، بل تضاعفت ثلاث مرات أحيانًا، منذ سبتمبر ٢٠٢٥.

يواجه أرشيف الإنترنت هذه الأزمة بينما يستهلك ۱٠٠ تيرابايت يوميًا، معتمدًا بالكامل على التبرعات، شأنه شأن مؤسسة Wikimedia.

الناشرون يحجبون برامج الزحف

جاء السبب الثاني من ردّ دور النشر الإخبارية على استغلال شركات الذكاء الاصطناعي لأرشيف الإنترنت، عبر حجب برامج الزحف webcrawler التابعة لـمؤسسة Internet Archive.

فقد منعت أكثر من ۲٤٥مؤسسة إعلامية في ۹ دول الوصول إلى محتواها، واستهدف نحو ٢٠ منها برنامج ia_archiver bot، وهو برنامج الزحف الرئيسي webcrawler في Wayback Machine، لمنع وصوله تحديدًا.

كما انخفضت لقطات صفحات الأخبار بنسبة ۸۷ بالمئة بين مايو وأكتوبر ٢٠٢٥ ونتيجة لذلك، بدأت مئات الصحف المحلية تختفي من أرشيفات الويب، خصوصًا الصحف التابعة لشركة USA Today، أكبر ناشر للصحف الأمريكية.

خطر يهدد الذاكرة الجماعية

يرفض مارك غراهام، مدير Wayback Machine، تحميل مؤسسته المسؤولية، مؤكدًا أنها لا تدرب أي نماذج ذكاء اصطناعي، بل تقتصر مهمتها على تخزين البيانات وحفظها وإتاحتها، بينما تستغل شركات خارجية هذا المستودع عبر واجهات تقنية.

وأشار إلى أن الأرشيف اتخذ إجراءات فعلية، من بينها فرض قيود على التنزيلات الجماعية وحدود على الاسترجاع الآلي.

يحذر مارك غراهام من خطر آخر يتجاهله الإعلام، من بدون "آلة الزمن "  Wayback  Machine لن يترك أي مقال جرى تعديله بعد نشره، سواء بحذف اقتباس أو تصحيح خطأ أو إعادة كتابة فقرة ، أي أثر يمكن الرجوع إليه.

وتعكس هذه الأزمة معضلة حقيقية؛ إذ تُسرق أرشيفات وسائل الإعلام دون إذن لتغذية نماذج اللغة، لكن الضربة التي تُوجَّهها الوسائل الإعلامية ردًا على ذلك، تصيب أداة حفظ التاريخ لا شركات الذكاء الاصطناعي. فحجب أرشيف الإنترنت لا يحمي حقوق النشر، بل يهدد الذاكرة الجماعية، بينما تستطيع شركات الذكاء الاصطناعي إيجاد مصادر بديلة، في حين لا يملك المؤرخون بديلًا مماثلًا.

محاولات للإنقاذ وتوزيع الذاكرة عالميًا

تسعى بعض المؤسسات الإعلامية، مثل صحيفة The Guardian، إلى حل وسط عبر تقييد الوصول بدلًا من حجبه بالكامل. كما أطلقت منظمة Fight for the Future غير الحكومية عريضة وقّعها نحو مئة صحفي تندد بهذه القيود، في وقت لم تتعرض فيه الأرشيفات العامة لمثل هذا التهديد من قبل.

وفي مواجهة هذه الضغوط المتراكمة، أنشأت مؤسسة أرشيف الإنترنت مؤسسة جديدة في جامعة Saint-Gall بسويسرا في الخامس من مايو، داخل أرشيفات دير عريق يعود تاريخه إلى ألف عام. وتتعاون المؤسسة مع منظمة UNESCO وجامعة Saint-Gall في مشروع يهدف إلى حفظ نسخ من نماذج الذكاء الاصطناعي قبل إيقاف تشغيلها، لتوثيق ما كانت تعرفه هذه الأنظمة في لحظة زمنية محددة.

وتنضم هذه المبادرة إلى مؤسسة أرشيف الإنترنت الكندية ونظيرتها الأوروبية، ضمن استراتيجية تقوم على توزيع الذاكرة الرقمية عبر نطاقات قضائية وقارات وأطر قانونية متعددة، بما يجعل إغلاق هذه المكتبة العالمية بشكل مفاجئ أمرًا بالغ الصعوبة.

في ظل هذا الصراع المتصاعد بين شركات الذكاء الاصطناعي ووسائل الإعلام، يقف أرشيف الإنترنت في موقع بالغ الحساسية، فهو يحاول حماية ذاكرة الويب العالمية في وقت تتزايد فيه الضغوط التقنية والاقتصادية والقانونية من كل اتجاه. وبينما تبحث المؤسسات الإعلامية عن حماية محتواها، يبقى التحدي الحقيقي في إيجاد توازن لا يؤدي إلى تدمير أحد أهم أدوات حفظ التاريخ الرقمي، لأن اختفاء الأرشيفات المفتوحة لا يعني فقط فقدان صفحات ويب، بل فقدان جزء من الذاكرة الجماعية للعصر الرقمي.

يمكن الاستماع لـ "بودكاست النشرة الرقمية" على مختلف منصات البودكاست. الرابط للبودكاست على منصة أبل

للتواصل مع نايلة الصليبي عبر صفحة برنامَج"النشرة الرقمية"من مونت كارلو الدولية على لينكد إن وعلى تويتر salibi@  وعلى ماستودون  وبلوسكاي عبر موقع مونت كارلو الدولية مع تحيات نايلة الصليبي

Fler avsnitt av النشرة الرقمية

Visa alla avsnitt av النشرة الرقمية

النشرة الرقمية med مونت كارلو الدولية / MCD finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.