كيفية أرشفة موقع على شبكة الإنترنت: دليل الماموث الخاص بنا لحفظ موقعك

A VPN is an essential component of IT security, whether you’re just starting a business or are already up and running. Most business interactions and transactions happen online and VPN

تتضمن صيانة موقع الويب الخاص بك وجود إستراتيجية مخصصة للنسخ الاحتياطي . في حين أن النسخ الاحتياطية ضرورية ، فهي ليست الطريقة الوحيدة للحفاظ على موقعك. الامتداد الطبيعي للنسخ الاحتياطي هو أرشفة موقع ويب – على الرغم من أنها عمليات تكميلية.

هناك عدة طرق مرنة لأرشفة موقع ويب. والخبر السار هو أنها كلها سهلة الاستخدام ويمكن الوصول إليها. عليك فقط اختيار الحل المناسب لاحتياجاتك ومتطلباتك.

في هذا المنشور ، سنلقي نظرة على كيفية أرشفة موقع ويب. سنستكشف أيضًا أنواع أرشفة مختلفة ستصادفك ، ونجمع بعضًا من أبرز أدوات أرشفة المواقع ، ونناقش بعض النصائح لأرشفة موقعك.

مقدمة لأرشفة المواقع الإلكترونية

أرشفة موقع على شبكة الإنترنت تعني حفظ المحتوى والبيانات والوسائط للرجوع إليها في المستقبل. باستخدام خدمة مخصصة مثل Wayback Machine (على الرغم من أننا سنصل إلى حلول أخرى لاحقًا) ، يمكنك عرض الإصدارات القديمة من موقع الويب.

موقع Kinsta من عام 2015 ، معروض في Wayback Machine.

كيف بدا موقع Kinsta في عام 2015 – لقد قطعنا شوطًا طويلاً!

على المستوى التقني ، تأخذ برامج الزحف لقطات من موقع الويب ، والذي يشكل الأرشيف نفسه. يمكنك الوصول إليه باستخدام تقويم بسيط وعرض كل تكرار بتنسيق مخطط زمني إذا كنت ترغب في ذلك.

أرشيف التقويم من Wayback Machine لموقع Kinsta.

أرشيف تقويم The Wayback Machine لموقع Kinsta على الويب.

بالنسبة لسبب وجود حلول مثل Wayback Machine ، علينا العودة إلى أوائل العقد الأول من القرن الحادي والعشرين. لقد انفجرت فقاعة الدوت كوم. كانت العديد من الشركات تتدهور. تم إغلاق بعض المواقع الشهيرة أو هجرها ، مع ترك القليل من الذكريات وراءها.

مثل الكثير من تنسيقات الوسائط الأخرى قبل الإنترنت ، مثل الموسيقى والتلفزيون ، كانت لهذه المواقع قيمة تاريخية وحنين إلى الماضي. كان المقصود بإنقاذها إعطاء مستخدمي الإنترنت في المستقبل لمحة عن المدى الذي وصلنا إليه عن التكنولوجيا السابقة.

على أرشيف الإنترنت أطلقت آلة ايباك لمساعدة الحفاظ على المواقع. إذا تم أرشفة موقع ما هناك ، يمكنك أن ترى كيف تطور الموقع على مر السنين.

هناك حاجة إلى العديد من برامج الزحف لأرشفة موقع الويب ، بما في ذلك عمليات الزحف الفردية الضخمة التي قد تستغرق سنوات حتى تكتمل. إن النخر المطلوب لإجراء “رحلات استكشافية” الزحف وتخزين اللقطات الناتجة هائل.

على سبيل المثال ، تم تشغيل أول خادم 100 تيرابايت (TB) لشركة Wayback Machine في عام 2004. وبحلول نهاية عام 2020 ، قامت Wayback Machine بتخزين أكثر من 70 بيتابايت (PB) من البيانات . هذا أكثر من 70000 تيرابايت.

ومع ذلك ، لا يشعر الجميع بالراحة تجاه العمل الذي يقوم به أرشيف الإنترنت. كانت هناك العديد من المناقشات والتحديات القانونية بناءً على ما إذا كان أرشيف موقع ويب يكسر مشكلات حقوق النشر الحالية.

ومع ذلك ، نظرًا للنمو الكبير في عدد المحفوظات المخزنة ، هناك رغبة واضحة في الحفاظ على مواقع الويب.

جاهز لأرشفة موقعك؟ 👀 خبر سار: إنها عملية سهلة الاستخدام بشكل معقول. 😄 الجزء الأكثر أهمية هو اختيار الحل المناسب لاحتياجات ومتطلبات موقعك. شاهد جميع الخيارات هنا ⬇️

انقر للتغريد

لماذا تريد أرشفة موقع على شبكة الإنترنت

هناك الكثير من الأسباب التي تجعلك ترغب في أرشفة موقع ويب ، بخلاف أسباب الحنين إلى الماضي. لتشبيه العالم الحقيقي ، انظر إلى GitHub .

موقع GitHub.

تشبه البنية التحتية لـ GitHub إلى حد كبير أرشيف الإنترنت.

يقوم Github بتخزين مستودعات المشروع ، جنبًا إلى جنب مع كل “التزام” يتم إجراؤه. لمقارنة ذلك بالأرشفة على الإنترنت ، تمثل المستودعات الأرشيف بأكمله ، والالتزامات هي اللقطات.

بنفس الطريقة التي تعتبر بها مستودعات Git قيمة ، كذلك يكون الأرشيف. على سبيل المثال ، يمكنك إلقاء نظرة على التكرارات السابقة لموقعك – ​​حتى منذ سنوات عديدة مضت – للتأثير على اختيارات التصميم الحالية.

أيضًا ، قد تكون ملزمًا قانونًا بأرشفة موقعك ، خاصة إذا كنت تعمل في المجالات المالية أو القانونية.

أخيرًا ، إذا كنت مؤسفًا بما يكفي للمشاركة في التقاضي المحيط بموقعك ، فستكون أرشيفاتك دليلًا قيمًا. إذا كان بإمكانك تقديم أرشيفات واضحة وكاملة للموقع ، فيمكنك التخلص من النزاعات حتى قبل أن تتدخل المحاكم.

الفرق بين النسخ الاحتياطية والأرشفة

قبل أن نتحدث عن الأنواع المختلفة لأرشفة الويب المتاحة ، يجدر بنا العودة إلى موضوع تطرقنا إليه سابقًا. على الورق ، تظهر نسخة احتياطية للموقع وأرشيف موقع الويب متشابهين. ومع ذلك ، فإنهم يؤدون وظائف مختلفة تكمل بعضها البعض. شيء صغير:

النسخ الاحتياطية تعتمد على البيانات. إنهم مهتمون أكثر بالحفاظ على بيانات موقعك. نظرًا لأن النسخ الاحتياطية ضرورية إذا كنت بحاجة إلى استعادة موقعك ، فإن وجود نسخة احتياطية كاملة من بياناتك أمر بالغ الأهمية.

المحفوظات تحافظ على السياق على البيانات. إذا قمت بالبحث في أرشيف موقع الويب المفضل لديك ، فستلاحظ أن الوظيفة غالبًا ما تكون غير مكتملة. ومع ذلك ، فإن تصميم الموقع والمحتوى الثابت عادة ما يكونان سليمين.

تجدر الإشارة إلى أن الأرشفة لا تتطلع إلى تجنب جهود الحفاظ على البيانات تمامًا. في الواقع ، تتمثل إحدى الفوائد في السماح للمستخدمين بالانتقال إلى موقعك كما لو كان مباشرًا. ومع ذلك ، نظرًا لوجود مواقع مثل Wayback Machine باعتبارها “حارة ذاكرة” افتراضية ، فإن الحفاظ على المرئيات سليمة يأخذ أولوية أعلى من الحفاظ على وظائف الواجهة الخلفية.

باختصار ، سترغب في استخدام كل من النسخ الاحتياطية والمحفوظات لموقعك – ​​الأول كحماية يومية في حالة حدوث الأسوأ ، والأخيرة كطريقة إضافية للمساعدة في توثيق تطور موقعك.

الأنواع المختلفة لأرشفة الويب التي ستواجهها

أرشفة الويب لا تأتي فقط في نكهة واحدة. هناك عدة أنواع مختلفة ستصادفك. فيما يلي تفصيل لكل:

من جانب العميل: يتضمن المستخدم النهائي حفظ نسخة من موقع الويب المعني. إنه بسيط وقابل للتطوير ويتيح لك أرشفة موقع ويب دون أي ضجة.

من جانب الخادم: تم تصنيف طريقة Wayback Machine وغيرها على أنها أرشفة من جانب الخادم. تستخدم برامج الزحف وتقنيات أخرى لأرشفة موقع ويب ، ولكنها تتطلب أيضًا مستوى من الموافقة غير موجود في الأرشفة من جانب العميل.

قائم على المعاملات: بينما لا يزال هذا يعتمد على الأرشفة من جانب الخادم ، إلا أنه أكثر تعقيدًا ويتطلب موافقة صريحة من مالك الموقع. بشكل أساسي ، يقوم بأرشفة معاملات الموقع بين المستخدم النهائي والخادم.

بالنسبة إلى مواقع الويب البسيطة التي تحتوي على بيانات ثابتة ، إلى جانب استراتيجية أرشفة منظمة ، يجب أن تتناسب الأرشفة من جانب العميل مع الفاتورة. ومع ذلك ، فإن معظم المواقع الأخرى تفضل الأرشفة من جانب الخادم – الأرشفة القائمة على المعاملات ليست ضرورية لمعظم مواقع الويب.

أخيرًا – وسنناقش هذا بمزيد من التفصيل في جميع أنحاء المنشور – سترغب أيضًا في التفكير في مكان وكيفية تخزين أرشيفاتك . على سبيل المثال ، الأرشيف المحلي ليس خيارًا سيئًا ، ولكن يمكنك رؤيته يختفي إذا كان لديك فشل في الكمبيوتر. على الجانب الآخر ، لديك سيطرة أقل على ما تم أرشفته إذا اخترت حل جهة خارجية.

كما تتوقع ، فإن الإجابة هنا هي استخدام نهج متعدد الأوجه لأرشفة موقع ويب. نقترح التعامل مع الأرشيفات مثل النسخ الاحتياطية: احتفظ بثلاث نسخ مختلفة في مواقع منفصلة وقم بمزامنتها بطريقة ما.

قد ترغب في جعل أحد الأرشيفات نشطًا أيضًا ، بحيث يمكنك الاستفادة من أي وظيفة من جانب الخادم على موقعك. والنتيجة هي موقع ويب يحتوي على إستراتيجية نسخ احتياطي وأرشفة قوية تظل مفيدة للآخرين.

دليل المبتدئين لأدوات ومواقع أرشيف الإنترنت

هناك عدد كبير من الحلول المتاحة لأرشفة موقع ويب. سنستعرض بعضًا من أكثرها شعبية ، جنبًا إلى جنب مع رأينا حول الكيفية التي قد تناسبك.

1. آلة Wayback

موقع ويب The Wayback Machine.

آلة Wayback.

أولاً ، دعنا نناقش آلة Wayback . كان الأول من نوعه ، لذا فقد وضع معيارًا لأدوات الأرشفة الأخرى.

على هذا النحو ، من المحتمل أن يكون المركز الأول عند البحث عن أرشفة موقع ويب. لديها العديد من الطرق لإنشاء وتحميل المحفوظات ، وحتى واجهة برمجة تطبيقات مخصصة للربط بوظائفها. تجدر الإشارة إلى أنه حل أرشيف من جانب الخادم أيضًا.

ومع ذلك ، نظرًا لكيفية قيامه بالزحف إلى مواقع الويب وأرشفتها ، قد لا تتمكن Wayback Machine من الحفاظ على جميع وظائف موقعك. ومع ذلك ، فهو يعتبر المعيار الصناعي لأرشيفي الويب ، وهو مجاني تمامًا للتشغيل. سنوضح لك كيفية أرشفة موقع ويب بمزيد من التفاصيل باستخدام Wayback Machine لاحقًا في هذه المقالة.

2. Archive.today

موقع Archive.today.

موقع Archive.today.

التالي هو Archive.today . إنه مشابه من نواح كثيرة لجهاز Wayback Machine – حتى وصولاً إلى تصميم الموقع “القديم” تقريبًا. تقع خوادم البيانات الخاصة بها في أوروبا ، لكنها تقترب من الأرشفة بشكل مختلف عن Wayback Machine.

بالنسبة للمبتدئين ، لا يعتمد Archive.today على برامج الزحف التي تعمل عبر الويب. بدلاً من ذلك ، تقوم بتقديم عناوين URL الخاصة بك وتوافق على التضمين في الأرشيف. إلى جانب ذلك ، فإن قائمة ميزاته هي عظام عارية أكثر من الحلول الأخرى. لا توجد سياسة حذف قوية ، على سبيل المثال ، وتستبعد عملية الأرشفة وسائط وأنواع ملفات معينة.

ومع ذلك ، فهو مجاني ومناسب إذا كنت تريد مكانًا مجانيًا لتخزين المحفوظات. يحتوي الموقع أيضًا على وظيفة بحث للعثور على المواقع المؤرشفة مسبقًا.

3. هيريتريكس

موقع هيريتريكس.

موقع هيريتريكس.

لقد ذكرنا أرشيف الإنترنت وآلة Wayback بشكل متبادل تقريبًا في هذا المنشور حتى الآن. على الرغم من ذلك ، فإن Wayback Machine هي خدمة واحدة فقط ، ويقدم Internet Archive بعض منتجات الأرشفة الأخرى بخلاف ذلك. Heritrix هي أداة مجانية مفتوحة المصدر ولدت من تعاون بين Internet Archive ومكتبات الشمال.

إنه في الأساس زاحف ويب بدلاً من أداة أرشفة كاملة الميزات. ومع ذلك ، يمكنك تجميع جميع النتائج التي تم الزحف إليها معًا. بينما لم يكن هذا هو الحال في الماضي ، تستخدم Wayback Machine الآن Heritrix للزحف إلى المواقع لتضمينها في موقعها الخاص. علاوة على ذلك ، يستخدم عدد كبير من المكتبات والمؤسسات هيريتريكس لبناء الأرشيفات.

على الرغم من ميزاته الرائعة ، يتطلب تثبيت Heritrix بعض المعرفة الفنية. لا توجد واجهة سهلة الاستخدام لتثبيتها لك ، لذلك ستحتاج إلى معرفة Git و GitHub وسطر الأوامر .

كما هو الحال مع الحلول المماثلة الأخرى ، فإن Heritrix مجاني تمامًا للاستخدام ، لذا فهو مناسب كحل للأرشفة الذاتية منخفض التكلفة.

4. طبقة تكامل أرشفة الويب (WAIL)

موقع ويب طبقة تكامل أرشفة الويب (WAIL).

موقع ويب طبقة تكامل أرشفة الويب (WAIL).

إذا كنت تبحث عن Heritrix لأرشفة موقع ويب ، ولكنك تتأخر بسبب المعرفة التقنية المطلوبة ببساطة لتثبيت البرنامج ، فهناك حل محتمل لك. في طبقة الويب الأرشفة التكامل (وائل) هو الحرة والمفتوحة المصدر عبر منصة التطبيق سطح المكتب والتي تمنحك المستخدم الرسومية وظيفية واجهة (GUI) لاستخدام، جنبا إلى جنب مع المثبت.

الخبر السار هو أن Heritrix هو محرك الزحف الخاص بـ WAIL. هذا يعني أنه يمكنك الاستفادة من قوة Heritrix دون الحاجة إلى عبور GitHub وسطر الأوامر. بالإضافة إلى ذلك ، يستخدم WAIL محرك OpenWayback “لإعادة تشغيل” أرشيفات الويب.

على هذا النحو ، لديك أداة أرشفة ويب كاملة الميزات جاهزة للعمل على جهازك. سنوضح لك أيضًا كيفية عمل WAIL بالضبط لاحقًا في المقالة.

5. ستيليو

موقع Stillio على الويب.

موقع Stillio على الويب.

يتم إصدار فاتورة بأداة الأرشفة قبل الأخيرة الخاصة بنا كحل تلقائي يأخذ لقطات على فترات زمنية محددة. Stillio هي خدمة متميزة تبدو مختلفة عن حلول الأرشفة الأخرى.

يبدو موقع الويب أنيقًا ويمنحك خيارات لا تعد ولا تحصى لإنشاء أرشيف يلبي متطلباتك الدقيقة. على سبيل المثال ، يمكنك إضافة العلامات والعناوين المخصصة إلى عناوين URL الخاصة بك.

علاوة على ذلك ، يمكنك اختيار تخزين الأرشيفات في Dropbox و Google Drive وخدمات الطرف الثالث الأخرى .

ومع ذلك ، لدى Stillio عيبًا كبيرًا: فهو لا يدعم الأرشفة الخلفية. أنت مقيد بلقطات شاشة لموقع الويب الخاص بك بدلاً من أرشيف كامل للبيانات. بالنسبة للعديد من التطبيقات ، هذا لا يكفي.

ومع ذلك ، يمكن أن يكون Stillio مفيدًا في بعض الحالات ، مثل العمل كأداة لإدارة العلامات التجارية والتتبع. على سبيل المثال ، يمكنك التقاط لقطات شاشة لمواقع المنافسين أو نتائج محرك البحث. إنها أيضًا رائعة للتحقق من المحتوى.

يبدأ تسعير Stillio من 29 دولارًا شهريًا ويرتفع من خلال أربع مستويات حتى 299 دولارًا في الشهر. إنه طلب كبير ، خاصة عندما تكون هناك بدائل مجانية بميزات أكثر قوة. ولكن إذا كان يناسب حالة الاستخدام الخاصة بك تمامًا ، فمن الجدير إلقاء نظرة!

6. Pagefreezer

موقع ويب Pagefreezer.

موقع ويب Pagefreezer.

الحل النهائي لدينا هو أداة آلية أخرى. تقدم Pagefreezer العديد من المزايا نفسها التي توفرها Stillio ، ولكنها تعمل أيضًا على أرشفة محتوى الوسائط الاجتماعية والرسائل النصية والمواقع الكاملة ومنصات التعاون على مستوى المؤسسة .

تريد أن تعرف كيف زدنا من حركة المرور لدينا أكثر من 1000 ٪؟

انضم إلى أكثر من 20000 آخرين ممن يتلقون رسائلنا الإخبارية الأسبوعية مع نصائح من الداخل حول وورد بريس!

إشترك الآن

على السطح ، يبدو Pagefreezer كحل أكثر قوة من Stillio وسيكون له قيمة أكبر في حالات الاستخدام المختلفة.

على سبيل المثال ، عندما يُطلب منك قانونًا أرشفة موقع بشكل كامل ، فإن Pagefreezer يناسب الفاتورة. يسمح لك بأتمتة عدد اللقطات ومراجعتها باستخدام مستعرض أرشيف الموقع وأداة المقارنة.

بشكل عام ، يعد Pagefreezer حلاً رائعًا على مستوى المؤسسة لأرشفة مكان العمل. ستنجذب الشركات التي تستخدم Yammer أو Chatter من Salesforce إلى هذا النوع من الحلول ، وكذلك مستخدمو Workplace .

ما هو تنسيق ملف أرشيف الويب (WARC)؟

إذا كنت تبحث عن كيفية أرشفة موقع ويب ، فستجد تنسيق Web Archive (WARC) . إنها مجموعة مجمعة من ملفات أرشيف موقعك المتنوعة بحيث تكون محمولة وقائمة بذاتها.

أنشأ أرشيف الإنترنت WARC للحفاظ على بيانات الويب على المدى الطويل. قام الاتحاد الدولي للحفظ على الإنترنت (IIPC) بنشر المواصفات الكاملة لتنسيق الملف. وسوف تخزين الصور ، الفوقية ، وكل شيء عمليا موقعك يحتاج لتعمل على أساس مستقل.

بينما كان في الأصل مجرد تنسيق ملف سهل الاستخدام ، أصبح WARC الآن معيار ISO الدولي للأرشيفات الرقمية. على هذا النحو ، تم اعتماده من قبل الحكومات والهيئات الرسمية الأخرى. في الواقع ، هناك العديد من حالات الاستخدام التي يكون فيها ملف WARC أمرًا حيويًا:

الاكتشاف الإلكتروني : هي العملية أثناء التقاضي حيث يتم البحث في السجلات الرقمية وتقديمها لإدراجها في المحاكمة. بالنسبة لسجلات الوسائط الاجتماعية ، يفي ملف WARC بالمعيار القانوني للاكتشاف الإلكتروني .

حرية المعلومات (FOI):  هناك العديد من الحكومات والهيئات الرسمية التي تستخدم قانون حرية المعلومات والسجلات المفتوحة لتقديم خدمة “الحق في المعرفة” (RTK) للهيئات المكونة للدولة. يعد تنسيق WARC مثاليًا في الحالات التي تتضمن السجلات الرقمية.

يتم استخدام WARC بواسطة العديد من حلول الأرشفة وبرامج الزحف المختلفة ، مثل StormCrawler و Apache Nutch . يمكنك أيضًا تعديل إعدادات أداة سطر الأوامر مثل Wget لجلب الطلبات وحزمها كملفات WARC. سنناقش هذا بمزيد من التفصيل قريبا.

هناك الكثير من الأدوات الأخرى التي يمكنها إخراج ملفات WARC أيضًا. على سبيل المثال ، يمكن لصفحة الويب مفتوحة المصدر حفظ أداة wallabag القيام بذلك.

كبديل ، يعد grab-site تطبيقًا يستند إلى الويب للمساعدة في تتبع ارتباطات الأرشيف كملفات WARC.

يعتمد فتح ملف WARC على الأداة التي تستخدمها. بغض النظر عن الحل الذي تفضله ، ضع في اعتبارك أن بعض هذه الأدوات لم يتم تحديثها منذ فترة.

على هذا النحو ، ستحتاج إلى التأكد من أن الحل الذي اخترته يعمل مع نظامك الحالي وأنه سيكون متاحًا للاستخدام في المستقبل. ستوفر على نفسك الكثير من المتاعب إذا تجنبت أداة قد ينتهي بها الأمر إلى التوقف أو التخلي أثناء وجودك في منتصف مشروع أرشفة.

نصائح لإدارة المحفوظات دون اتصال

قبل أن ندخل في كيفية أرشفة موقع ويب ، دعنا نأخذ بضع دقائق لمساعدتك في تنظيم المحفوظات الموجودة لديك. لقد تطرقنا إلى الموضوع ، ولكن وجود نهج قوي في مكانه سيجعل أرشيفاتك أكثر قابلية للإدارة. سيستفيد مستخدمو موقعك أيضًا بشكل أكبر من الأرشيف المنظم جيدًا.

هناك ثلاثة عناصر أساسية يجب أن تضعها في اعتبارك:

التكرار:  حدد عدد المرات التي تريد أرشفة أحد المواقع فيها. ستحتاج المواقع الضخمة والديناميكية والمعقدة ذات التغييرات اليومية تقريبًا إلى لقطات أكثر تكرارًا من المواقع الثابتة.

الموقع: تمامًا مثل النسخ الاحتياطية ، يجب عليك حفظ الأرشيفات في عدة أماكن مختلفة ، بما في ذلك السحابة. اتبع قاعدة 3-2-1 لمزيد من التأكيد. نقترح أيضًا أكثر من ذلك إذا كنت تريد التقاط العمق الكامل لموقعك.

البنية: مثل أدلة جهاز الكمبيوتر الخاص بك ، يجب أن تبحث عن استخدام مجلدات صريحة مقسمة إلى أسماء أرشيفات الموقع وتاريخ أرشفة موقع معين.

بينما يمكنك توسيع إدارة الأرشيف بشكل أكبر ، فإن هذه النصائح الثلاث ستبدأ عملية الأرشفة في القدم اليمنى.

5 طرق لأرشفة موقع على شبكة الإنترنت

أدناه ، سنقترح خمس طرق مختلفة لأرشفة موقع ويب. لقد طلبنا الحلول بناءً على الصعوبة النسبية. ومع ذلك ، إذا وجدت حلاً تعتقد أنه سينجح مع احتياجاتك الحالية ، فلا تتردد في الغوص فيه والعثور على المزيد.

1. حفظ صفحة واحدة على جهاز الكمبيوتر المحلي الخاص بك

أولاً ، دعنا نناقش الحل الأكثر وضوحًا. إنه لأمر رائع إذا كنت بحاجة إلى أرشفة صفحة واحدة ، والأفضل من ذلك ، أن الوظيفة موجودة بالفعل في كل متصفح تقريبًا.

للبدء ، افتح متصفحك المفضل وتوجه إلى موقع الويب الذي ترغب في أرشفته. بمجرد تحميل الصفحة ، انتقل إلى قائمة ملف في متصفحك وابحث عن خيار حفظ الصفحة باسم :

هل تعاني من مشاكل التوقف و وورد بريس؟ Kinsta هو حل استضافة محسّن للأداء مصمم لتوفير الوقت. تحقق من ميزاتنا

قائمة ملف Firefox.

تحتوي قائمة ملف Firefox على الوظائف التي تحتاجها لحفظ صفحة ويب واحدة.

بعد ذلك ، انقر فوق خيار حفظ الصفحة ، وعندها سيعرض لك المستعرض مربع حوار.

هنا ، اختر اسمًا لصفحتك (على الرغم من أن الاسم الافتراضي جيد). تأكد أيضًا من حفظ الصفحة بأكملها بدلاً من حفظ HTML فقط . سيحافظ على الموقع بأكبر قدر ممكن من الوظائف.

2. استخدم DevKinsta لأرشفة موقع وورد بريس الخاص بك

صفحة البداية DevKinsta.

يمكن أن تساعدك DevKinsta أيضًا في أرشفة موقع ويب.

نعتقد أن DevKinsta أداة أساسية لإنشاء مواقع وورد بريس ونشرها. ومع ذلك ، فإنه يحتوي أيضًا على سلسلة أخرى في قوسه: فهو يساعدك على أرشفة مواقع الويب المستضافة على Kinsta أيضًا.

لقد غطينا العملية الكاملة لسحب نسخة احتياطية خارجية من MyKinsta إلى DevKinsta في إحدى مقالات قاعدة المعارف الخاصة بنا. كي تختصر:

قم بإنشاء وتنزيل نسخة احتياطية في MyKinsta.

قم بإنشاء موقع جديد باستخدام DevKinsta.

استيراد المحتوى وقاعدة البيانات الخاصة بك .

قم بإجراء بحث واستبدال في قاعدة البيانات الخاصة بك لتغيير اسم URL من موقعك المباشر إلى أرشيفك المحلي الجديد.

في هذه المرحلة ، يمكنك فتح موقعك في DevKinsta واستخدامه كما لو كان مباشرًا.

3. استخدم أرشيفًا على الإنترنت (مثل Wayback Machine)

لن يكتمل أي برنامج تعليمي دون أن يوضح لك كيفية عمل Wayback Machine. لحسن الحظ ، فإن العملية بسيطة. ومع ذلك ، لاحظ أن هذه الطريقة تتيح لك أرشفة الصفحات الفردية فقط (على الرغم من أن خدمة Archive-It تتيح لك أرشفة مواقع كاملة).

لهذا النهج ، توجه إلى الصفحة الرئيسية لجهاز Wayback Machine وتحقق من نموذج Save Page Now :

نموذج Save Page Now على موقع Wayback Machine.

نموذج Save Page Now على موقع Wayback Machine.

لأرشفة الصفحة ، ما عليك سوى إضافة عنوان URL الذي تريد حفظه في هذا النموذج ، ثم انقر فوق حفظ الصفحة . اعتمادًا على حجم الصفحة أو تعقيدها ، قد تحتاج إلى الانتظار بضع دقائق أثناء قيام الزاحف والمحرك بعملهما. قد تبدو الصفحة كما لو أنها تحطمت. لقد واجهنا شاشة الموت البيضاء (WSoD) لفترة من الوقت في اختبارنا .

ومع ذلك ، بمجرد أرشفة الصفحة ، ستعيد Wayback Machine توجيهك إلى الصفحة الجديدة المخصصة.

صفحة Kinsta مؤرشفة على Wayback Machine.

صفحة Kinsta مؤرشفة على Wayback Machine.

لاحظ أنه يمكنك أيضًا استخدام إشارة مرجعية وملحق متصفح لأرشفة موقع ويب أيضًا. في الواقع ، تحتوي معظم المتصفحات الحالية على هذه الخيارات خارج الصندوق ، بما في ذلك Google Chrome و Firefox و Safari .

4. تثبيت طبقة تكامل أرشفة الويب (WAIL)

خطوتك الأولى في هذا الأسلوب هي تنزيل WAIL نفسه وتثبيته. لحسن الحظ ، هناك مثبت مخصص للأداة (على الرغم من أن البرنامج مكتوب بلغة Python ، فإنه يستخدم وحدة PyInstaller).

عملية التثبيت سهلة للغاية. بغض النظر عن نظام التشغيل الخاص بك (OS) ، يمكنك تنفيذ ما يلي:

انتقل إلى موقع WAIL على الويب وقم بتنزيل برنامج التثبيت المناسب لنظام التشغيل الخاص بك.

إما أن تقوم بفك ضغط الملف الخاص بإصدار Windows ، أو تحميل صورة DMG لنظام macOS.

في شاشة الحوار الناتجة لنظام macOS ، اسحب أيقونة التطبيق إلى مجلد التطبيقات . بالنسبة لمستخدمي Windows ، ما عليك سوى سحب المجلد الذي تم فك ضغطه إلى جذر محرك الأقراص C: \ .

قم بتشغيل إما WAIL.app أو WAIL.exe (حسب نظام التشغيل الخاص بك).

بمجرد فتح WAIL ، سترى الحد الأدنى من واجهته:

تطبيق WAIL.

تمنحك واجهة WAIL ثلاثة خيارات.

يتم تقديمك الآن مع ثلاثة خيارات للاختيار من بينها: عرض أرشيف ، أو التحقق من حالته ، أو أرشفة موقع ويب. الأزرار مربكة بعض الشيء ، حيث قد يكون ميلك الطبيعي للقراءة من اليسار إلى اليمين. ومع ذلك ، عند الإطلاق الأول ، لن يكون لديك أي شيء في أرشيفاتك.

بدلاً من ذلك ، أدخل عنوان URL للموقع الذي تريد أرشفته ، وانقر فوق أرشفة الآن! سترى WAIL يبدأ في الزحف إلى موقع الويب. يمكنك التحقق من حالة الزحف الخاص بك في علامة التبويب خيارات متقدمة > Heritrix :

يعرض WAIL الوضع الحالي لمهمة الزحف.

يعرض WAIL الوضع الحالي لمهمة الزحف.

عند الانتهاء ، ستظهر لك رسالة “نجاح”. في هذه المرحلة ، يمكنك النقر فوق الزر ” عرض الأرشيف” في علامة التبويب ” أساسي” . سيؤدي هذا إلى فتح موقعك المؤرشف في متصفح ، ويكون جاهزًا لعرضه.

5. استخدم Wget إذا كنت مرتاحًا باستخدام سطر الأوامر

لطريقتنا النهائية لأرشفة موقع ويب ، ستحتاج إلى بعض الأشياء قبل أن تبدأ:

وصول سطر الأوامر إلى جهاز الكمبيوتر الخاص بك

أداة سطر أوامر مناسبة مثل Windows Command Prompt أو Terminal على macOS و Linux

Wget مثبت على جهاز الكمبيوتر الخاص بك

من المحتمل أن يكون لديك الأولين بالفعل.

على نظام macOS ، يمكنك تثبيت Wget من خلال Homebrew باستخدام brew install wgetالأمر. لاحظ أنك تحتاج أيضًا إلى تثبيت Homebrew ، لكن الأمر لا يستغرق سوى ثوانٍ. على نظام Linux ، تم تثبيت Wget مسبقًا على معظم التوزيعات الرئيسية.

إذا كنت من مستخدمي Windows ، فقد تواجه صعوبة في تثبيت Wget على جهاز الكمبيوتر الخاص بك. في حين أن هناك برامج تعليمية متاحة عبر الويب ، فإن إرشاداتهم لا تبدو متسقة بين الأجهزة. بدلاً من ذلك ، نوصيك بالتوجه إلى موقع Wget الرسمي على الويب والتحقق من بعض ثنائيات Windows المتاحة ، حيث من المرجح أن تعمل من أجلك.

بغض النظر ، بمجرد تثبيت Wget ، يكون استخدامه أمرًا سهلاً. أولاً ، انتقل إلى دليل في نافذة طرفية جديدة. هنا ، نقوم بإنشاء الدليل أيضًا ، لكن هذه الخطوة اختيارية:

cd documents && mkdir archive && cd archive

لاحظ أن Wget سوف يسحب جميع التنزيلات إلى أي دليل العمل. في هذه الحالة ، حددنا مجلدًا لملفاتنا.

بعد ذلك ، سترغب في الزحف إلى موقع وسحب الملفات. يتم استدعاء كل إجراء باستخدام wgetالأمر ، وستريد استخدام التنسيق التالي:

wget “https://kinsta.com/” –warc-file=”kins”

ضرب أدخل ومفتاح بدء التحميل من kinsta.com إلى index.html و الملفات وإنشاء ملف WARC اسمه الأقرباء-00000.warc.gz .

موقع مؤرشف كملف WARC.

موقع مؤرشف كملف WARC.

Wget قوي ، وهناك العديد من الأوامر والخيارات التي يمكنك استخدامها. على سبيل المثال ، يمكنك استخدام –mirrorالأمر لإنشاء ملف WARC يحتوي على النسخة المتطابقة الكاملة لموقعك. يمكنك أيضًا استخدام –no-warc-compressionالأمر لكتابة ملفات غير مضغوطة ، على الرغم من أنه من الواضح أن هذا سيستهلك مساحة أكبر لكل تنزيل. يعد استخدام الضاغط المدمج هو الأسلوب الأمثل.

إن أرشفة موقع الويب الخاص بك يشبه إلى حد ما إنشاء كبسولة زمنية ⏳ … ولحسن الحظ ، من السهل البدء بمساعدة هذا الدليل. ✅

انقر للتغريد

ملخص

نمت أرشفة الويب من الحاجة إلى توثيق الشكل المتغير بسرعة للإنترنت. لديها الآن العديد من التطبيقات الصالحة – على سبيل المثال ، في حالة الملفات والمتطلبات القانونية. بغض النظر عن حاجتك ، فإن وجود أرشيف منظم جيدًا يمكن أن يكمل إستراتيجية النسخ الاحتياطي الشاملة.

لحسن الحظ ، هناك الكثير من الحلول المتاحة للمساعدة. توفر معظم المتصفحات القدرة على حفظ صفحة ويب على جهاز الكمبيوتر الخاص بك ، على الرغم من أن الحلول مثل DevKinsta هي أيضًا أدوات قادرة على أداء المهمة. ومع ذلك ، فإن أدوات الأرشفة المخصصة مثل Wayback Machine و Heritrix و WAIL و Wget كلها حلول قوية بشكل خاص وتقدم تنسيقات ملفات موحدة للعمل.

توضيح

اي عملية نسخ او اقتباس او ترجمة او نقل تم لاغراض علمية وتدريبية وتعليمية بحته وقد تم انشاء هذا المحتوى بمعرفة خبراء في مجال التقنية اما عن طريق إنشاء او تحرير او نقل او نسخ او اقتباس او ترجمة المحتوى من مصادر خاصة او عامة وكل ذلك ضمن حقوق النشر المتعارف عليها.

اي أخطاء تظهر في المحتوى مهما كان نوعه او تصنيفه يمكنك تحرير رسالة فورية لادارة موثوق لاجل تصحيح هذه الاخطاء، وسنكون شاكرين لك في حال قمت بالتعاون معنا لاجل اصلاح هذه الاخطاء.

شاركنا رايك وتقييمك للموضوع

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}{{ options.labels.pluralReviewCountLabel }}
{{ options.labels.newReviewButton }}
{{ userData.canReview.message }}