5 façons d'utiliser le site Web d'archives Internet ?

Publié: 2021-10-25

Internet Archive est une bibliothèque numérique à but non lucratif qui possède la plus grande collection d'actifs en ligne. Il a été lancé en 1996 et prétend avoir archivé plus de 600 milliards de pages Web à l'aide de sa WaybackMachine. Vous pouvez utiliser ces pages archivées de différentes manières pour votre projet. Dans cet article, nous expliquerons comment utiliser le contenu Internet Archive et soumettre votre site Web à l'archivage.

Contenu des archives Internet

Beaucoup de gens pensent que arhive.org n'héberge que des pages Web archivées. Cependant, en plus des pages Web, vous pouvez trouver des livres, de l'audio, des vidéos, des logiciels et des images sur leur site Web. Voici quelques-unes des façons dont vous pouvez utiliser le site Web Internet Archive.

1. Trouvez le contenu supprimé et indisponible de votre page Web

Le moyen le plus simple et le plus utile d'Internet Archive est de trouver le contenu qui n'est pas actuellement disponible sur le Web. Expliquons cela avec un exemple. Certains constructeurs de sites Web comme Weebly n'offrent pas la possibilité de conserver vos articles dans la « Corbeille ». Il sera définitivement supprimé de votre site si vous avez supprimé une page par erreur. Le problème est que leur page de blog est la page d'index et la suppression de cette seule page de blog supprimera définitivement tous les articles de blog que vous avez créés pendant des années. L'un de nos lecteurs nous a envoyé un e-mail nous demandant comment récupérer plus de 100 articles de blog Weebly, car il a supprimé par erreur la page d'index du blog.

Regarder Internet Archive est l'option la plus simple pour récupérer le contenu supprimé. Bien qu'Internet Archive ne fournisse pas de solution rapide, vous pouvez au moins afficher et récupérer votre contenu à partir des pages archivées.

  • Accédez à la section WaybackMachine du site Web Internet Archive.
  • Entrez l'URL du site ou de la page dont vous souhaitez voir l'historique et cliquez sur le bouton "Parcourir l'historique".
Entrez l'URL dans Wayback Machine
Entrez l'URL dans Wayback Machine
  • Vous verrez un calendrier avec les dates en surbrillance indiquant qu'il y a des archives disponibles à ces dates.
  • Cliquez sur la date et sélectionnez l'instantané que vous souhaitez afficher.
Choisissez la date de l'instantané
Choisissez la date de l'instantané
  • Vous pouvez voir le contenu de la page Web à la date sélectionnée. Vous pouvez changer la date sur la barre supérieure pour changer l'instantané à une date différente.
Afficher l'instantané archivé
Afficher l'instantané archivé
  • Maintenant, vous pouvez copier et utiliser le contenu si vous l'avez supprimé ou modifié à tort sur votre site en ligne.

En plus de l'affichage sous forme de calendrier, vous pouvez modifier l'affichage en Collections, Modifications, Résumé, Plan du site et URL. Vous serez surpris de voir la quantité d'informations disponibles sur votre site dans Internet Archive. Vous trouverez ci-dessous à quoi ressemblera la vue « Plan du site » et vous pouvez survoler le graphique pour sélectionner une URL pour afficher l'instantané.

Archiver la carte du site
Archiver la carte du site

Les instantanés peuvent également être utiles pour la documentation lorsque vous souhaitez découvrir à quoi ressemblait un site particulier il y a dix ans. Par exemple, voici à quoi ressemblait le site de Google en 1999.

Site Web de Google 1999
Site Web de Google 1999

Offre SEO : Optimisez votre site avec Semrush Pro spécial essai gratuit de 14 jours.

2. Soumettez votre instantané de site

Il est également possible d'enregistrer le contenu d'une page Web dans Internet Archive. Vous pouvez soumettre votre propre site ou n'importe quelle page que vous aimez sur le Web et trouver n'est pas disponible sur le site Web archive.org.

  • Accédez à la section Web d'Internet Archive et faites défiler un peu.
  • Vous verrez une option "Enregistrer la page maintenant" comme indiqué ci-dessous.
  • Entrez votre URL et cliquez sur le bouton « Enregistrer la page » pour capturer l'instantané actuel de la page.
Enregistrer la page dans Internet Archive
Enregistrer la page dans Internet Archive

3. Afficher et écouter des collections

Comme mentionné, les pages Web ne sont qu'une partie du site Web Internet Archive. Il existe une grande collection de livres électroniques, audio et vidéos que vous pouvez lire ou écouter en ligne.

  • Lorsque vous êtes sur la page d'accueil d'Internet Archive, faites défiler vers le bas et cliquez sur votre collection préférée.
  • Par exemple, vous pouvez trouver les « Bibliothèques européennes » et cliquer dessus.
Voir les collections
Voir les collections
  • Vous trouverez plus de 700K livres numériques et cliquez sur le livre que vous souhaitez lire ou écouter.
  • Il s'ouvrira avec une interface de lecteur eBook ; vous pouvez simplement zoomer ou passer en vue d'une page pour agrandir le livre et le lire en ligne. Il est également possible de lire le livre pour vous et d'écouter pendant que vous effectuez une autre tâche.
Lire des livres en ligne
Lire des livres en ligne

Vous pouvez même trouver des livres publiés dans les années 1900 qui sont difficiles à trouver dans les bibliothèques physiques.

4. Vérifiez les projets d'archives Internet

Internet Archive propose de nombreux projets utiles et vous pouvez les utiliser en fonction de vos besoins.

  • Les organisations peuvent utiliser les archives en tant que service d'abonnement du projet arhive-it.org faisant partie d'Internet Archive.
  • Empruntez le livre à leur projet openlibrary.org.
  • Obtenez l'archive de votre logiciel préféré.

Vous pouvez consulter leur page de projets pour obtenir plus de détails sur les projets en cours.

5. Reconstruisez votre site Web à partir des archives

Gérer un site Web demande beaucoup de patience et de nombreux blogueurs suppriment leur site entre-temps et arrêtent de bloguer, frustrés de ne pas obtenir un trafic suffisant. Cependant, après un certain temps, ils regrettent et ne trouvent aucun moyen de continuer leur voyage de blogs. Si vous êtes celui qui a supprimé votre site, ne vous inquiétez pas !!! Il existe de nombreux fournisseurs de services tiers qui peuvent vous aider à reconstruire votre site à partir du contenu Internet Archive. Vous devez payer des frais minimes pour la récupération et la restauration du contenu dans le format requis. Par exemple, vous pouvez reconstruire votre blog WordPress d'origine pour seulement 45 $ et continuer là où vous êtes parti.

Tarification de la reconstruction d'archives
Tarification de la reconstruction d'archives

Consultez la liste des fournisseurs de services de reconstruction dans cette page Internet Archive.

Blocage de WaybackMachine Crawler

Enfin, il existe de bonnes raisons pour lesquelles vous ne souhaitez peut-être pas que le contenu de votre site Web fasse partie de l'Internet Archive. Vous souhaitez probablement garder le site personnel ou trouver des informations sensibles archivées que vous avez supprimées de votre site. L'option la plus simple consiste à utiliser le fichier robots.txt et à bloquer l'accès du robot d'exploration à Internet Archive. Ajoutez les lignes suivantes dans votre fichier robots.txt pour empêcher l'archivage de l'ensemble du site.

 User-agent: ia_archiver Disallow: /

L'autre option consiste à les contacter par e-mail et à demander leur exclusion.


FAQ sur l'utilisation d'Internet Archive

1. Puis-je retrouver ma page Web supprimée ?

Oui, si votre page a déjà été archivée.

2. Puis-je trouver ma page en direct dans Internet Archive ?

Oui, vous pouvez trouver la version historique appelée snapshot si elle est disponible.

3. Est-il possible de soumettre manuellement ma page à archiver ?

Oui, vous pouvez simplement accéder à la section WaybackMachine et enregistrer le contenu de votre page.

4. Dois-je disposer d'un accès de connexion pour Internet Archive ?

Non, pour afficher des instantanés. Cependant, vous en avez besoin pour télécharger vos actifs.

5. Comment puis-je supprimer ma page ou mon site ?

Bloquez le site ou la page avec robots.txt ou contactez-les par e-mail pour l'exclusion du site.

6. Puis-je supprimer le contenu d'un autre site Web disponible dans Internet Archive ?

Mauvaise idée, même un simple vérificateur de plagiat comparera le contenu disponible sur Internet Archive. Très probablement, vous recevrez un avis de violation du droit d'auteur (DMCA) après avoir passé beaucoup de temps ou pénalisé par les moteurs de recherche pour avoir volé le contenu d'autrui. S'il s'agit de votre propre site, vous pouvez vous reconstruire ou utiliser des services tiers. À des fins de référencement, vous devrez peut-être configurer des redirections si vous détenez toujours l'ancien nom de domaine.

7. Quels autres actifs sont disponibles dans l'archive ?

Grande collection de livres électroniques, audios, vidéos, logiciels et bien plus encore.

8. Pourquoi ne puis-je pas me connecter au site Web archivé ?

Les pages archivées sont simplement des instantanés comme une capture d'écran. Vous ne pouvez pas vous connecter, accéder à la base de données, afficher le contenu derrière la protection par mot de passe.