5 façons d'utiliser le site Web d'archives Internet ?
Publié: 2021-10-25Internet Archive est une bibliothèque numérique à but non lucratif qui possède la plus grande collection d'actifs en ligne. Il a été lancé en 1996 et prétend avoir archivé plus de 600 milliards de pages Web à l'aide de sa WaybackMachine. Vous pouvez utiliser ces pages archivées de différentes manières pour votre projet. Dans cet article, nous expliquerons comment utiliser le contenu Internet Archive et soumettre votre site Web à l'archivage.
Contenu des archives Internet
Beaucoup de gens pensent que arhive.org n'héberge que des pages Web archivées. Cependant, en plus des pages Web, vous pouvez trouver des livres, de l'audio, des vidéos, des logiciels et des images sur leur site Web. Voici quelques-unes des façons dont vous pouvez utiliser le site Web Internet Archive.
1. Trouvez le contenu supprimé et indisponible de votre page Web
Le moyen le plus simple et le plus utile d'Internet Archive est de trouver le contenu qui n'est pas actuellement disponible sur le Web. Expliquons cela avec un exemple. Certains constructeurs de sites Web comme Weebly n'offrent pas la possibilité de conserver vos articles dans la « Corbeille ». Il sera définitivement supprimé de votre site si vous avez supprimé une page par erreur. Le problème est que leur page de blog est la page d'index et la suppression de cette seule page de blog supprimera définitivement tous les articles de blog que vous avez créés pendant des années. L'un de nos lecteurs nous a envoyé un e-mail nous demandant comment récupérer plus de 100 articles de blog Weebly, car il a supprimé par erreur la page d'index du blog.
Regarder Internet Archive est l'option la plus simple pour récupérer le contenu supprimé. Bien qu'Internet Archive ne fournisse pas de solution rapide, vous pouvez au moins afficher et récupérer votre contenu à partir des pages archivées.
- Accédez à la section WaybackMachine du site Web Internet Archive.
- Entrez l'URL du site ou de la page dont vous souhaitez voir l'historique et cliquez sur le bouton "Parcourir l'historique".
- Vous verrez un calendrier avec les dates en surbrillance indiquant qu'il y a des archives disponibles à ces dates.
- Cliquez sur la date et sélectionnez l'instantané que vous souhaitez afficher.
- Vous pouvez voir le contenu de la page Web à la date sélectionnée. Vous pouvez changer la date sur la barre supérieure pour changer l'instantané à une date différente.
- Maintenant, vous pouvez copier et utiliser le contenu si vous l'avez supprimé ou modifié à tort sur votre site en ligne.
En plus de l'affichage sous forme de calendrier, vous pouvez modifier l'affichage en Collections, Modifications, Résumé, Plan du site et URL. Vous serez surpris de voir la quantité d'informations disponibles sur votre site dans Internet Archive. Vous trouverez ci-dessous à quoi ressemblera la vue « Plan du site » et vous pouvez survoler le graphique pour sélectionner une URL pour afficher l'instantané.
Les instantanés peuvent également être utiles pour la documentation lorsque vous souhaitez découvrir à quoi ressemblait un site particulier il y a dix ans. Par exemple, voici à quoi ressemblait le site de Google en 1999.
Offre SEO : Optimisez votre site avec Semrush Pro spécial essai gratuit de 14 jours.
2. Soumettez votre instantané de site
Il est également possible d'enregistrer le contenu d'une page Web dans Internet Archive. Vous pouvez soumettre votre propre site ou n'importe quelle page que vous aimez sur le Web et trouver n'est pas disponible sur le site Web archive.org.
- Accédez à la section Web d'Internet Archive et faites défiler un peu.
- Vous verrez une option "Enregistrer la page maintenant" comme indiqué ci-dessous.
- Entrez votre URL et cliquez sur le bouton « Enregistrer la page » pour capturer l'instantané actuel de la page.
3. Afficher et écouter des collections
Comme mentionné, les pages Web ne sont qu'une partie du site Web Internet Archive. Il existe une grande collection de livres électroniques, audio et vidéos que vous pouvez lire ou écouter en ligne.
- Lorsque vous êtes sur la page d'accueil d'Internet Archive, faites défiler vers le bas et cliquez sur votre collection préférée.
- Par exemple, vous pouvez trouver les « Bibliothèques européennes » et cliquer dessus.
- Vous trouverez plus de 700K livres numériques et cliquez sur le livre que vous souhaitez lire ou écouter.
- Il s'ouvrira avec une interface de lecteur eBook ; vous pouvez simplement zoomer ou passer en vue d'une page pour agrandir le livre et le lire en ligne. Il est également possible de lire le livre pour vous et d'écouter pendant que vous effectuez une autre tâche.
Vous pouvez même trouver des livres publiés dans les années 1900 qui sont difficiles à trouver dans les bibliothèques physiques.
4. Vérifiez les projets d'archives Internet
Internet Archive propose de nombreux projets utiles et vous pouvez les utiliser en fonction de vos besoins.
- Les organisations peuvent utiliser les archives en tant que service d'abonnement du projet arhive-it.org faisant partie d'Internet Archive.
- Empruntez le livre à leur projet openlibrary.org.
- Obtenez l'archive de votre logiciel préféré.
Vous pouvez consulter leur page de projets pour obtenir plus de détails sur les projets en cours.
5. Reconstruisez votre site Web à partir des archives
Gérer un site Web demande beaucoup de patience et de nombreux blogueurs suppriment leur site entre-temps et arrêtent de bloguer, frustrés de ne pas obtenir un trafic suffisant. Cependant, après un certain temps, ils regrettent et ne trouvent aucun moyen de continuer leur voyage de blogs. Si vous êtes celui qui a supprimé votre site, ne vous inquiétez pas !!! Il existe de nombreux fournisseurs de services tiers qui peuvent vous aider à reconstruire votre site à partir du contenu Internet Archive. Vous devez payer des frais minimes pour la récupération et la restauration du contenu dans le format requis. Par exemple, vous pouvez reconstruire votre blog WordPress d'origine pour seulement 45 $ et continuer là où vous êtes parti.
Consultez la liste des fournisseurs de services de reconstruction dans cette page Internet Archive.
Blocage de WaybackMachine Crawler
Enfin, il existe de bonnes raisons pour lesquelles vous ne souhaitez peut-être pas que le contenu de votre site Web fasse partie de l'Internet Archive. Vous souhaitez probablement garder le site personnel ou trouver des informations sensibles archivées que vous avez supprimées de votre site. L'option la plus simple consiste à utiliser le fichier robots.txt et à bloquer l'accès du robot d'exploration à Internet Archive. Ajoutez les lignes suivantes dans votre fichier robots.txt pour empêcher l'archivage de l'ensemble du site.
User-agent: ia_archiver Disallow: /
L'autre option consiste à les contacter par e-mail et à demander leur exclusion.
FAQ sur l'utilisation d'Internet Archive
Oui, si votre page a déjà été archivée.
Oui, vous pouvez trouver la version historique appelée snapshot si elle est disponible.
Oui, vous pouvez simplement accéder à la section WaybackMachine et enregistrer le contenu de votre page.
Non, pour afficher des instantanés. Cependant, vous en avez besoin pour télécharger vos actifs.
Bloquez le site ou la page avec robots.txt ou contactez-les par e-mail pour l'exclusion du site.
Mauvaise idée, même un simple vérificateur de plagiat comparera le contenu disponible sur Internet Archive. Très probablement, vous recevrez un avis de violation du droit d'auteur (DMCA) après avoir passé beaucoup de temps ou pénalisé par les moteurs de recherche pour avoir volé le contenu d'autrui. S'il s'agit de votre propre site, vous pouvez vous reconstruire ou utiliser des services tiers. À des fins de référencement, vous devrez peut-être configurer des redirections si vous détenez toujours l'ancien nom de domaine.
Grande collection de livres électroniques, audios, vidéos, logiciels et bien plus encore.
Les pages archivées sont simplement des instantanés comme une capture d'écran. Vous ne pouvez pas vous connecter, accéder à la base de données, afficher le contenu derrière la protection par mot de passe.