¿5 formas de utilizar el sitio web de Internet Archive?

Publicado: 2021-10-25

Internet Archive es una biblioteca digital sin fines de lucro que tiene la mayor colección de activos en línea. Se inició durante 1996 y afirma tener el archivo de más de 600 mil millones de páginas web utilizando su WaybackMachine. Puede utilizar estas páginas archivadas de diferentes formas para su proyecto. En este artículo, explicaremos cómo hacer uso del contenido de Internet Archive y enviar su sitio web para su archivo.

Contenido de archivo de Internet

Mucha gente piensa que arhive.org aloja solo páginas web archivadas. Sin embargo, además de las páginas web, puede encontrar libros, audio, video, software e imágenes en su sitio web. Estas son algunas de las formas en que puede utilizar el sitio web de Internet Archive.

1. Busque contenido eliminado y no disponible de su página web

La forma más sencilla y útil de Internet Archive es encontrar el contenido que no está disponible actualmente en la web. Expliquemos esto con un ejemplo. Algunos creadores de sitios web como Weebly no ofrecen una opción para mantener sus artículos en la "Papelera". Se eliminará permanentemente de su sitio si ha eliminado una página por error. El problema es que su página de blog es la página de índice y eliminar esa única página de blog eliminará permanentemente todas las publicaciones de blog que haya creado durante años. Uno de nuestros lectores nos envía un correo electrónico preguntando cómo recuperar más de 100 publicaciones de blog de Weebly ya que borró por error la página de índice del blog.

Mirar Internet Archive es la opción más sencilla para recuperar contenido eliminado. Aunque Internet Archive no proporcionará una solución rápida, al menos puede ver y recuperar su contenido de las páginas archivadas.

  • Vaya a la sección WaybackMachine del sitio web de Internet Archive.
  • Ingrese el sitio o la URL de la página donde desea ver el historial y haga clic en el botón "Examinar historial".
Ingrese URL en Wayback Machine
Ingrese URL en Wayback Machine
  • Verá un calendario con las fechas resaltadas que indica que hay archivos disponibles en esas fechas.
  • Haga clic en la fecha y seleccione la instantánea que desea ver.
Elija la fecha de la instantánea
Elija la fecha de la instantánea
  • Puede ver el contenido de la página web en la fecha seleccionada. Puede cambiar la fecha en la barra superior para cambiar la instantánea a una fecha diferente.
Ver instantánea archivada
Ver instantánea archivada
  • Ahora, puede copiar y usar el contenido si lo ha eliminado o modificado incorrectamente en su sitio en vivo.

Además de verlo como un calendario, puede cambiar la vista a Colecciones, Cambios, Resumen, Mapa del sitio y URL. Se sorprenderá al ver la cantidad de información disponible sobre su sitio en Internet Archive. A continuación se muestra cómo se verá la vista "Mapa del sitio" y puede colocar el cursor sobre el gráfico para seleccionar una URL para ver la instantánea.

Vista del mapa del sitio de archivo
Vista del mapa del sitio de archivo

Las instantáneas también pueden ser útiles para la documentación cuando desea saber cómo se veía un sitio en particular hace una década. Por ejemplo, a continuación se muestra cómo se veía el sitio de Google en 1999.

Sitio web de Google 1999
Sitio web de Google 1999

Oferta de SEO: Optimice su sitio con la prueba gratuita especial de 14 días de Semrush Pro.

2. Envíe la instantánea de su sitio

También es posible guardar el contenido de una página web en Internet Archive. Puede enviar su propio sitio o cualquier página que desee en la web y la búsqueda no está disponible en el sitio web archive.org.

  • Vaya a la sección web de Internet Archive y desplácese un poco hacia abajo.
  • Verá la opción "Guardar página ahora" como se muestra a continuación.
  • Ingrese su URL y haga clic en el botón "Guardar página" para capturar la instantánea actual de la página.
Guardar página en Internet Archive
Guardar página en Internet Archive

3. Ver y escuchar colecciones

Como se mencionó, las páginas web son solo una parte del sitio web de Internet Archive. Hay una gran colección de libros electrónicos, audio y videos que puede leer o escuchar en línea.

  • Cuando esté en la página de inicio de Internet Archive, desplácese hacia abajo y haga clic en su colección favorita.
  • Por ejemplo, puede buscar las "Bibliotecas europeas" y hacer clic en ellas.
Ver colecciones
Ver colecciones
  • Encontrará más de 700K libros digitales y haga clic en el libro que desea leer o escuchar.
  • Se abrirá con una interfaz de lector de libros electrónicos; simplemente puede acercar o cambiar a la vista de una página para ampliar el libro y leer en línea. También es posible leer el libro por usted y escuchar mientras realiza otra tarea.
Leer libros en línea
Leer libros en línea

Incluso puede encontrar libros publicados durante la década de 1900 que son difíciles de encontrar en bibliotecas físicas.

4. Verifique los proyectos de Internet Archive

Internet Archive tiene muchos proyectos útiles y puede utilizarlos según sus necesidades.

  • Las organizaciones pueden utilizar el archivo como un servicio de suscripción del proyecto arhive-it.org que forma parte de Internet Archive.
  • Pide prestado el libro de su proyecto openlibrary.org.
  • Obtenga el archivo de su software favorito.

Puede consultar su página de proyectos para obtener más detalles sobre los proyectos actuales.

5. Reconstruya su sitio web a partir del archivo

La ejecución de un sitio web requiere mucha paciencia y muchos blogueros eliminan su sitio en el medio y abandonan los blogs por la frustración de no obtener suficiente tráfico. Sin embargo, después de un tiempo se arrepienten y no encuentran la manera de continuar su viaje de blogs. Si eres el que borró tu sitio, ¡no te preocupes! Hay muchos proveedores de servicios de terceros que pueden ayudarlo a reconstruir su sitio a partir del contenido de Internet Archive. Debe pagar una tarifa nominal por la recuperación de contenido y la restauración en el formato requerido. Por ejemplo, puede reconstruir su blog original de WordPress por solo $ 45 y continuar desde donde lo dejó.

Precios de reconstrucción de archivos
Precios de reconstrucción de archivos

Consulte la lista de proveedores de servicios de reconstrucción en esta página de Internet Archive.

Bloqueo de WaybackMachine Crawler

Por último, existen buenas razones por las que es posible que no desee que el contenido de su sitio web forme parte del Archivo de Internet. Probablemente, desee mantener el sitio personal o encontrar alguna información confidencial archivada que haya eliminado de su sitio. La opción fácil es utilizar el archivo robots.txt y bloquear el acceso del rastreador de Internet Archive. Agregue las siguientes líneas en su archivo robots.txt para bloquear el archivo de todo el sitio.

 User-agent: ia_archiver Disallow: /

La opción alternativa es contactarlos por correo electrónico y solicitar la exclusión.


Preguntas frecuentes sobre el uso de Internet Archive

1. ¿Puedo encontrar mi página web eliminada?

Sí, si su página fue archivada previamente.

2. ¿Puedo encontrar mi página en vivo en Internet Archive?

Sí, puede encontrar la versión histórica llamada instantánea si está disponible.

3. ¿Es posible enviar manualmente mi página para archivar?

Sí, simplemente puede ir a la sección WaybackMachine y guardar el contenido de su página.

4. ¿Necesito tener un acceso de inicio de sesión para Internet Archive?

No, para ver instantáneas. Sin embargo, necesita uno para cargar sus activos.

5. ¿Cómo puedo eliminar mi página o sitio?

Bloquee el sitio o la página con robots.txt o contáctelos por correo electrónico para la exclusión del sitio.

6. ¿Puedo eliminar contenido del sitio web de otra persona disponible en Internet Archive?

Mala idea, incluso un simple verificador de plagio comparará el contenido disponible en Internet Archive. Lo más probable es que reciba un aviso de infracción de derechos de autor (DMCA) en el futuro después de pasar mucho tiempo o sea penalizado por los motores de búsqueda por robar el contenido de otros. Si es su propio sitio, puede reconstruirlo usted mismo o utilizando servicios de terceros. Para fines de SEO, es posible que deba configurar redireccionamientos si aún tiene el nombre de dominio anterior.

7. ¿Qué otros activos están disponibles en el archivo?

Gran colección de libros electrónicos, audios, videos, software y mucho más.

8. ¿Por qué no puedo iniciar sesión en un sitio web archivado?

Las páginas archivadas son simplemente instantáneas como una captura de pantalla. No puede iniciar sesión, acceder a la base de datos, ver contenido protegido por contraseña.