Navegando offline con HTTrack

Octubre 19th, 2009

Cuando viajo trato en lo posible de aprovechar la ocasión para leer libros. Teniendo en cuenta que cada vez hay más y muy buenos libros disponibles de manera online, tales como CouchDB: The Definitive Guide o Pro Git, una solución para navegarlo cuando no tenga conexión a Internet es bajar todo el sitio.

Encontré una herramienta ideal para realizar esta tarea: HTTrack.

HTTrack

Nos permite bajar un sitio web a un directorio local, construyendo recursivamente todos los directorios; obteniendo HTML, imágenes y otros archivos del servidor a tu computadora. HTTrack además ordena la estructura original de links.

Podemos instalarlo con:

$ sudo aptitude install httrack

Su modo de uso es bastante sencillo:

$ httrack http://sitiowebquequierobajar.com
Mirror launched on Mon, 19 Oct 2009 10:39:51 by HTTrack Website Copier/3.43-2+libhtsjava.so.2 [XR&CO'2008]
mirroring http://sitiowebquequierobajar.com with the wizard help..

Cuenta con muchísimas opciones de configuración, incluyendo un asistente al que accedemos simplemente ejecutando la aplicación sin parámetros.

Otra manera es utilizando GNU Wget, con la opción de bajada recursiva. Sin embargo debemos tener cuidado porque podríamos bajarnos media internet.

$ wget -r http://sitiowebquequierobajar.com

Leave a Reply