Navegando offline con HTTrack
alfredo publicó esto el 19/10/09 en Herramientas, Open Source. Un comentarioCuando viajo trato en lo posible de aprovechar la ocasión para leer libros. Teniendo en cuenta que cada vez hay más y muy buenos libros disponibles de manera online, tales como CouchDB: The Definitive Guide o Pro Git, una solución para navegarlo cuando no tenga conexión a Internet es bajar todo el sitio.
Encontré una herramienta ideal para realizar esta tarea: HTTrack.
HTTrack
Nos permite bajar un sitio web a un directorio local, construyendo recursivamente todos los directorios; obteniendo HTML, imágenes y otros archivos del servidor a tu computadora. HTTrack además ordena la estructura original de links.
Podemos instalarlo con:
$ sudo aptitude install httrack
Su modo de uso es bastante sencillo:
$ httrack http://sitiowebquequierobajar.com Mirror launched on Mon, 19 Oct 2009 10:39:51 by HTTrack Website Copier/3.43-2+libhtsjava.so.2 [XR&CO'2008] mirroring http://sitiowebquequierobajar.com with the wizard help..
Cuenta con muchísimas opciones de configuración, incluyendo un asistente al que accedemos simplemente ejecutando la aplicación sin parámetros.
Otra manera es utilizando GNU Wget, con la opción de bajada recursiva. Sin embargo debemos tener cuidado porque podríamos bajarnos media internet.
$ wget -r http://sitiowebquequierobajar.com
Si al wget le agregas las opciones -c (para que continue en el caso que se corte la conexion o algo) y -k(para que redirija los links a archivos locales), tenes la seguridad de que la pagina esta completa y con todos los links funcionando
Publicado el 8 Febrero 2011 a las 08:35. Permalink.