2009/06/09

Empaquetando webs: MHTML

No tiene nada de nuevo el guardar el contenido de una web de un momento determinado; de hecho quizá esté cayendo en desuso por parte del visitante típico.

Los motivos, múltiples: acceso sin conexión, archivo, evidencia de auditoría...
Múltiples son también las formas de recoger el estado de una web.

Por un lado tendríamos la replicación de la estructura de documentos existente en el servidor. Para una página simple podríamos hacerlo mediante un "Guardar como ..." "página web completa" o, para un sitio de mayor tamaño y complejidad, mediante una araña o web-spider.

Por otra parte, puede resultar más práctico documentar la situación mediante un único fichero empaquetado que podríamos incluso firmar como testimonio probatorio. Para esta opción contamos bien con formatos de fichero de archivo genérico (tar, zip) que contendrían la estructura anteriormente mencionada, bien con un fichero MHTML especialmente diseñado para contenido web.
Al final, MHTML no deja de ser el HTML estándar añadiéndole mediante codificación MIME el resto de objetos binarios que forman el documento.

Lo que me sorprende es que Firefox no tenga soporte directo para MHTML y haya que instalar extensiones más o menos eficaces para que los gestione.

Por lo visto, también se le pueden dar otros usos, pero el de evidencia de auditoría es el que me resulta más cercano.

No hay comentarios:

Office OpenXML (OOXML) no debe ser ISO 29500