Análisis – Velocidad/compresión tar.gz, tar.bz2 y tar.xz

En anteriores posts se ha hablado de lo que es un tar por dentro y hemos visto como comprimir y descomprimir archivos desde linea de comandos.

Aparte de encontrar archivos tar sin comprimir lo normal es encontrarlos comprimidos. La doble extensión que se suele emplear es esta:

.tar.gz => gzip => Se usa la opción “z” con tar.
.tar.bz2 => bzip2 => Se usa la opción “j” con tar.
.tar.xz => xz => Se usa la opción “J” con tar.

Si nos fijamos con tar podemos crear los paquetes y comprimirlos. Los empaquetará y luego les aplicará al archivo resultante los algoritmos pertinentes de cada tipo de formato de archivo de compresión.

Esos 3 son los más usuales y son 3 que podemos usar con la herramienta tar si al crearlos empleamos la opción indicada (posiblemente soportará más tipos en sus argumentos siempre que tengamos el programa adecuado del que tire).

Descargar la muestra: https://mierda.tv/descargas/muestras.tar.gz

Vamos a descargar la muestra que contiene los siguientes archivos:

20K	documento.odt
1,7M	documento.pdf
104K	foto.jpg
54M	musica.ogg
620K	sonido1.wav
252K	sonido2.wav
4,0K	texto1.txt
4,0K	texto2.txt
100K	texto3.txt
124M	video.mp4

La muestra la podemos descomprimir así:

$ tar xfvz muestras.tar.gz

Nos quedará un directorio llamado muestras (con un tamaño total de 187681795 bytes) con los diferentes tipos de archivos en su interior. Es ahora cuando vamos a hacer las pruebas de velocidad y tamaño resultante de comprimir con unas opciones u otras. En resumidas cuentas queremos saber que formato nos interesa más usar.

Los comandos para comprimir utilizados son estos:

$ time tar cfvz muestras.tar.gz muestras/
$ time tar cfvj muestras.tar.bz2 muestras/
$ time tar cfvJ muestras.tar.xz muestras/

El resultado:

Nótese que uso time antes para conocer el tiempo que ha tardado.

También se ha de tener en cuenta que esto es un simple análisis con una pequeña muestra. Lo ideal es probar a ver como actúa con muestras de solamente código, etc … y hacerlo en equipos diferentes con prestaciones variadas.

Resultados:

Posiblemente para archivos con muchos textos/código pueda interesar tar.xz (no lo he probado pero el kernel de linux puede bajarse en tar.xz y hacerse las pruebas).

Si realmente el tamaño importa y no el tiempo tar.xz es buena opción.

Pero digamos que para uso genérico un tar.gz es lo adecuado.

próximo Publicación

Atrás Publicación

Dejar una contestacion

© 2018 [ MIERDA TV ]

Tema de Anders Norén