MAT 0.6.1 – Limpiando metadatos de PDF y que funcione con MAT

MAT comenzó a escribirse durante el GSoC 2011 bajo el paraguas del proyecto Tor. Su web es esta: https://mat.boum.org/

Sirve para limpiar metadatos de algunos tipos de archivos. Teóricamente soporta estos archivos:

  • Portable Network Graphics (.png)
  • JPEG (.jpg, .jpeg, …)
  • TIFF (.tif, tiff, …)
  • Open Documents (.odt, .odx, .ods, …)
  • Office OpenXml (.docx, .pptx, .xlsx, …)
  • Portable Document Fileformat (.pdf)
  • Tape ARchives (.tar, .tar.bz2, …)
  • MPEG AUdio (.mp3, .mp2, .mp1, …)
  • Ogg Vorbis (.ogg, …)
  • Free Lossless Audio Codec (.flac)
  • Torrent (.torrent)

No obstante es posible que pueda fallar para los pdf y si eso pasa lo mismo es bueno que en vez de usar el mat que suele venir en los repositorios de algunas distros pues te bajas el de la web, la última versión e instalas las dependencias para que el pdf sea un formato soportado.

Vamos a ello:

 

# apt-get install python-mutagen libimage-exiftool-perl python-pdfrw gir1.2-poppler-0.18  python-gi-cairo python-distutils-extra libimage-exif-perl libimage-info-perl exif
# ln -s /usr/bin/exif /usr/bin/exiftool
$ git clone "https://0xacab.org/mat/mat"
$ cd mat
# python2.7 setup.py install
$ mat --version

 

Probar que funciona bien con los pdf:

$ wget "https://mierda.tv/descargas/arte_sacro_y_profano.pdf"
$ mat -c arte_sacro_y_profano.pdf 

Si no funciona bien saldrá el mensaje de “Unable to process” en mat. En ese caso no tienes lo necesario para soportar limpieza de pdfs utilizando mat.

 

Si todo va bien el pdf del ejemplo ocupará mucho menos (pasa de 2.3Mb a 2Mb). Entre otras cosas nos hemos cepillado la miniatura que lleva en su interior y que podemos ver con mat -d (bajando de nuevo el pdf si lo hemos limpiado ya).

Para limpiar usaremos mat nombrearchivo.pdf

El motivo de esta entrada es dejar claro que mat por defecto instalado de repo posiblemente no nos funcionará bien para los pdfs si no instalamos las dependencias necesarias.

1 thought on “MAT 0.6.1 – Limpiando metadatos de PDF y que funcione con MAT”

  1. En caso de usar Arch, en los repos AUR viene la versión mat-git, que instalará las dependencias y mat. Desconozco si en otras distros viene mat-git.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *