Abr
10
2011

Escaneando con linux y convertir a PDF

Desde que deje de usar como usuario Windows hace algunos años (que no en servidores, que desde 1996 lo he tenido claro) y tener que realizar algunas de las tareas más habituales en el nuevo sistema, me aparecieron nuevos retos y problemas que he tenido que solventar poco a poco.

Normalmente escaneo documentación en papel para archivarla en un gestor de documentos, fácil tengo un escaner y con el programa Xsane de Linux realizo el resto. Documentos multipágina, exportación a PDF, blanco y negro, color, etc… El mayor problema es que los ficheros que genera el escaner por cada página escaneada (en formato PNM) suelen ocupar entre 4 Mb y 20 Mb, tamaños inmanejables sobre todo si queremos generar un PDF de un cierto número de páginas y mandarlo por correo electrónico.

La primera idea fue convertir todos esos ficheros de imagen y tamaño brutal en un formato más común y fácil de manejar, pero claro cuando tienes un buen número de ellos la opción de abrir Gimp y retocarlos uno a uno queda descartada. Buscando una forma de automatizar el problema encontré una manera de hacerlo de la siguiente forma:

find . -name “*.pnm” -exec convert {} -format jpg {}.jpg \;

Básicamente lo que hace la orden es con el comando find buscar todos los ficheros pnm que tenemos en una carpeta, tras encontrarlos los convertirá a jpg con el programa convert y les pondrá de nombre el mismo que tenían antes pero con extensión jpg. Si todos estos ficheros JPG los queremos guardar en un PDF volveremos a utilizar el comando convert de la siguiente manera:

convert *.jpg nuevo_fichero.pdf

Y para finalizar, quizás en algún momento tengamos que unir varios PDF en uno sólo. Podremos conseguirlo usando la siguiente orden:

gs -dNOPAUSE -sDEVICE=pdfwrite -sOUTPUTFILE=primeroYsegundo.pdf -dBATCH primero.pdf segundo.pdf

Las órdenes convert y gs las podremos encontrar en nuestro sistema linux dentro de los programas ImageMagick y Ghostscript-gpl respectivamente.

Entradas relacionadas

Sobre el autor: Juan Carlos Giménez Moncada

Luchando con el Open Source desde 1996...

Comentarios cerrados.

Nube de etiquetas

PHP Freelancer