30 de julio de 2013

El formato PDF: algunos Mitos y Realidades

A pesar de que el formato PDF ya lleva un tiempo con nosotros (más de 20) y es por lo tanto un viejo conocido en el mundo del diseño y la preimpresión, existe todavía bastante desconocimiento sobre sus posibilidades, sobre todo ahora en la nueva era digital donde parece ser que todo ha de ser HTML (o EPUB) o no será.

Es por eso que, a pesar de no ser la primera vez ni mucho menos que abordo este tema en este blog, me dispongo a relatar un breve listado de mitos y realidades sobre el PDF en la era digital:


  • El PDF sólo sirve para imprimir, no es un formato viable de e-book: Falso. La principal razón por la que el formato EPUB está superando al PDF como formato hegemónico de comercialización de libros electrónicos es el espaldarazo de algunos fabricantes clave, como por ejemplo Apple, al formato EPUB en detrimento del PDF. Un documento PDF se puede leer perfectamente tanto en e-readers como en tablets y smartphones, tanto en modo de maquetación fija como en modo reflujo, dispone de hipervínculos, tabla de contenidos, etc. y todo lo necesario para que pueda ser una opción perfectamente válida para distribuir e-books.

  • El PDF no se adapta para la lectura en pantallas pequeñas. Falso. Recuerdo que hace diez años (antes de la era de los tablets y smartphones) yo ya leía archivos PDFs en mi pequeño PocketPC usando la app Adobe Reader (sí, la de Adobe) y ahí podía elegir si veía mis archivos en modo maquetación fija o reflujo con una sencilla opción de menú. Estamos hablando de pantallitas de 3.5 pulgadas a una resolución de 320x240 pixels !!
Muestra de un PDF en modo reflujo en Adobe Reader para PocketPC (año 2002)

La opción de poder visualizar un PDF en modo reflujo es muy antigua, pero quizás desconcida. Si dispones de Adobe Reader (desde versiones ‘inmemoriales’) tanto para Mac como para Windows, tendrás disponible una opción de Vista en Reflujo. Ello te permitirá hacer la ventana de Adobe Reader Desktop tan estrecha como quieras, que adaptará los contenidos refluyendo el texto, pero respetando las fuentes incrustadas y, por supuesto, las imágenes en su posición original.

Esta posibilidad es una funcionalidad de Adobe Reader y no del PDF, a no ser que el archivo PDF sea una mera imagen fruto de un escaneado donde no se ha querido hacer la labor de reconocimiento de texto por OCR (opción incluida en Adobe Acrobat y que tarda segundos en hacer).


La opción de vista en reflujo está en Adobe Reader (Mac/Win) desde hace años.


Cualquier archivo PDF se puede convertir en un documento accesible según los estándares ISO vigentes usando solamente Adobe Acrobat. De este modo, la documentación digital en PDF estará certificada para ser leída en voz alta con software especial para personas invidentes, además de conservar un orden de lectura adecuado para cuando los contenidos refluyan en una pantalla pequeña (e-reader, smartphone, etc.). Por ejemplo con Adobe Reader para Android es posible hacerlo de manera muy sencilla.


Captura de pantalla de Adobe Reader para Android en un Smartphone, indicando la opción que permite conmutar de la vista de maquetación fija a la vista en reflujo


La única excepción son los dispositivos móviles iOS (iPad, iPhone, iPod Touch). ¿Por qué? Cuando Apple desarrolló su sistema operativo para móviles, decidió no sacarle el máximo partido a los PDFs y tratarlos como meros gráficos vectoriales, relegándolo entonces para usos marginales al impedir o dificultar en extremo la posibilidad de que los desarrolladores de iOS pudieran crear apps que permitieran extraer los contenidos accesibles de un PDF y mostrarlos en modo reflujo. El motivo último por el cual Apple optó por esa vía no lo sabremos del todo, pero se pueden intuir...

  • No se puede extraer información de un PDF: Casi Falso. Cuando se ideó el PDF todavía era mucho antes de nuestra era actual y su fiebre del Big Data. Ahora se desea acceder, extraer y manipular fácilmente los datos que se hacen públicos. Cuando el formato elegido para ello es el PDF, se critica que es algo inaccesible, donde es difícil de sacar información purificada.
    Ciertamente no hay —que yo sepa— ninguna herramienta que permita extraer fácil y alegremente datos de párrafos o tablas dentro de un PDF. En el caso de páginas web HTML sucede algo similar. A penas ahora empiezan a ver la luz herramientas prácticas como Scraper para el navegador Google Chrome que permiten hacer este tipo de prácticas empleando tecnologías como XPath. Hasta entonces, era casi igual de complicado extraer información pública a no ser que el organismo que la ofrecía se molestara en permitir su descarga en formatos planos como el .CSV, .TAB o .XLS (Excel). Un documento PDF se puede etiquetar para hacerlo accesible en cuestión de segundos y exportarlo en una variedad de formatos, incluyendo la hoja de cálculo Excel también. 

  • El formato PDF no es óptimo para el almacenamiento a largo plazo: Falso. Precisamente una de las variantes del PDF, el estándar ISO PDF/A es el que están usando muchas bibliotecas públicas de entidad para construir un archivo definitivo de su fondo bibliográfico.
    Este formato permite guardar diseño y contenidos abiertamente en un solo documento unificado, y tiene el respaldo de ser un estándar ISO, con todo lo que ello conlleva a efectos de fiabilidad. Otros estándares de documentación electrónica más en boga hoy en día, como el EPUB, no pueden decir lo mismo y todavía adolecen de ser formatos demasiado veleidosos y sujetos a cambios e indecisiones constantes por parte de los encargados de su promoción y mantenimiento.  

Muchos expertos en documentación digital afirman con buen criterio que el candidato óptimo para ser el formato de almacenamiento digital a largo plazo debería ser el XML. Y así es, pero hay que tener en cuenta que PDF también es compatible no solamente con XML si no que algunas versiones del mismo PDF ya se almacenan directamente siguiendo este formato. 

Cabe recordar que, por ejemplo Google, tanto en su iniciativa Google Books de archivo masivo del fondo bibliográfico histórico mundial como con su tienda de e-books Play Books emplea como base el formato PDF para poder guardar tanto la información accesible (y por lo tanto, refluible) de esos libros como su aspecto gráfico original.


Con esto no quiero decir que con el PDF todo sean bondades. Existen todavía muchos hándicaps a superar en el mundo digital sobre todo y donde no parece que este formato esté haciendo los deberes a la velocidad que debería, pero eso ya será en todo caso motivo de otro post en el futuro ;-)

9 de julio de 2013

Adobe InDesign CC y EPUB ¿Cómo ha evolucionado la cosa?

Huelga decir que, para los que trabajamos en la edición de e-books en formato EPUB usando Adobe InDesign como herramienta de cabecera, estábamos esperando la salida de la nueva versión CC (de Creative Cloud) para ver qué novedades traía en general y en la exportación de EPUB en particular.

La verdad es que InDesign CC ha introducido algunas mejoras de carácter "técnico" (lo que no se ve a simple vista) bastante prácticas y esperadas, ya que van en la senda de evitar al editor tener que retocar manualmente el EPUB para añadir fragmentos de código CSS o XML que mejoren el acabado de los libros. Sin embargo, si esperábais grandes revoluciones en cuanto a EPUB se refiere, quizá esta versión no es la vuestra todavía.

¿Cómo ha mejorado la exportación EPUB en el nuevo InDesign CC? Hagamos un breve repaso por los principales puntos de atención:


  • Exportación CSS más precisa: podemos decir que la exportación de estilos CSS en InDesign CC es algo más completa, en cuanto añade más información que no aparecía en versiones anteriores, como por ejemplo la de viudas y huérfanas, o los saltos de página forzados con la regla CSS page-break-before/after.
CSS generado por InDesign CS6

CSS del mismo archivo InDesign generado por la versión CC, 
incluyendo saltos de página, viudas y huérfanas
  • Por otro lado, el nombre del archivo de hoja de estilos que exporta es más específico, ahora se llama por defecto idGeneratedStyles.css , pensando en que no entre en posible conflicto con otras hojas de estilo CSS externas que ya tuviéramos con nombres más genéricos como template.css o similar.
  • Posibilidad de generar CSS o no para cada estilo en concreto: esta opción puede ser interesante si hay estilos orientados fundamentalmente a papel que no tenemos porqué ver en el archivo CSS final. En el cuadro de diálogo de definición de estilos tenemos una casilla nueva llamada Emitir CSS. Por defecto todos los estilos se emiten al exportar a EPUB.
Nuevo aspecto del apartado "Etiquetas de exportación" del cuadro
de diálogo de Estilos de Párrafo de InDesign CC, donde se puede 
apreciar la opción de "Emitir CSS"


  • Además de las tablas de contenido (que ahora se exportan como archivos html por separado) también se incluyen las cajas de texto que contienen los índices alfabéticos que generemos con el panel de Índice de InDesign. Estos índices además contienen hipervínculos que apuntan a diversos puntos de anclaje para cada párrafo del libro donde aparezcan cada una de las instancias del término referenciado en el índice. Estos puntos de anclaje los genera automáticamente InDesign, claro.
  • Los problemas de incrustación de fuentes ya no lo son para iBooks, y de hecho InDesign ahora exporta por fin dentro de la carpeta META-INF el clásico archivo com.apple.ibooks.display-options.xml configurado de tal manera que desbloquee la opción "Original" del menú de fuentes disponibles en la app iBooks. Esto, sumado a la reciente actualización de la herramienta de comprobación epubcheck 3.0.1 que ya no genera el clásico error de que no podía desencriptar las fuentes incrustadas por InDesign, es un gran alivio para los editores que se podrán ir desprendiendo de la "maldición" de tener que renunciar a sus fuentes tipográficas en sus libros EPUB.

Al elegir la —otrora problemática— opción de incrustar fuentes en InDesign, éste genera el archivo que permite a iBooks desbloquear la opción "Original" del listado de fuentes, permitiendo así respetar el diseño tipográfico que le habíamos dado en InDesign

Por otro lado, en lo que respecta a la exportación en CSS de Estilos de Objeto, a efectos prácticos poco ha cambiado respecto a la versión CS6. Ahora estos estilos se pueden hacer corresponder con las etiquetas HTML que elijamos con su clase CSS correspondiente, como ya sucedía con los estilos de párrafo o carácter. 
Sin embargo, la exportación CSS sigue creando esa serie de subclases CSS auto-generadas para los DIV y las imágenes por separado que, a nuestro modo de ver, son accesorios: aunque no suponen ningún problema para la maquetación, tampoco suponen ninguna ayuda...



Finalmente hay algunos leves retoques en la forma de denominar la Tabla de Contenidos en el panel de exportación de EPUB, etc.

En resumen y en una frase: InDesign CC exporta un EPUB más depurado y que requerirá de menos retoques artesanales del CSS por nuestra parte (o casi ninguno).

Sobre EPUB3, Maquetación Fija, etc. de momento, vale lo mismo que para CS6. Pero de ello ya hablaremos en un próximo artículo ;-)


2 de julio de 2013

Cursos online de Verano 2013


Además de nuestra tradicional Escuela de Verano que hacemos todos los años en Barcelona, para atender a aquellas de vosotras que estéis en otras zonas geográficas vamos a realizar cursos de verano también en el cómodo formato ONLINE.

En esta ocasión os presentamos los siguientes cursos:



Entra en cada uno de los hipervínculos de cada curso para obtener más información y reservar tu plaza directamente.

¡Feliz verano!





Consulteu aquí la versió en català d'aquest blog