PDF significa Formato de Documento Portátil. Adobe lo creó en 1993, y el nombre es toda la explicación: el documento es portátil. Se ve igual en tu pantalla, en la pantalla de tu colega, en una impresora en otro país o en un teléfono de hace cinco años. El archivo lleva todo lo que necesita para mostrarse correctamente y no depende de nada que tengas instalado.
Dónde se Originó la Idea
La idea en sí proviene de un memorando escrito por uno de los fundadores de Adobe, John Warnock, titulado The Camelot Project en 1991.
En retrospectiva, su problema es bastante evidente: diseñas algo usando tu computadora y, cuando se ve desde otra computadora, luce completamente diferente: fuentes incorrectas, diseños desordenados y formato roto.
Warnock quería que los documentos se describieran como instrucciones para crear algo en lugar de estar vinculados a un software específico. En otras palabras, algo más cercano a un documento impreso, pero digital.
Cómo se Ve Realmente un PDF
Un PDF no es una imagen de las páginas que creas. En cambio, un PDF es esencialmente un índice de comandos de renderizado.
El PDF incluye un flujo de contenido que contiene todas las instrucciones necesarias para recrear los elementos:
“Renderiza este carácter en estas coordenadas con esta fuente.”
Las definiciones de fuentes, imágenes, colores y otros recursos están incluidos dentro del propio archivo. Todo está empaquetado junto.
Finalmente, el archivo PDF tiene un índice al final llamado tabla de referencias cruzadas que le indica al lector dónde se encuentra cada página dentro del archivo. Así es como los lectores pueden acceder a la página 80 sin tener que leer las páginas 1 a la 79.
Significado de las Versiones PDF
Todos los archivos PDF tienen un número de versión inicial al comienzo de su primera línea, como:
%PDF-1.7
El formato ha sido modificado varias docenas de veces desde su creación en 1993.
Sin embargo, el evento más importante ocurrió en 2008, cuando Adobe transfirió la especificación a la organización internacional de estándares ISO. Se convirtió en ISO 32000, un estándar abierto que no pertenece a nadie.
Esto significa que cualquiera puede acceder libremente a sus especificaciones y crear herramientas para trabajar con PDFs sin pagar a Adobe ni pedir permiso.
Por eso el soporte para PDF fue implementado por navegadores de Mozilla, Google y Apple sin restricciones.
En 2017, se lanzó la versión 2.0 con mejoras en cifrado y funciones de accesibilidad.
Casi todos los archivos PDF utilizados hoy en día dependen de las versiones 1.4 a 1.7.
Cómo los Navegadores Pueden Ver PDFs Sin Plugins
Abrir un PDF en Chrome o Firefox antes de 2010 normalmente requería cargar un plugin de Adobe Reader dentro del navegador. Esos plugins eran famosos por su lentitud y por fallar con frecuencia.
Google comenzó a integrar un visor PDF incorporado en Chrome en 2010 llamado PDFium.
El visor es de código abierto y ahora se utiliza ampliamente en muchas aplicaciones, incluyendo:
- Microsoft Edge
- Android WebView
- Otros navegadores basados en Chromium
Firefox usa su propio renderizador llamado PDF.js, mientras que Safari utiliza el renderizador nativo de la plataforma de Apple.
El visor PDF se convirtió en una historia de éxito silenciosa: utilizado discretamente por millones de personas todos los días.
Por Qué Algunos Archivos PDF Son Tan Grandes
Todo el mundo asume que los archivos PDF siempre son pequeños. No lo son.
El texto se comprime extremadamente bien porque las letras son fáciles de codificar de manera eficiente.
¿Qué es lo que realmente ocupa espacio en los PDFs?
Las imágenes.
Una sola imagen de alta resolución puede ocupar varios megabytes. Un documento escaneado de diez páginas puede superar fácilmente los 50 MB porque cada página contiene un escaneo completo de imagen.
Diferentes tipos de datos utilizan distintos algoritmos de compresión:
| Tipo de Datos | Algoritmo de Compresión |
|---|---|
| Fotografías | JPEG |
| Escaneos en blanco y negro | JBIG2 |
| Datos generales del documento | Flate |
¿Qué hace realmente un programa de compresión PDF?
Principalmente, reduce la calidad de las imágenes mientras deja el texto intacto.
Preguntas Comunes
¿Puedo Editar Texto en un Documento PDF?
En teoría: sí. En la práctica: no muy bien.
Los PDFs están diseñados principalmente para visualización, no para edición.
Aplicaciones como Adobe Acrobat y muchos editores PDF en línea permiten editar texto, pero el formato a menudo se vuelve inconsistente porque el documento nunca fue pensado para comportarse como un archivo de procesador de texto.
¿Por Qué No Puedo Resaltar Texto en Este PDF?
El archivo probablemente sea un documento escaneado.
No hay una capa de texto real, solo imágenes de texto. Para que el texto sea seleccionable, el documento debe pasar por OCR (Reconocimiento Óptico de Caracteres).
¿Puedo Ver de Forma Segura un Archivo PDF de una Fuente Desconocida?
Generalmente, sí.
Los archivos PDF técnicamente pueden contener código JavaScript, y en el pasado ha habido vulnerabilidades en el software lector de PDF.
Sin embargo, los visores PDF modernos basados en navegador son significativamente más seguros y más difíciles de explotar que las antiguas aplicaciones lectoras independientes.