
Idioma
Java
Tipo de herramienta
Aplicación de escritorio
Licencia
The MIT License
Versión
1.2.1
Manuel Aristarán

Tabula es una aplicación de escritorio que extrae tablas de archivos PDF para convertirlas en formatos editables como CSV o Excel. Diseñada para superar las limitaciones de manipulación de datos en PDF, Tabula es fundamental en el análisis de datos y la investigación periodística. Desarrollada para simplificar la extracción de datos de documentos PDF, Tabula se comparte para mejorar la accesibilidad y manipulación de datos en formatos no editables. Utilizada ampliamente en periodismo y análisis de datos, su capacidad para transformar información en tablas en formatos usables es invaluable.
Tabula resuelve el problema de acceder y manipular datos atrapados en tablas dentro de documentos PDF, un formato notoriamente difícil para la edición y extracción. Facilita el análisis de datos y apoya a periodistas y analistas en su trabajo de investigación.
Convierte las tablas PDF basadas en texto en CSV/Excel. Procesamiento local para seguridad de datos. Interfaz web fácil de usar. Admite múltiples plataformas (Windows, Mac, Linux). No requiere acceso a Internet.
Requiere un entorno de tiempo de ejecución Java compatible con Java 7 o superior. Integra lenguajes JVM para una mayor flexibilidad. Ofrece enlaces con JRUBY y R para facilitar el desarrollo en diferentes lenguajes. Despliega aplicaciones de manera eficiente utilizando Docker para la contenedorización. Adopta una licencia MIT, promoviendo el uso y la distribución abierta del software.

Conéctese con el equipo de Código para el Desarrollo y descubra cómo nuestras herramientas de código abierto, cuidadosamente curadas, pueden apoyar a su institución en América Latina y el Caribe. Escríbanos para explorar soluciones, resolver dudas de implementación, compartir éxitos de reutilización o presentar una nueva herramienta. Escríbenos a [email protected]

Tabla con proyecciones de déficits presupuestarios para 2012-2022. Muestra cifras anuales y totales para medidas de crecimiento, salud, defensa, ingresos fiscales y más, en miles de millones de dólares.

Esta imagen presenta un fragmento de código Java para un ejemplo de uso de API que extrae filas y celdas de tablas en un documento PDF utilizando Apache PDFBox.

Agradecimiento en Tabula: Apoyos para tabula-java de donantes como DB, IN, BS, SG, ER. También agradecen a Knight Foundation y Shuttleworth Funded por su apoyo financiero.
Página principal para descargar y ver cómo funciona
Paso a paso sobre cómo extraer datos desde PDFs
Guía práctica de uso para gobiernos y periodistas
Demostración práctica en español
