
Idioma
Java
Tipo de ferramenta
Aplicativo de desktop
Licença
The MIT License
Version
1.2.1
Manuel Aristarán

Tabula é um aplicativo de desktop que extrai tabelas de arquivos PDF para convertê-los em formatos editáveis, como CSV ou Excel. Projetado para superar as limitações da manipulação de dados em PDF, o Tabula é essencial na análise de dados e na investigação jornalística. Desenvolvido para simplificar a extração de dados de documentos PDF, o Tabula é compartilhado para melhorar a acessibilidade e manipulação de dados em formatos não editáveis. Amplamente utilizado no jornalismo e na análise de dados, sua capacidade de transformar informações de tabela em formatos utilizáveis é inestimável.
Tabula resolve o problema de acesso e manipulação de dados presos em tabelas em documentos PDF, um formato notoriamente difícil de edição e extração. Facilita a análise de dados e apoia jornalistas e analistas no seu trabalho investigativo.
Converte tabelas PDF baseadas em texto em CSV/Excel. Processamento local para segurança de dados. Interface da Web amigável. Suporta várias plataformas (Windows, Mac, Linux). Não requer acesso à Internet.
Requer um ambiente de execução Java compatível com Java 7 ou superior. Integra linguagens JVM para maior flexibilidade. Oferece ligações JRUBY e R para facilitar o desenvolvimento em diferentes linguagens. Desdobra aplicações de forma eficiente utilizando Docker para conteinerização. Adota uma licença MIT, promovendo o uso aberto e a distribuição do software.

Consulte o equipamento de Código para o Desenvolvimento e descubra como nossas herramientas de código abertas, cuidadosamente curadas, podem se apoiar em sua instituição na América Latina e no Caribe. Escritores para explorar soluções, resolver dúvidas de implementação, compartilhar resultados de reutilização ou apresentar uma nova ferramenta. Escreva para [email protected]

Tabela com projeções de déficits orçamentários para 2012-2022. Mostra números anuais e totais para medidas de crescimento, saúde, defesa, receitas fiscais e mais, em bilhões de dólares.

Esta imagem apresenta um trecho de código Java para um exemplo de uso da API que extrai linhas e células das tabelas em um documento PDF usando o apache pdfbox.

Agradecimento em Tabula: Apoios para tabula-java de doadores como DB, IN, BS, SG, ER. Também agradecem à Knight Foundation e Shuttleworth Funded pelo seu apoio financeiro.
Página principal para baixar e ver como funciona
Passo a passo de como extrair dados de PDFs
Guia prático para governos e jornalistas
Demonstração prática em espanhol
