Parece que este serviço está em espera
Vou extrair dados de PDFs para Excel usando python
Holanda
Automação em Python, Web Scraping, Bots
Sobre este Serviço
Tem uma pilha de PDFs com dados presos em tabelas? Notas fiscais, relatórios, formulários, extratos. Eu vou colocar tudo em um arquivo Excel limpo.
Uso pdfplumber e tabula para extração de tabelas, além de lógica personalizada de parsing para layouts complicados. Tabelas que atravessam várias páginas, colunas com larguras inconsistentes, células mescladas. Já lidei com tudo isso. Se seus PDFs forem imagens digitalizadas ao invés de texto, também posso rodar OCR.
Você envia os PDFs, me diz quais campos precisa, e eu cuido do resto. Faço um teste com 2-3 arquivos primeiro, pra você conferir o resultado antes de processar tudo.
Ferramentas: Python, pdfplumber, tabula, openpyxl, Pandas, OCR (Tesseract)
