Extração Inteligente de Dados de Notas Fiscais (PDF → Excel com Python)
(AUTOMATIZAR-PROCESSOS-EM-PYTHON)
Este projeto é uma aplicação Python para extrair dados de notas fiscais em formato PDF e gerar um relatório em Excel. Utiliza bibliotecas como pdfplumber, pandas e re para realizar a extração e manipulação dos dados. 💡
main.py: Script principal que realiza a extração dos dados do PDF e gera o relatório em Excel.nota_fiscal_teste.pdf: PDF que criei simulando várias notas fiscais para testar o código.readme.md: Documentação do projeto (este arquivo).relatorio_notas.xlsx: Exemplo de formato após a extração.
extrair_dados_de_pdf_python/
├── assets/
│ └── nota_fiscal_teste.pdf
├── main.py
├── readme.md
└── relatorio_notas.xlsx
- Extração de Dados: Extrai informações como número da nota fiscal, data de emissão, CNPJ e valor total das notas fiscais presentes no PDF.
- Geração de Relatório: Gera um relatório em formato Excel (
relatorio_notas.xlsx) com os dados extraídos.
- Python: Linguagem de programação utilizada para desenvolver o script.
- tqdm: Adiciona uma barra de carregamento no terminal para mostrar o progresso da extração.
- pdfplumber: Biblioteca para manipulação e extração de texto de arquivos PDF.
- pandas: Biblioteca para manipulação e análise de dados.
- re: Biblioteca para operações com expressões regulares.
- Certifique-se de ter o Python instalado em sua máquina.
- Instale as bibliotecas necessárias utilizando o comando:
pip install pdfplumber pandas tqdm
- Coloque o arquivo PDF da nota fiscal na pasta
assets(certifique que seja um texto e não uma imagem e dizer o caminho correto para o arquivo nopdf_path). - Execute o script
main.py:python main.py
- O relatório será gerado na raiz do projeto (logo abaixo de
main.py) com o nomerelatorio_notas.xlsx.
Este software é licenciado sob os termos da MIT License.
⌨️ Desenvolvido por Vitor Bittencourt ☕