Skip to content

vitorVBD/Extracao-Inteligente-de-Dados-de-Notas-Fiscais-PDF-Excel-com-Python-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Nota Fiscal
Extração Inteligente de Dados de Notas Fiscais (PDF → Excel com Python)
(AUTOMATIZAR-PROCESSOS-EM-PYTHON)

Este projeto é uma aplicação Python para extrair dados de notas fiscais em formato PDF e gerar um relatório em Excel. Utiliza bibliotecas como pdfplumber, pandas e re para realizar a extração e manipulação dos dados. 💡

Estrutura do Projeto

Arquivos Principais

  • main.py: Script principal que realiza a extração dos dados do PDF e gera o relatório em Excel.
  • nota_fiscal_teste.pdf: PDF que criei simulando várias notas fiscais para testar o código.
  • readme.md: Documentação do projeto (este arquivo).
  • relatorio_notas.xlsx: Exemplo de formato após a extração.

Estrutura de Pastas

extrair_dados_de_pdf_python/
├── assets/
│ └── nota_fiscal_teste.pdf
├── main.py
├── readme.md
└── relatorio_notas.xlsx

Funcionalidades

  • Extração de Dados: Extrai informações como número da nota fiscal, data de emissão, CNPJ e valor total das notas fiscais presentes no PDF.
  • Geração de Relatório: Gera um relatório em formato Excel (relatorio_notas.xlsx) com os dados extraídos.

Tecnologias Utilizadas

  • Python: Linguagem de programação utilizada para desenvolver o script.
  • tqdm: Adiciona uma barra de carregamento no terminal para mostrar o progresso da extração.
  • pdfplumber: Biblioteca para manipulação e extração de texto de arquivos PDF.
  • pandas: Biblioteca para manipulação e análise de dados.
  • re: Biblioteca para operações com expressões regulares.

Instruções para Uso

  1. Certifique-se de ter o Python instalado em sua máquina.
  2. Instale as bibliotecas necessárias utilizando o comando:
    pip install pdfplumber pandas tqdm
  3. Coloque o arquivo PDF da nota fiscal na pasta assets (certifique que seja um texto e não uma imagem e dizer o caminho correto para o arquivo no pdf_path).
  4. Execute o script main.py:
    python main.py
  5. O relatório será gerado na raiz do projeto (logo abaixo de main.py) com o nome relatorio_notas.xlsx.

Licença

Este software é licenciado sob os termos da MIT License.

Desenvolvedor

⌨️ Desenvolvido por Vitor Bittencourt

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages