GithubHelp home page GithubHelp logo

nubank-to-csv's Introduction

nubank-to-csv

Script que converte o PDF da fatura do NuBank para CSV, já somando o IOF de cada item (na fatura o IOF vem em itens separados).

O script converte o PDF para HTML (através do softwar e pdftohtml, contido no pacote poppler-utils) e depois faz parsing do HTML, pegando somente os dados desejados, e depois junta os itens de IOF com o item principal.

Nota: como no PDF não existe a informação do ano, o script entende que o ano da fatura é o ano corrente.

Instalação

Dependências

Dependências do sistema:

apt-get install poppler-utils

Dependências Python:

pip install lxml rows

Caso prefira instalar tudo pelo sistema:

apt-get install poppler-utils python-lxml python-rows

Script

Baixe o arquivo nubank.py contido nesse repositório.

Uso

Primeiro converta o PDF para HTML e depois rode o script em cima do HTML.

Converter de PDF para HTML:

pdftohtml XXX.pdf

onde XXX.pdf é o caminho para o arquivo de sua fatura. Isso irá gerar um arquivo XXXs.html (dentre outros) no mesmo diretório.

Converter de HTML para CSV:

python nubank.py XXXs.html minha-linda-fatura.csv

Agora é só brincar com o arquivo minha-linda-fatura.csv! ;-)

Contribua!

O software é livre e você pode contribuir. :) Sugestões de contribuição:

  • Criar função para já rodar o pdftohtml automaticamente, de forma que precisemos rodar apenas um comando (o próprio nubank-to-csv).
  • Criar um aplicativo Web simples em que seja possível fazer o upload do PDF e o download do CSV convertido.

nubank-to-csv's People

Contributors

turicas avatar

Stargazers

Melquias Ribeiro avatar Patrick Antonioli avatar Pedro Gomes avatar Caio Pereira avatar Lucas Micheleto avatar  avatar Rômulo Vitor avatar Ycaro Guth avatar Erica Ferreira avatar Vinicius avatar Gabi Cavalcante avatar Jose Ramirez avatar Hugo Penna avatar Igor Silva avatar Bruno Dias avatar Fernando Lopes avatar Marcelle avatar Hercules Merscher avatar Lucas Valhos avatar Luiz Eduardo Fernandes Bentes avatar Caaddss avatar Juliany Raiol avatar Flavio Trascoveschis avatar Pedro avatar Hildeberto avatar Fernando avatar arturnrm avatar Ricardo Borges avatar Fernando avatar Felipe avatar Vitor avatar Felipe César avatar Joabe da Luz avatar Eduardo Pereira avatar Leandro Luquetti Basilio da Silva avatar Hugo Carreira avatar  avatar Fabio Pinho avatar Arthur Alvim avatar Thiago Nóbrega avatar Paulo avatar Silvio Luiz avatar Haroldo Ramirez da Nobrega avatar Thiago Medeiros avatar Rafael Gontijo Winter avatar Guido Percú avatar Pablo Benmaman avatar Douglas Aguiar avatar Christopher Moura avatar

Watchers

 avatar James Cloos avatar Rafael Gontijo Winter avatar Luis Helder avatar Leandro M Biondo avatar arturnrm avatar  avatar Flavio Trascoveschis avatar

nubank-to-csv's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.