GithubHelp home page GithubHelp logo

etl-com-python---dio's Introduction


SobreFuncionalidadesETLTecnologiasAutor

💻 Sobre o projeto

📟 ETL com Python - Para este projeto foi utilizada uma base dados que contem a relação de usuários, seus tipos de planos, taxa de cancelamento, entre outras informações. O objetivo aqui é realizar um processo de ETL, visando analisar e transformar os dados para encontrar as causas de cancelamento.

Você pode encontrar os códigos feitos pelo colab aqui.

Devido ao grande número de usuários, a base de dados pode ser acessada apenas dentro do próprio código.

Projeto desenvolvido durante o Bootcamp de Ciência de Dados com Python da DIO. Esse bootcamp é uma experiência online, um programa com mais de 80 horas de experiência prática nas principais tecnologias que norteiam o Python, também oferece desafios de código e projetos individuais.


⚙️ Funcionalidades

  • Extração, Analise, Transformação e Carregamento de dados;

📄 ETL

Extrair

Durante a extração, o ETL identifica os dados e os copia de suas origens, de forma que possa transportar os dados para o armazenamento de dados de destino. Os dados podem vir de fontes estruturadas e não estruturadas, incluindo documentos, emails, aplicações de negócios, bancos de dados, equipamentos, sensores, terceiros e muito mais. Antes de serem transformados, os dados precisam ser cuidadosamente analisados afim de eliminar quaisquer redundancias, valores nulos, ou até mesmo dados que não nos ajudem a chegar a uma conclusão satisfatória.

Transformar

Como os dados extraídos são brutos em sua forma original, eles precisam ser mapeados e transformados para prepará-los para o armazenamento de dados eventual. No processo de transformação, o ETL valida, autentica, desduplica e/ou agrega os dados de formas que tornam os dados resultantes confiáveis e consultáveis.

Carregar

O ETL move os dados transformados para o armazenamento de dados de destino. Esta etapa pode implicar o carregamento inicial de todos os dados de origem ou pode ser o carregamento de alterações incrementais nos dados de origem. Você pode carregar os dados em tempo real ou em lotes programados.


🛠 Tecnologias

As seguintes ferramentas foram usadas na construção do projeto:


🦸 Autor


Lucas Henrique Proença

Linkedin Badge


etl-com-python---dio's People

Contributors

lucashproenca avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.