GithubHelp home page GithubHelp logo

elinefarias / formacao-datawarehouse-redshift-bigquery-snowflake Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 10 KB

Repositório destinado a estudos sobre a plataforma snowflake

License: Apache License 2.0

bigquery redshift snowflake

formacao-datawarehouse-redshift-bigquery-snowflake's Introduction

Formação Data Warehouse com Redshift, BigQuery e SnowFlake

Bem-vindo ao meu repositório! Aqui você encontrará o que aprendi durante o Curso de Data Warehouse. Este repositório serve como um registro do meu progresso e das habilidades que adquiri ao longo do curso.

Descrição :

Um data warehouse é um sistema de armazenamento de dados projetado para análise eficiente de informações de negócios. Serve como um repositório central de dados extraídos de várias fontes, fornecendo insights estratégicos para a tomada de decisões organizacionais. Neste curso foi abordado as três das principais ferramentas de Data Warehouse:

  • Snowflake: um data warehouse nativo da nuvem que oferece escalabilidade, segurança e desempenho sem a necessidade de gerenciar infraestrutura física. Utiliza uma arquitetura de banco de dados em nuvem que separa o armazenamento de dados do processamento de consultas, permitindo escalabilidade independente.

  • Amazon Redshift: um data warehouse baseado em nuvem que permite armazenar e analisar grandes volumes de dados usando SQL. Utiliza uma arquitetura em cluster massivamente paralela para processar consultas de forma rápida e eficiente, permitindo análises em tempo real e escalabilidade.

  • BigQuery: um serviço de data warehouse baseado em nuvem que permite armazenar e analisar grandes volumes de dados usando SQL. Utiliza uma arquitetura de processamento em coluna para consultas rápidas e escaláveis em grandes conjuntos de dados.

Conteúdo :

  • Fundamentos de Data Warehouse, incluindo clusters, replicação, particionamento, armazenamento colunar e tolerância a falhas.

  • Modelagem de Dados para Data Warehouses, como modelos dimensionais star e snowflake, modelo relacional, Galaxy Schema e outros.

  • Fundamentos e aplicações em Redshift, incluindo conceitos como sortkey, distkey, diststyle, cache, criação de consultas utilizando CTEs, planos de execução, vinculação a dados externos, importação com copy, views e views materializadas.

  • Fundamentos e aplicações em BigQuery, como criação de projetos, tabela pivot, partições, tabelas externas, views e mais.

  • Fundamentos e aplicações em Snowflake, incluindo Virtualwarehouse, cache, clustering, views, time travel, fail-safe, tasks e mais.

  • Criação de um projeto prático: carga de dados do staging de forma incremental para um Data Warehouse, utilizando CDC, streams e tasks.

Os tipos da linguagem SQL são:

  • DDL - Linguagem de Definição de Dados (Data Definition Language).
  • Estes comandos interagem com os objetos do banco.

    Comandos DDL: CREATE, ALTER e DROP.

  • DML - Linguagem de Manipulação de Dados (Data Manipulation Language).
  • Estes comandos interagem com os dados dentro das tabelas.

    Comandos DML: INSERT, DELETE e UPDATE.

  • DQL - Linguagem de Consulta de Dados (Data Query Language).
  • Estes são comandos de consulta.

    Comando DQL: SELECT (às vezes agrupado na DML, dependendo da fonte).

  • DTL - Linguagem de Transação de Dados (Data Transaction Language).
  • Estes comandos controlam as transações.

    Comandos DTL: BEGIN TRANSACTION, COMMIT e ROLLBACK.

  • DCL - Linguagem de Controle de Dados (Data Control Language).
  • Estes comandos controlam a segurança do banco de dados.

    Comandos DCL: GRANT, REVOKE e DENY.

formacao-datawarehouse-redshift-bigquery-snowflake's People

Contributors

elinefarias avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.