GithubHelp home page GithubHelp logo

data-engineering-r's Introduction

Data Engineering con R

El proceso de Data Science se puede dividir, como ya hablamos en la intruducción en:

  1. Data Engineering (para estructurar los datos).
  • Desarrollar, construir, probar y mantener arquitecturas (como bases de datos y sistemas de procesamiento a gran escala).
  • Implementar una arquitectura útil para los casos de negocios
  • Desarrollo de oportunidades para la adquisición de datos.
  • Establecer procesos de conjuntos de datos para modelización, minería y producción.
  • Emplear una variedad de lenguajes y herramientas para conectar sistemas.
  • Recomendar maneras de mejorar la fiabilidad, eficiencia y calidad de los datos.
  1. Data Scientist (para modelizar los datos).
  • Limpia, organiza y estructura datos. Desarrolla modelos de ML, probabilísticos, realiza análisis y estadísticas descriptivas para desarrollar perspectivas, y resuelve necesidades empresariales.
  • Llevar a cabo desarrollos para responder a preguntas de la industria y los negocios.
  • Aprovechar grandes volúmenes de datos de fuentes internas y externas para responder a ese negocio.
  • Implementar softwares de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y explicativos.
  • Explorar y examinar los datos para encontrar patrones.
  1. Data Analysis (para visualizar datos).
  • Los Data Analysts desempeñan un papel importante al solicitar información de una base de datos o realizar consultas.
  • Pueden procesar y aprovechar los conjuntos de datos para proporcionar informes resumidos y visuales.
  • La función principal de un analista de datos es inferir datos sin procesar para explorar patrones y sacar conclusiones.
  • Utilizan procesos metodológicos y aplican algoritmos para llegar a estas conclusiones.
  • Si bien un analista de datos puede usar algoritmos para respaldar su función, no se espera que los desarrollen ni suelen tener una sólida formación matemática o de investigación, su función requiere una comprensión básica de estadística, recopilación de datos y muy fuerte en visualización y análisis de datos exploratorios.
  • Los analistas de datos ayudan a simplificar los datos complejos a informes y cuadros ad hoc, lo que permite a las empresas explotar al máximo sus datos.

Data Engineering vs Data Scientist:

comparacion

Data Engineer vs Data Analyst: comparacion2

¿Qué vamos a hacer en esta sección de Data Engineering?

  • Extracción de datos mediante bots (Web scraping). Considera que R es el mejor para webscarping
  • Conexión a API’s o Interfaz de programación de aplicaciones (Application Programming Inteface).
  • Extracción de datos desde API’s.
  • Conexión desde R a Bases de Datos.
  • Almacenamiento desde R a Bases de Datos.
  • Introducción a procesos ETL (Extract, Transform and Load)

data-engineering-r's People

Contributors

huanlui avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.