GithubHelp home page GithubHelp logo

yesicamilagros / commerce_data_analysis_and_recommendations Goto Github PK

View Code? Open in Web Editor NEW

This project forked from cistelsa/commerce_data_analysis_and_recommendations

0.0 0.0 0.0 24.7 MB

License: MIT License

Jupyter Notebook 100.00%

commerce_data_analysis_and_recommendations's Introduction

banner_tipster

COMMERCE DATA ALALYSIS AND RECOMMENDATIONS


Tabla de Contenido



El Repositorio

En el repositorio se encuentran los siguientes archivos:

  • 1. ETL: Archivos en los cuales se documenta el proceso de ETL (Extract, Transform, Load).
  • 2. Datasets: Contiene el conjuntos de datos normalizados, respecto del origen, para ser utilizados en el proyecto y que no provienen de API's.
  • 3. EDA: Archivos en los cuales se documenta el proceso de EDA (Exploratory Data Analysis).
  • 4. Model ML: Jupyter Notebooks con pruebas para el desarrollo del Modelo de Machine Learning para el proyecto.
  • 5. Sources: Aquí se encuentra los archivos anexos como imágenes, videos y demás recursos necesarios para el desarrollo del proyecto.
  • 6. Documentation: Documentos relacionados al desarrollo del proyecto.


Autores

Nombre Rol Correo GitHub Linkedin
Leydy Lucena Peñaloza Rojas Technical Project Managet, Data Engineer, Data Scientist [email protected] leydypenaloza leydy-penaloza
Edisson Camilo Ortiz López Data Analyst, Data Engineer, Visual Designer [email protected] cistelsa camilo-ortiz-cistelsa
Aldemar Bohorquez Rodriguez Data Engineer, Data Scientist, Machine Learning Engineer [email protected] aldemarbr94 aldemar-bohorquez-rodriguez
Mayren Gabriela Silva Basto Data Analyst, Data Engineer, Machine Learning Engineer [email protected] MayrenS95 mayren-gabriela-silva-basto
Yesica Milagros Leon Ccahuana Data Analyst, Data Engineer, Data Scientist [email protected] yesicamilagros yesica-leon-ccahuana


Introducción

Como consultores de datos, centrados en el análisis del mercado del turismo estadounidense, presentamos a continuación el desarrollo de este proyecto. Nuestra misión es proporcionar a los clientes finales herramientas que les permitan mejorar sus campañas de marketing, tomar decisiones informadas sobre inversiones y ofrecer recomendaciones basadas en experiencias previas para sus usuarios.

El mercado del turismo en Estados Unidos es dinámico y competitivo. Nuestro proyecto aborda la necesidad de comprender mejor este mercado y aprovechar sus oportunidades; con este objetivo en mente, hemos desarrollado un conjunto de herramientas y análisis que ayudarán a nuestros clientes a optimizar sus estrategias.

En este repositorio, encontrará detalles sobre nuestra metodología, análisis de datos, modelos de machine learning y visualizaciones que respaldan nuestras recomendaciones. Esperamos que este proyecto brinde claridad y valor a nuestros clientes, mejorando la toma de decisiones y las experiencias de sus usuarios en el mercado del turismo norteamericano.



Entendimiento de la Situación Actual del Sector

En la actualidad la opinión de los usuarios se ha convertido en un insumo importante para la toma de decisiones en las organizaciones. Sin importar el tamaño de las mismas, la experiencia que proporciona un producto y/o servicio se ha venido transformando con el paso del tiempo y el uso de las tecnologías, pues estas permiten el estar más interconectados, indistintamente del lugar en el que nos encontremos.

“El 52% de los usuarios a nivel global creen que las empresas deben tomar acciones para mejorar a partir del feedback de sus clientes”, según Microsoft. Las empresas son conscientes de lo anterior y del nivel de afectación que conlleva la facilidad con la que hoy día los usuarios comunican sus experiencias y como esto influye en las decisiones de posibles clientes, permitiendo el reaccionar, transformarse, anticiparse a diversas acciones del usuario, incluso fidelizar al mismo.

Por tanto, existen plataformas en la web que permiten recopilar esta información, como Yelp, que es una plataforma de reseñas de todo tipo de negocios, restaurantes, hoteles, servicios entre otros. Los usuarios utilizan el servicio y luego suben su reseña según la experiencia que han recibido; asimismo, Google posee una plataforma de reseñas de todo tipo de negocios, restaurantes, hoteles, servicios, entre otros integrada en su servicio de localización y mapas, Google Maps.

Sin embargo, toda esta información no es de utilidad sin el procesamiento y manejo adecuado, por ello, gracias al avance de la ciencia enfocada en el análisis de datos, se pueden usar herramientas que permiten identificar el estado actual, tendencias, pronósticos y supuestos en diversos escenarios, para finalmente tomar las decisiones pertinentes que permitan aumentar la satisfacción del cliente, posicionar la marca y utilidad de la organización.



Objetivos y Alcance

♦ Objetivo General

Proporcionar al cliente un análisis detallado de la opinión de sus usuarios en distintas plataformas con el fin de planificar nuevas estrategias.

♦ Objetivos Específicos

  • Recopilar, depurar y disponibilizar la información en un Data Warehouse (proceso de ETL) de forma estática y dinámica.
  • Analizar el conjunto de datos cargados en el Data Warehouse y resumir sus principales características (proceso del EDA).
  • Entrenar y poner en producción un modelo de Machine Learning que permita predecir cuáles son los rubros del negocio que más crecerán o decaerán y dónde es conveniente emplazar nuevos locales del negocio.
  • Generar a través de Machine Learning un sistema de recomendación del negocio para los usuarios con el propósito de que estos puedan conocer nuevas temáticas basados en sus experiencias previas.

♦ Alcance

  • Se seleccionarán otras plataformas de información, además de Yelp y Google Maps, que contengan información pertinente y permitan complementar el proceso de ETL y EDA.
  • Se usarán diversas herramientas tecnológicas, como Micfrosoft Fabric, para llevar a cabo el proceso de ETL y EDA.
  • Se facilitará un informe y dashboard al cliente con los procesos de ETL, EDA, predicción del comportamiento de los rubros y sistema de recomendación del negocio a través de una API o aplicación.


Key Performance Indicators - KPI's

KPIs propuestos :

  • Índice de satisfacción del cliente : La opinión inmediata de los clientes tras finalizar la interacción con la empresa es una buena forma de conocer su percepción sobre el servicio brindado .

    Numero_de_clientes_satisfechos/total_de_clientes_encuestados*100
    Es decir, el nivel de puntuación de satisfacción del cliente de la empresa que utilizamos en este ejemplo es del 72,5%.

  • Net Promoter Score(NPS) Puntuación Neta del Promotor: evalúa el grado en que un cliente recomienda un cierto rubro (si un cliente aprecia un servicio lo suficiente como para recomendarla a otros) % Detractores - % Promotores = NPS

  • Índice de Penetración del Mercado (MPI): la penetración del mercado se centra en reforzar la relación e interacción de los clientes con el servicio a fin de aumentar el compromiso o engagement de las personas con el servicio prestado. % MPI = Clientes que accedieron al servicio / tamaño total de mercado para este servicio.

  • El Coste de Adquisición del Cliente o CAC: cuánto dinero has utilizado para capturar a nuevos clientes .CAC = (Marketing + Ventas) / Clientes Adquiridos.

  • Tasa de Retencion del Cliente: Se trata de un porcentaje que mide cuántos clientes conserva una empresa al final de un plazo determinado, después de comparar la adquisición de nuevos clientes contra el número de clientes que se perdieron.

Stack Tecnológico - Pipeline

Son diversas herramientas las cuales nos van a ayudar a cumplir nuestros objetivos a nivel Técnico y Profesional, a continuación se detallan de la mejor forma:

Microsoft Fabric: Es un todo en uno de data, se integran todas las herramientas para ETL, EDA y DA. Se propuso esta herramienta con el fin de adelantarnos a la tendencia, ya que se encuentra en fase Beta y pronto saldrá la versión Oficial, viniendo de Microsoft y la inversión que ha realizado los ultimos años en herramientas de data posicionandose en segundo lugar, tendremos la mejor experiencia en un entorno muy Profesional y nos ayudará para futuros proyectos en diferentes empresas.

NoteBooks: Trabajaremos con esta herramienta conectada a Python, SQL y Apache Spark Data Factory: Esta herramienta nos ayuda a tener un flujo de datos entre areas y automatización de tareas, tambien es muy importante para la ingesta de datos en el Data WareHouse.

Apache Spark: Hadoop y Spark nos ayuda para el procesamiento de grandes cantidades de datos en forma de nodos, paralelizando el trabajo y siendo más eficiente de acuerdo su configuración y el tipo de archivo que se use, lo podremos gestionar con Python o con SQL.

Scikit Learn: Lo usaremos para crear nuestros modelos de ML, también con una herramienta "Experiment" la cual realizamos un seguimiento del desarrollo a los modelos de ML y validar las hipotesis.

Power Bi: Aprovecharemos esta herramienta para realizar, el analisis y la vizualización de datos creando un Dashboard muy profesional y en la web.

MatPlotlib: Es indispensable para crear el mejor informe EDA para que nuestros clientes puedan acceder a él de la forma más legible e intuitivo, será necesario traer nuestros modelos de ML allí y exponerlos.

Kusto (KQL): Muy posiblemente usaremos streaming de datos, no es algo seguro pero lo proponemos desde el inicio.

Microsoft Azure: Usaremos la nube de Microsoft para apoyarnos respecto a Bases de datos de SQL Server de ser necesarias, también para realizar el deploy de la aplicación para nuestros clientes a través de Fast API, usando Docker.

♦ Pipeline

El diagrama de Pipeline tecnológico se encuentra a continuación:

Nuestra Aplicación ofrece a los clientes información precisa respecto a:

  1. Recomendaciones de ubicación para nuevos Hoteles: hacemos uso de análisis de datos y modelos de machine learning para identificar las ubicaciones óptimas para nuevos hoteles de su cadena, considerando variables como la densidad de población, el turismo, la afluencia de viajeros, eventos locales y los precios de la propiedad raíz, maximizando así su éxito en el mercado.

  2. Recomendaciones para segmentación de Anuncios en Google y Redes Sociales: Utilizamos análisis de datos y modelos de machine learning para recomendar estrategias de segmentación y palabras clave altamente efectivas en Google y redes sociales, considerando la demografía, el turismo, los viajeros y los eventos locales de ubicaciones específica, optimizando así su presencia en línea y aumentando la conversión.

  3. Outsourcig Logístico: identificamos áreas de mejora a partir de opiniones y calificaciones negativas, impulsando una experiencia de hospedaje más satisfactoria.

Respecto a lo desarrollado definimos unos limites y lo que no podemos hacer, no podemos ofrecer el servicio al 100% del gremio ya que si son cadenas de Hoteles nuevas no tenemos un histórico de data para ofrecer el servicio.

commerce_data_analysis_and_recommendations's People

Contributors

leydypenaloza avatar cistelsa avatar aldemarbr94 avatar yesicamilagros avatar mayrens95 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.