GithubHelp home page GithubHelp logo

Hugo Muniz's Projects

analise-de-grafos-no-gephi icon analise-de-grafos-no-gephi

Neste trabalho foi realizado o web scrapping, utilizando a linguagem R e o R Studio, do site G1 do Globo.com para notícias relacionadas ao BNDES durante o mês de novembro e dezembro de 2020. Posteriormente foi realizado a extração das entidades relacionadas em cada notícia, também pelo R e R Studio, para que fosse possível criar um grafo no programa Gephi. No Gephi foi feito uma análise da força da relação entre os assuntos relacionados ao BNDES em cada comunidade. Este foi um trabalho realizado para aprovação na disciplina de Análise de Mídias Sociais e Mineração de textos do MBA de Business Analytics e Big Data da FGV-RJ.

analise-preditiva-avancada icon analise-preditiva-avancada

Análises de Predições de Vendas e Predições de Subscrições de Serviço. A base Retail foi utilizada nos modelos de regressão para previsão de vendas e a base marketing foi utilizada no modelo de classificação para previsão de subscrições do serviço. No trabalho como um todo foram utilizados os modelos de Regressão Linear e Logística, Árvore de Decisão, SVM e Redes Neurais. Observação: Baixe o arquivo HTML para ver o trabalho completo em formato de relatório.

classificao-de-subscricao-de-servico icon classificao-de-subscricao-de-servico

Análise de Predições de Subscrições de Serviço. A base marketing foi utilizada para previsão de subscrições do serviço com modelos de classificação. No trabalho como um todo foram utilizados os modelos de Regressão Logística, Árvore de Decisão, SVM e Redes Neurais. Observação: Baixe o arquivo HTML para ver o trabalho completo em formato de relatório.

clusterizacao icon clusterizacao

Análise de Clusters utilizando a base de dados de compras anuais dos clientes de um distribuidor atacadista de Portugal (Wholesale Dataset - UCI repository).

desafios-e-requisitos-de-projetos-analiticos icon desafios-e-requisitos-de-projetos-analiticos

Modelo de classificação de espessura do friso da roda de trem abaixo de 26mm. Os dados utilizadas são dados reais da empresa Vale. Este foi um trabalho desafiador em termos de modelagem devido a larga escala do dataset (mais de 3 milhões de observações), sendo necessário utilizar o Spark para o processamento destes dados. E em termos de entendimento dos dados, já que o problema era de alta complexidade. O trabalho foi feito com a linguagem R e com a biblioteca SparkR e a apresentação foi montada no R Markdown. No futuro próximo serão feitas melhorias no modelo e na análise exploratória para que seja possível atingir uma melhor perfomance nos modelos.

imdb-semantic-sentiment-analysis icon imdb-semantic-sentiment-analysis

This project aims to present an unsupervised semantic sentiment analysis model that not only captures the overall sentiment of the text but also provides a way to analyze the complexity of emotions and subjectivity of the text while maintaining high performance.

pipeline-etl-datalake-dw-sql icon pipeline-etl-datalake-dw-sql

Desafio Final do BootCamp de Engenharia de Dados do IGTI. Neste desafio utilizei o Airflow via Docker para orquestração do Pipeline de extração de dados do MongoDB e da API do IBGE, e ingestão no Data Lake S3 da AWS. Após isso os dados foram tratados e filtrados apenas para o público alvo para serem disponibilizados em um DW pelo RDS da AWS utilizando o banco de dados Postgree. Pipelines de Dados. Containers. Bases de Dados SQL e NoSQL. Conexão a APIs. ETL. Data Lake. Processamento de dados distribuído.

predict-future-sales-kaggle icon predict-future-sales-kaggle

A tarefa é prever a quantidade total de produtos vendidos em cada loja para o conjunto de teste. Neste script foram realizadas técnicas de Pre-Processamento, Feature Engineering e Ensemble Modeling (Primeiro Nível: Catboost, XGBoost, Random Forest, Regressão Linear, KNN, Segundo Nível: Regressão Linear sobre as predições do primeiro nível).

series-temporais icon series-temporais

Trabalho realizado para aprovação na disciplina de Análise de Séries Temporais. Foi realizado a análise e modelagem da serie temporal da entrega de fertilizantes ao mercado brasileiro em mil toneladas no período mensal de janeiro de 1998 até abril de 2020 (Fonte: ANDA)

telco_churn_classprediction icon telco_churn_classprediction

Análise Exploratória e Modelagem do dataset de uma empresa de telecomunicações, para prever se os clientes irão desistir ou continuar contratando os serviços da empresa. Um típico problema de classificação de Churn. Foi feita a manipulação, limpeza e visualização dos dados, e aplicado Regressão logística, Random Forest e XGBTree para a etapa de modeloagem.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.