Me chamo Pietro e atuo como Cientista de Dados em Fortaleza, CE - Brasil. Estou cursando Estatística (Bacharelado) na Universidade Federal do Ceará - UFC. Minha pesquisa foca em modelos de regressão linear mistos, simulação de dados e inteligência artificial. Atualmente tenho estudado ferramentas de computação na nuvem e bancos de dados não-relacionais. Pretendo usar este GitHub como portfólio para exibir meus projetos e assim facilitar o compartilhamento de conhecimento.
Possuo experiência profissional diversificada em análise de dados, com habilidades em manipulação de grandes volumes de dados em SQL e NoSQL, extração de dados e análises exploratórias com Python e pacotes de visualização de dados. Experiência em implementação, documentação, deploy e acompanhamento de modelos de machine learning para classificação, regressão, clustering e recomendação, bem como criação e apresentação de dashboards com Looker e Microsoft Power BI. Habilidade em coletar e apresentar dados sobre a indústria e economia, escrita de relatórios e apresentação de resultados e estatísticas. Experiência em Cloud e Big Data com uso de GCP e Azure Databricks, além de habilidade em DevOps e Git. Definição de plano e execução da governança de dados na organização, bem como gestão voluntária da equipe de dados utilizando Scrum. Fluência em Inglês para comunicação em ambientes internacionais
Entre em contato via:
- Notebook introdutório para modelos de machine learning
- Construção, desenvolvimento e acompanhamento de métricas de modelos para marketing e sales forecasting do Sistema FIEC.
- Painéis de Inteligência de Dados
- Painel Coronavírus
- Painel de Transparência da COVID - Secretaria de Saúde do Ceará
- Índice FIEC de Inovação os Estados (edição de 2020)
- Observatório Analítico de Acidentes de Trabalho
- Painel de Indicadores de projetos imobiliários (parceria Sinduscon em 2020)
- Painéis internos de gestão de equipe e finanças
- Pesquisas e Sondagens Empresariais do Observatório da Indústria - FIEC
- Sondagem da Construção: edições de Agosto e Setembro de 2019
- Índice de Confiança do Empresário Industrial - ICEI: edições de Março a Setembro, Dezembro de 2019 e Janeiro de 2020
- Indicadores Industriais: edição de Novembro de 2019
- ETLs em Python
- Bases de dados usadas no projeto de redução do Custo Brasil em parceria com o Ministério da Economia
- ETLs em R
- Bases de dados usadas em painéis do Observatório da Indústria e outros projetos internos
- Projetos desenvolvidos como atividades ou para fixar conteúdo estudado durante a graduação
- Monografia: Modelos de Regressão Linear para Dados Intervalares
- Projeto para os Encontros Universitários da UFC sobre Experiência de Estágio de Estatística
- "Estatística aplicada através dos estudos do Observatório da Indústria"
- Python (Numpy, Pandas, SciPy)
- R
- SQL
- C++
- C
- SAS
- Java
- Machine Learning (Regressão, Classificação, Clustering, etc.)
- scikit-learn
- TensorFlow
- PyTorch
- Keras
- Microsoft Power BI
- Google Data Studio
- Streamlit
- Plotly
- GeoDa
- ArcGIS
- Shiny
- Matplotlib
- Seaborn
- Looker
- AWS
- Hadoop
- Spark
- Databricks
- Azure
- GCP (Google Cloud Platform)
- Airflow
- Django
- MongoDB
- Snowflake
- BeautifulSoup
- Selenium
- Rvest
- Inglês (fluente)
- Espanhol (intermediário)
- Francês (básico)
- Curiosidade
- Adaptabilidade
- Autonomia
- Comunicação
- Flexibilidade
- Cooperação
- Git
- Metodologias Ágeis (Scrum, Kanban, MoSCoW)
- MLOps (MLFlow)
- Microsoft Office
- LaTeX
- Microsoft Excel
- Docker
- Linux
-
Cientista de Dados Pleno - Pravaler (agosto de 2022 - novembro de 2022)
-
Cientista de Dados Trainee/Junior - Observatório da Indústria FIEC (abril de 2020 - julho de 2022)
-
Estágio de Pesquisa - Observatório da Indústria FIEC (fev de 2019 - abril de 2020)
-
Bacharelado em Estatística - Universidade Federal do Ceará (fev de 2017 - conclusão em jul de 2023)
-
Bacharelado em Matemática - Universidade Federal do Ceará (fev de 2014 - jun de 2016)