TCC desenvolvido durante o MBA em Data Science e Analytics da USP-Esalq
Nos últimos anos o mundo enfrentou uma grande pandemia causada pela COVID-19, infectando milhares de pessoas. Durante esse tempo, diversos estudos buscaram entender a heterogeneidade de casos da doença no Brasil, baseado não apenas nas características do sistema de saúde de uma determinada região, mas também de aspectos sociais e políticos. Ao longo do primeiro ano da pandemia, estudos mostraram que o nível de desigualdade socioeconômica e o candidato eleito na última eleição presidencial tem relação com a quantidade de infectados pela doença. Assim, esse trabalho avaliou, por meio de análise exploratória, se esse comportamento persistiu no final de 2021, frente as mudanças que a pandemia demonstrou desde o seu início. Em seguida, através de técnicas de agrupamento, verificou a possibilidade de separar as cidades brasileiras em grupos distintos entre si e observar o perfil de cada um. Após analisar os dados, demonstrou que a relação entre o número de casos de COVID-19 por 100 mil habitantes com o índice de Gini e a porcentagem do presidente eleito nos municípios brasileiros diminuiu comparado com os primeiros estudos, porém foi possível dividir as cidades em quatro clusters, sendo que em cada grupo a média da porcentagem para cada candidato, o nível de desigualdade e a quantidade de contaminados por COVID-19 se mostraram diferentes entre si.