GithubHelp home page GithubHelp logo

guipo-r / proyecto-data-science-desigualdades-socioeconomicas Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 13.82 MB

Desigualdades socioeconómicas mundiales: un enfoque sobre la urbanización, la paridad de género, la salud y más.

License: GNU Affero General Public License v3.0

Jupyter Notebook 100.00%

proyecto-data-science-desigualdades-socioeconomicas's Introduction

Desigualdades socioeconómicas mundiales: un enfoque sobre la urbanización, la paridad de género, la salud y más.

Guido Rocatti


Introducción

Este es mi proyecto final del curso de Data Science en Coderhouse.

Trabajé sobre una base de datos obtenida de Kaggle que fue armada a partir de distintas fuentes para Hackathon TrueCue Women+Data. Es un seguimiento del desempeño de 173 países respecto a métricas de sustentabilidad, en su mayoría socioeconómicas, a lo largo de 19 años (2000-2018). Es un conjunto de datos muy diverso, que da lugar a un gran número de oportunidades de análisis. En esta ocasión me interesó centrarme en los siguientes temas:

  • Diferencias socioeconómicas entre países mayormente urbanos y rurales.

  • Avances sobre políticas inclusivas de género.

  • Variables socioeconómicas que permitan clasificar el ingreso económico de un país.

  • Explorar variables que influyen significativamente en el PBI per cápita.

Muchas veces escuchamos hablar de una creciente desigualdad en la riqueza y de una disminución de la calidad de vida a nivel mundial. Una mayor urbanización, a priori, se asocia con una mayor planificación que se traduce en el acceso mejorado de la población a servicios básicos y a una mejor condición de vida, pero ¿esto es realmente así? ¿Hay mejor acceso a servicios en los países urbanos? ¿vemos mejoras económicas y de salud (por ejemplo en la nutrición y expectativa de vida) en estos países? Si vemos una mejora en las condiciones de vida, ¿esto estaría asociado a una disminución de la pobreza en las poblaciones? ¿Cuáles son los factores que nos permitirían predecir incrementos o disminuciones del PBI per cápita? ¿Qué variables nos ayudarían a entender mejor cómo un país tiene determinada clase de ingreso económico y no otra?

Por otro lado, esta creciente desigualdad económica muchas veces se ve profundizada al enfocarse en diferencias de género. Las mujeres enfrentan mayores dificultades a la hora de conseguir un empleo, y por lo tanto, un ascenso económico. Existen políticas que buscan acortar (y eliminar) esa brecha económica de género, y eso entonces lleva a pensar: ¿una mayor participación femenina en la política, se traduce en un menor desempleo femenino? Existe la idea de que el trabajo rural está vinculado mayormente al hombre, entonces: ¿es esperable que el desempleo femenino aumente considerablemente en países con poblaciones mayormente rurales?

Este trabajo busca, a través de distintas herramientas analíticas, ayudar a alcanzar un mayor entendimiento de estas problemáticas, y sería un buen primer paso para que distintos organismos gubernamentales y no-gubernamentales diseñen políticas con fundamento que apunten a mejorar la vida de todos y todas.


Objetivos

A partir de las problemáticas planteadas en el punto anterior, me planteo los siguientes objetivos:

  • a1) Analizar a nivel regional el acceso de poblaciones urbanes y rurales a servicios básicos (agua potable, electricidad, internet) y sus indicadores de salud (prevalencia de desnutrición, expectativa de vida).

  • a2) Explorar cómo se comporta el porcentaje de pobreza respecto a regiones mayoritariamente urbanas y rurales.

  • b1) Examinar cuál es la tendencia de la participación política femenina de cada región, y si esta se asocia con el porcentaje de desempleo femenino.

  • b2) Determinar si existe una relación significativa entre el porcentaje de poblaciones rurales de un país y el porcentaje de desempleo femenino.

  • c) Explorar las variables más influyentes para determinar el PBI per cápita y desarrollar un modelo de predicción óptimo que permita estimarlo a partir de dichas variables.

  • d) Generar un modelo de clasificación que permita determinar la clase de ingreso económico (en inglés: Income class) de un país.


Packages y técnicas utilizadas

Tratamiento de Datos

  • Pandas
  • Numpy

Visualización de Datos

  • Seaborn
  • Matplotlib
  • Pyplot

Codificación, imputación y normalización de datos

  • scikit-learn
    • LabelEncoder
    • KNNImputer
    • OneClassSVM
    • StandardScaler

Modelos lineales predictivos, modelos de clasificación y métricas

  • scikit-learn

    • LinearRegression
    • PCA
    • RandomForestClassifier
    • permutation_importance
    • train_test_split
    • cross_val_score
    • r2_score, mean_squared_error, accuracy_score
    • confusion_matrix, classification_report
  • xgboost

Técnicas de optimización de hiperparámetros

  • scikit-learn
    • RandomizedSearchCV

proyecto-data-science-desigualdades-socioeconomicas's People

Contributors

guipo-r avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.