Este proyecto tiene como objetivo construir un modelo de predicción de series de tiempo para predecir el tráfico aéreo en diferentes aerolíneas con actividad en Colombia.
Siga los pasos a continuación para instalar y configurar el proyecto en su máquina local:
- Clone el repositorio desde GitHub:
git clone https://github.com/fjmoyao/trafico-aereo-col.git
- Instale los requisitos necesarios:
pip install -r requirements.txt
Para replicar el proceso de predicción, siga los pasos a continuación:
Ejecute los cuadernos en el siguiente orden:
- Data Wrangling
- Exploratory Data Analysis (EDA)
- Model Building 1
- Model Building 2
- NonParametric2
Estos cuadernos contienen el código necesario para el procesamiento de datos, análisis exploratorio y construcción de modelos.
Nota: La ejecución de los modelos no paramétricos se puede realizar directamente desde el notebook NonParametric2 sin la necesidad de ejecutar ningún otro archivo.
En este proyecto, destacamos el uso de bibliotecas de Big Data como PySpark y Polars, lo que nos permitió manejar y transformar un gran volumen de datos de manera eficiente. Los datos utilizados en este proyecto fueron extraídos de la Aeronáutica Civil de Colombia mediante técnicas de web scraping. Sin embargo, es importante tener en cuenta que el uso de estos datos está sujeto a la ley vigente y las políticas de uso de la institución correspondiente.
Este proyecto se distribuye bajo la licencia MIT. Consulte el archivo LICENSE para obtener más información.