Нам предстоит моделировать отток клиентов телеком-компании. Эта задача очень важна на практике: если мы знаем, что клиент собирается уйти от нас, то мы можем попытаться удержать его, предложив какие-то бонусы.
Предоставленные данные:
Данные о статусе и поведении клиентов.
Этапы работы:
- Обзор данных.
- Исследовательский анализ и предобработка.
- Построение линейной модели.
- Построение модели градиентного бустинга с использование библиотеки CatBoost.
- Определение лучшей модели и финальное тестирование.
Цель работы:
Построение модели для задачи классификации, способной предсказать отток клиентов на основе данных о них. Целевая метрика ROC_AUC должна быть не ниже 0.84.
Используемые библиотеки:
- Pandas
- Scikit-learn
- Scikit-optimize
- Matplotlib
- Seaborn
- CatBoost
- category_encoders
- NumPy
- statsmodels
- UMAP (опционально)