GithubHelp home page GithubHelp logo

credit_scoring_card_transactions's Introduction

Credit scoring for card transactions.

Решение задачи кредитного скоринга, основанное на карточных транзакиях клиентов (банковские последовательные данные).

Данные для исследования

https://ods.ai/competitions/dl-fintech-card-transactions/data

Для проведения исследования были использованы данные опубликованные Альфа-Банком летом 2022 года в рамках ряда соревнований по кредитному скорингу в сообществе Open Data Science. Сотрудники лаборатории Data Science в Альфа-Банке публично разрешили использовать эти данные в любых научных и исследовательских целях.

Данный дата-сет занимает объём в распакованном виде около 6 ГБ в формате parquet и около 25 ГБ в виде CSV-файлов. Дата-сет содержит реальные данные клиентов, изменённые для сокрытия конфиденциальной информации. В дата-сете находится информация о 1,5 млн кредитных заявок клиентов, и 450 млн транзакций, совершённых данными клиентами за 1 год транзакционной истории.

Использованные технологии

  1. gc: Библиотека для управления сборщиком мусора, используемая для освобождения памяти.

  2. tqdm: Библиотека для создания прогресс-баров при выполнении итеративных операций.

  3. Pandas: Библиотека для работы с табличными данными, предоставляющая структуры данных и инструменты для манипуляции ими.

  4. numpy: Библиотека для работы с массивами и выполнения числовых операций.

  5. matplotlib: Библиотека для создания статических, анимационных и интерактивных визуализаций.

  6. seaborn: Библиотека для визуализации данных на основе matplotlib, предоставляющая высокоуровневый интерфейс для рисования привлекательных и информативных статистических графиков.

  7. sklearn (scikit-learn): Библиотека для машинного обучения. Использовались следующие модули:

    •	train_test_split: для разделения данных на обучающие и тестовые наборы.
    
    •	StratifiedKFold и KFold: для кросс-валидации.
    
    •	permutation_importance: для оценки важности признаков. 
    
    •	roc_auc_score: для расчета AUC ROC метрики. 
    
  8. lightgbm: Библиотека для градиентного бустинга, разработанная компанией Microsoft, известная своей эффективностью и скоростью, особенно при работе с большими данными.

  9. catboost: Библиотека для градиентного бустинга, разработанная компанией Яндекс, которая поддерживает как CPU, так и GPU ускорение.

  10. TensorFlow/Keras: Библиотека для реализации и обучения моделей LSTM:

    •	tensorflow.keras.models.Sequential: Для создания последовательной модели.
    •	tensorflow.keras.layers.LSTM: Для добавления слоев LSTM в модель.
    •	tensorflow.keras.layers.Dense: Для создания полносвязного слоя.
    •	tensorflow.keras.layers.Dropout: Для добавления слоев Dropout с целью регуляризации модели.
    •	tensorflow.keras.preprocessing.sequence.pad_sequences: Для выполнения паддинга последовательностей.
    •	tensorflow.keras.utils.to_categorical: Для преобразования меток в категориальный формат.
    
  11. PyTorch: Библиотека для реализации и обучения моделей LSTM:

    •	torch: Основная библиотека PyTorch.
    •	torch.nn: Для создания нейронных сетей и различных слоев.
    •	torch.optim: Для реализации оптимизаторов, используемых при обучении моделей.
    •	torch.utils.data.DataLoader: Для создания загрузчиков данных.
    •	torch.utils.data.TensorDataset: Для создания наборов данных из тензоров.
    

Авторы

credit_scoring_card_transactions's People

Contributors

norgeybilinskiy avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.