GithubHelp home page GithubHelp logo

alfabattle2.0's Introduction

Репозиторий с базовыми решениями ко второй задаче чемпионата.
В рамках чемпионата требуется решить задачу кредитного скоринга только на основании карточных транзакций клиента.

Особенности датасета:

  1. Огромный объем: 1.5m объектов, 450m строк данных, 6gb данных.
  2. Максимальная детализация данных: 19 признаков на каждую транзакцию, пользовательская история глубиной в год (до 8к транзакций на клиента).

Структура репозитория:

baseline_boosting - решение на основание градиентного бустинга
|-- baseline.ipynb(0.737 AUC ROC Public LB) - ноутбук с решением задачи
|-- features.py - методы для генерации признаков

rnn_baseline - решение на основе рекуррентных нейронных сетей
|-- baseline - папка с бейзлайнами (0.750 AUC ROC Public LB)
    |-- pytorch_baseline.ipynb - решение с использованием torch
    |-- tf_baseline.ipynb - решение с использованием tensorfow

|-- advanced_baseline - папка с улучшенными бейзлайнами (0.760 AUC ROC Public LB)
    |-- pytorch_baseline.ipynb - решение с использованием torch
    |-- tf_baseline.ipynb - решение с использованием tensorfow

|-- constants - папка с полезными константами для препроцессинга
|-- data_generators.py - содержит функционал для генерации батчей
|-- dataset_preprocessing_utils.py - методы для препроцессинга транзакционных данных
|-- pytorch_training.py - методы обучения, валидации и инференса модели на torch
|-- tf_training.py - методы обучения, валидации и инференса модели на tensorflow
|-- training_aux.py - реализация early_stopping-а

utils.py - методы для пакетного чтения и предобработки данных

alfabattle2.0's People

Contributors

smirnovevgeny avatar mayermax avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.