GithubHelp home page GithubHelp logo

bankclientsvisual's Introduction

Проект 1. Анализ и визуализация данных по уходящим и лояльным клиентам банка

Оглавление

1. Описание проекта

2. Какой кейс решаем?

3. Краткая информация о данных

4. Этапы работы над проектом

5. Результаты

6. Выводы

Описание проекта

На основе использования метода визуализации результатов анализа данных об оттоке клиентов некоторого банка нужно установить, чем ушедшие клиенты отличаются от лояльных и как между собой связаны различные признаки, определяющие клиентов.

⬆️к оглавлению

Какой кейс решаем?

Нужно написать программу, которая анализирует данных об оттоке клиентов некоторого банка и обеспечевает наглядную визуализацию, позволяющую установить, чем ушедшие клиенты отличаются от лояльных и как между собой связаны различные признаки, определяющие клиентов.

Условия выполнения

  • Анализ происходит по заданному алгоритму, формулирующему задачи.
  • Выбор метода визуализации и формулировка выводов - персональная (индивидуальная) работа.

Метрика качества Выбор метода визуализации должен быть максимально информативным для решения поставленной задачи, выводы - убедительны и основаны на результатах визуализации.

⬆️к оглавлению

Краткая информация о данных

Признаки, имеющиеся в заданном DataFrame

  • RowNumber — номер строки таблицы (это лишняя информация, поэтому можете сразу от неё избавиться
  • CustomerId — идентификатор клиента
  • Surname — фамилия клиента
  • CreditScore — кредитный рейтинг клиента (чем он выше, тем больше клиент брал кредитов и возвращал их)
  • Geography — страна клиента (банк международный)
  • Gender — пол клиента
  • Age — возраст клиента
  • Tenure — сколько лет клиент пользуется услугами банка
  • Balance — баланс на счетах клиента в банке
  • NumOfProducts — количество услуг банка, которые приобрёл клиент
  • HasCrCard — есть ли у клиента кредитная карта (1 — да, 0 — нет)
  • IsActiveMember — есть ли у клиента статус активного клиента банка (1 — да, 0 — нет)
  • EstimatedSalary — предполагаемая заработная плата клиента
  • Exited — статус лояльности (1 — ушедший клиент, 0 — лояльный клиент)

Для визуализации в проекте преимущественно использованы plotly.express и seaborn

⬆️к оглавлению

Этапы работы над проектом

  • На первом этапе преобразуем данные DataFrame в удобный формат и создадим несколько "удобных" признаков

  • На втором этапе проводились выбор метода визуализации, его реализация и оценка результата в соответствии с поставлененными задачами:

  1. Определить соотношение ушедших и лояльных клиентов.
  2. Оценить распределение баланса пользователей, у которых на счету больше 2 500 долларов.
  3. Оценить расределение баланса клиента в разрезе признака оттока.
  4. Оценить расределение возраста клиентов в разрезе признака оттока.
  5. Определить взаимосвязь кредитного рейтинга клиента и его предполагаемой зарплаты.
  6. Определить, кто чаще уходит, мужчины или женщины.
  7. Определить, как отток клиентов зависит от числа приобретённых у банка услуг.
  8. Определить, как влияет наличие статуса активного клиента на отток клиентов.
  9. Определить, в какой стране доля ушедших клиентов больше.
  10. Оценить степень оттока клиентов по уровню их кредитного рейтинга

⬆️к оглавлению

Результаты

1 этап. Провели преобразование данных и импорт необходимых библиотек

Использованные библиотеки

  • pandas Version: 1.5.2
  • plotly Version: 5.11.0
    • модули plotly.express и plotly.offline
  • seaborn Version: 0.12.1

2 этап. Для решения поставленных задач реализовано 16 графиков различного типа (круговые, столбчатые, иерархические диаграммы, гистограммы, "коробки с усами", тепловые карты, тепловая картограмма) Ссылка на код в JupiterNotebook в браузере со всеми графиками

⬆️к оглавлению

Выводы

  • Количество ушедших клиентов чуть более 20%.

  • Распределение баланса клиентов похоже на нормальное. Сумма вклада среди клиентов (со вкладом более 2500 долларов) преимущественно в пределах 100000-140000 долларов. Среднее занчение составляет около 120000 (медиана=119839). Максимальный вклад составил порядка 251000 долларов

  • Мы видим большое смещение лояльных клиентов к нулю, это вызвано большим количеством клиентов с нулевым балансом. Стоит отдельно рассмотреть клиентов с нулевым балансом. Также, судя по разбросу значений баланса и уровню медианы, среди ушедших клиентов уровень баланса был выше. В тоже время, данные гистограммы подтверждают превалирование среди лояльных клиентов лиц с балансом до 10000. Среди ушедших клиентов данная группа также самая большая. Следовательно нельзя однозначно сказать о лучших условиях по небольшим вкладам.

  • Среди ушедших клиентов большинство люди старше 40 лет (38-51 год, медиана = 45), среди лояльных большинство - лица молодого возраста(30-40 лет, медиана - 36). В группе лояльных клиентов наблюдаются потенциальные выбросы среди лиц - старше 56 лет. Следовательно, для уменьшения оттока клиентов банку необходимо сконцентрировать внимание на лицах среднего и старшего возраста.

  • Не отмечается прямой зависимости кредитного рейтинга клиента и его предполагаемой зарплаты. Зависимости кредитного рейтинга клиента от степени его лояльности не наблюдается. Следует отметить, что только у ушедших клиентов есть рейтинг ниже 400.

  • Среди клиентов банка женщин меньше, чем мужчин, но они чаще становятся нелояльными клиентам, в среднем на 9%. Следует отметить, что среди ушедших клиентов женщин в 1.5 раза больше чем мужчин.

  • Количество ушедших клиентов обратно пропорционально количеству услуг приобретенных клиентом у банка. Самое большое количество ушедших клиентов воспользовались только одним продуктом банка. Довольно печальная картина с клиентами, которые воспользовались 3 и 4 продуктами, там доля ушедших клиентов намного превышает лояльных, а с 4-мя продуктами так вообще составляет 100%.

  • Среди неактивных клиентов, чаще встречаются нелояльные (ушедшие), чем среди активных. Следовательно, для уменьшения оттока, необходимо повышать активность клиентов.

  • С учетом ранее полученных данных, для вывода о вероятных причинах высокого оттока клиентов в Германии (32%) необходимо уточнить возрастной и половой состав клиентской базы в этой стране, степень их активности и количество приобретенных ими услуг. И, в тоже время, возможны причины, данных о которых нам не предоставленно (политическая и экономическая ситуация в стране), поэтому хорошо бы увидеть картину по Германии в других банках.

  • Наибольший отток наблюдается среди клиентов с минимальным кредитным рейтингом ('Very_Poor', брали и возвращали мало кредитов), и длительностью пользования услугами банка менее 1 года и 10 лет. Если не учитывать клиентов с нулевым балансом, то среди клиентов с отличным ("Exelent")кредитным рейтингом и длительностью пользования услугами банка до года, 6 лет и более 9 лет также наблюдается достаточно высокий отток.

Таким образом: Cреди ушедших клиентов большинство - женщины, старше 40 лет, неактивно пользующиеся услугами банка, с минимальным кредитным рейтингом (только у ушедших клиентов есть рейтинг ниже 400) и длительностью пользования услугами банка менее 1 года и 10 лет. Количество ушедших клиентов обратно пропорционально количеству услуг приобретенных клиентом у банка, в тоже время доля ушедших клиентов увеличивается при увеличении количества используемых услуг.

⬆️к оглавлению

bankclientsvisual's People

Contributors

ekaterinaarsa avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.