GithubHelp home page GithubHelp logo

exelero565 / project_3 Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 181 KB

Исследование влияния характеристик клиентов, которых страховая компания обслуживает, на размер страховых выплат

Jupyter Notebook 100.00%
chi-squared-test kruskal-wallis mann-whitney seaborn shapiro-wilk statistical-analysis statistical-tests statsmodels

project_3's Introduction

Project_3

необходимо исследовать влияние характеристик клиентов, которых страховая компания обслуживает, на размер страховых выплат

DALL·E 2024-02-13

Практика: Статистические Тесты в Контексте EDA (Исследовательский Анализ Данных)

Постановка Задачи

Страховая компания обратилась за помощью к вам, опытному специалисту по данным, с задачей исследования влияния характеристик клиентов на размер годовых страховых выплат. Компания также хочет выявить другие взаимосвязи в данных.

Основные вопросы, на которые необходимо ответить:

  • Больше ли страховые выплаты у мужчин по сравнению с женщинами?
  • Меньше ли страховые выплаты у некурящих по сравнению с курящими?
  • Влияет ли регион проживания на размер выплат?
  • Существует ли взаимосвязь между курением и полом клиента?

Для ответов на эти вопросы будет использоваться уровень значимости $\alpha=0.05$.

Исследование основано на данных о годовых страховых выплатах с учетом характеристик клиентов.

Загрузка Данных

Используемые библиотеки: pandas, numpy, scipy, statsmodels, matplotlib, seaborn.

Данные загружены с платформы Kaggle и доступны по ссылке.

Предварительная Обработка Данных

Выполнена очистка данных, обработка пропусков, создание новых признаков.

Описательный Анализ Данных

Проведен анализ распределения страховых выплат в зависимости от различных характеристик клиентов: пола, курения, региона проживания. Выявлены основные тенденции и возможные аномалии.

Статистический Анализ Данных

Применены различные статистические тесты для проверки гипотез о взаимосвязи характеристик клиентов со страховыми выплатами:

  • Тест Шапиро-Уилка на нормальность распределения;
  • U-критерий Манна-Уитни для сравнения двух независимых выборок;
  • Критерий Краскела-Уоллиса для сравнения нескольких групп;
  • Критерий хи-квадрат для анализа взаимосвязи между категориальными переменными.

Выводы

  • Не обнаружено статистически значимых различий в размере страховых выплат между мужчинами и женщинами.
  • Выплаты для некурящих клиентов статистически меньше, чем для курящих.
  • Регион проживания не влияет на размер страховых выплат.
  • Найдена взаимосвязь между курением и полом клиентов.

Исследование показало важность учета курения при определении размера страховых выплат и выявило отсутствие дискриминации по полу и региону проживания в страховых выплатах.

Автор

https://github.com/exelero565

Лицензия

Проект распространяется под лицензией MIT. Вы можете свободно использовать и распространять этот код для личных и коммерческих целей с обязательной ссылкой на автора.

project_3's People

Contributors

exelero565 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.