Les accidents de la circulation en France : modèle de prévision de la gravité des accidents corporels
Hélène Hiller
Projet Final, Ironhack Data Analytics Bootcamp, fév-août 2021
Lors d'accidents de la route, peut-on prédire la gravité des blessures ?
Cette étude : la Base de données Annuelles des Accidents corporels de la Circulation routière (BAAC), mise à disposition du public sur www.data.gouv.fr pour l’année 2019, un jeu de données de 132977 lignes / 54 colonnes, ramené après nettoyage à 130901 lignes. Chaque ligne correspond à l'une des victimes des 58000 accidents de l'année 2019.
On a testé 8 algorithmes de classification multi-classes : Random Forest, Logistic Regression, XG Boost, CatBoost, GradientBoosting, LightGBM, Extra-Trees, Perceptron et les 4 algorithmes du module Imbalanced-Learn.
Les résultats sont présentés dans un classeur Tableau consultable en ligne : https://public.tableau.com/app/profile/h.l.ne.hill/viz
Le présent repository inclut :
- un référentiel ("codebook") du projet et du jeu de données.
- le code sous plusieurs notebooks Jupyter.
- le Pandas Profile Report du jeu de données.
Le jeu de données est téléchargeable sur data.gouv.fr : https://www.data.gouv.fr/fr/datasets/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2019/