mini-pw / 2021l-wb-xai-1 Goto Github PK
View Code? Open in Web Editor NEWCase Study course for DS studies in Summer 2020/2021
Case Study course for DS studies in Summer 2020/2021
Praca domowa 1 (8 pkt.)
Termin: 25.03.2021 23:59
Dla wybranego modelu z projektu przygotuj knitr/jupyter notebook w formacie html lub pdf rozwiązując poniższe punkty.
W pracy domowej oceniane przede wszystkim będą wnioski z otrzymanych analiz. Kod potrzebny do reprodukowalności wyników również proszę załączyć.
Prace domowe należy zgłaszać przez Pull Request o tytule Nazwisko Imię PD1
. Wszystkie pliki związane z pracą domową proszę o umieszczenie w folderze PraceDomowe/PracaDomowa1/Nazwisko_Imię
.
Praca domowa 2 (8 pkt.)
Termin: 06.04.2021 23:59
Dla wybranego modelu przygotuj knitr/jupyter notebook w formacie html lub pdf rozwiązując poniższe punkty. Pracę domową należy zgłosić przez Pull Request na GitHub w folderze PraceDomowe/PracaDomowa2/Nazwisko_Imię
.
W pracy domowej oceniane przede wszystkim będą wnioski z otrzymanych analiz. Kod potrzebny do reprudokowalności wyników również proszę załączyć.
Prace domowe należy zgłaszać przez Pull Request o tytule Nazwisko Imię PD2
. Wszystkie pliki związane z pracą domową proszę o umieszczenie w folderze Nazwisko_Imię
.
Problem: Zbiór danych opisuje nieruchomości w stanie Kalifornia. Chcemy modelować medianę wartości domu dla gospodarstw domowych w obrębie bloku (mierzona w dolarach amerykańskich).
Dane: Dane zawierają informacje z kalifornijskiego spisu powszechnego z 1990 roku, dostępne są na kaggle: https://www.kaggle.com/camnugent/california-housing-prices
Zbiór danych zawiera 20640 obserwacji, 10 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją mediany wartości domu należy odtworzyć: https://www.kaggle.com/ravichaubey1506/end-to-end-machine-learning,
https://www.kaggle.com/takedown/complete-tutorial-for-beginners
W ramach projektu można również wytrenować swoje modele do porównania.
Praca domowa 3 (8 pkt.)
Termin: 15.04.2021 15:00
Dla wybranego modelu przygotuj knitr/jupyter notebook w formacie html lub pdf rozwiązując poniższe punkty. Pracę domową należy zgłosić przez Pull Request na GitHub w folderze PraceDomowe/PracaDomowa3/Nazwisko_Imię
.
W pracy domowej oceniane przede wszystkim będą wnioski z otrzymanych analiz. Kod potrzebny do reprudokowalności wyników również proszę załączyć.
Prace domowe należy zgłaszać przez Pull Request o tytule Nazwisko Imię PD3
. Wszystkie pliki związane z pracą domową proszę o umieszczenie w folderze Nazwisko_Imię
.
Praca domowa 4 (8 pkt.)
Termin: 29.04.2021 15:00
Dla wybranego modelu przygotuj knitr/jupyter notebook w formacie html lub pdf rozwiązując poniższe punkty. Pracę domową należy zgłosić przez Pull Request na GitHub w folderze PraceDomowe/PracaDomowa4/Nazwisko_Imię
.
W pracy domowej oceniane przede wszystkim będą wnioski z otrzymanych analiz. Kod potrzebny do reprudokowalności wyników również proszę załączyć.
Prace domowe należy zgłaszać przez Pull Request o tytule Nazwisko Imię PD4
. Wszystkie pliki związane z pracą domową proszę o umieszczenie w folderze Nazwisko_Imię
.
Praca domowa 5 (8 pkt.)
Termin: 13.05.2021 15:00
Dla wybranego modelu przygotuj knitr/jupyter notebook w formacie html lub pdf rozwiązując poniższe punkty. Pracę domową należy zgłosić przez Pull Request na GitHub w folderze PraceDomowe/PracaDomowa5/Nazwisko_Imię
.
W pracy domowej oceniane przede wszystkim będą wnioski z otrzymanych analiz. Kod potrzebny do reprudokowalności wyników również proszę załączyć.
Prace domowe należy zgłaszać przez Pull Request o tytule Nazwisko Imię PD5
. Wszystkie pliki związane z pracą domową proszę o umieszczenie w folderze Nazwisko_Imię
.
Problem: Chcemy określić koszty leczenia różnych pacjentów. Koszt leczenia zależy od wielu czynników: diagnozy, rodzaju kliniki, miasta zamieszkania i innych. W danych nie ma jednak informacji o diagnozie, ale są inne informacje, które mogą pomóc w wyciągnięciu wniosków.
Dane: Dane Medical Coat Personal Datasets dostępne są na kaggle:
https://www.kaggle.com/mirichoi0218/insurance
Zbiór danych zawiera 1338 obserwacji, 7 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją kosztów leczenia należy odtworzyć notebook: https://www.kaggle.com/hely333/eda-regression
W ramach projektu można również wytrenować swoje modele do porównania.
Problem: Klienci banku rezygnują z usług związanych z kartami kredytowymi. Chcemy zbadać, którzy klienci mogą być chętni do odejścia od tej usługi (customer churn).
Dane: Dane Credit Card dostępne są na kaggle: https://www.kaggle.com/sakshigoyal7/credit-card-customers
Zbiór danych zawiera 10 tyś. obserwacji, 18 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją przepływu klinetów należy odtworzyć notebook: https://www.kaggle.com/alpertml/credit-card-customers-eda-ml-97-5-accuracy
W ramach projektu można również wytrenować swoje modele do porównania.
Problem: Zbiór danych opisuje pacjentów (mających lub nie chorobę serca). Chcemy wykorzystać te dane do stworzenia modelu, który spróbuje przewidzieć, czy pacjent ma tę chorobę, czy nie.
Dane: Dane Heart Disease UCI dostępne są na kaggle: https://www.kaggle.com/ronitf/heart-disease-uci
Zbiór danych zawiera 303 obserwacji, 14 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją choroby serca należy odtworzyć notebook:https://www.kaggle.com/cdabakoglu/heart-disease-classifications-machine-learning
W ramach projektu można również wytrenować swoje modele do porównania.
Problem: Chcemy określić jakość wina na podstawie zmiennych fizykochemicznych. W danych mamy kilka klas (multiclass), ale dzielmy jest na dwie podgrupy uzyskując klasyfikację binarną.
Dane: Dane Red Wine Quality dostępne są na kaggle: https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009
Zbiór danych zawiera 1599 obserwacji, 12 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją jakości wina należy odtworzyć notebook: https://www.kaggle.com/vishalyo990/prediction-of-quality-of-wine
W ramach projektu można również wytrenować swoje modele do porównania.
Problem: Zarządzając hotelem chcemy dobrze planować zapotrzebowanie na personel oraz na żywność. Chcemy zbudować model przewidujący czy gość rzeczywiście skorzysta z zarezerwowanego pokoju.
Dane: Dane Hotel booking demand dostępne są na kaggle:
https://www.kaggle.com/jessemostipak/hotel-booking-demand
Zbiór danych zawiera 119 tyś. obserwacji, 32 zmiennych objaśniających.
W celu przygotowania modeli związanych z predykcją odwołań rezerwacji należy odtworzyć notebook: https://www.kaggle.com/marcuswingen/eda-of-bookings-and-ml-to-predict-cancelations
W ramach projektu można również wytrenować swoje modele do porównania.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.