- prediksi 15% data training tanpa dibulatkan ke integer, dari model yang dilatih dengan 85% data training
- pastikan 15% data tersebut tidak mengalami dropna. (data 85%-nya terserah deh kalau mau di-dropna asal yakin)
- prediksi data testing, dari model yang dilatih dengan 100% data training
- pastikan data testing tidak mengalami dropna. jumlahnya harus 341099.
- pemilihan fitur bebas. hindari leaking.
luthfianto / dmc-2016 Goto Github PK
View Code? Open in Web Editor NEWTeam: Uni Gadjah Mada 1. Our attempts and solutions for prudsys' Data Mining Cup 2016