제주 행정동별 음식물 쓰레기 데이터 및 유동 인구와 카드 소비 데이터를 활용하여
2021년 7-8월의 행정동별 음식물 쓰레기 배출량 예측 모델 구축 및 감소 방안을 제시한 분석 프로젝트
꿈은 없지만 놀고 싶어요
├── README.md
├── main.py
├── 데이터분석분야_퓨처스리그_ECO제주_꿈은 없지만 놀고싶어요_결과보고서.pdf
├── 데이터분석분야_퓨처스리그_ECO제주_꿈은 없지만 놀고싶어요_추가제출파일.html
├── raw
│ └───외부데이터
│ ├───인구__가구_및_주택__읍면동_2015_2020___시군구_20162019__20210822212745.csv
│ └───가구원수별_가구_일반가구___읍면동_2015_2020___시군구_20162019__202108230141 36.csv
│
├── preprocess
│ ├───EDA.py
│ ├───preprocess.py
│ ├───missing_datawig.py
│ ├───correlation.py
│ ├───add_missing_total_data_final.csv
│ ├───add_missing_total_data_final_known.csv
│ ├───total_data_final_unknown_end.csv
│ └───total_data_final_known_end.csv
│
└── model
├───model.py
├───visualize.py
└─── model
├───compare_model_건입동.pkl
│ ...
├───compare_model_알수없음.pkl
├───model_건입동.pkl
│ ...
└───model_알수없음.pkl
main.py : 전체 파일 실행 코드입니다.
EDA.py : 음식물 쓰레기 배출량에 대한 EDA 코드입니다.
preprocess.py : 데이터 전처리 코드입니다.
missing_datawig.py : Datawig library를 사용해 전처리 데이터 중 결측치를 처리하는 코드입니다.
correlation.py : 모델에 사용할 변수에 대한 상관관계를 확인하는 코드입니다.
model.py : AutoML인 Pycaret을 사용하여 지역별 음식물 쓰레기 배출량 예측 모델을 구축하는 코드입니다.
visualize.py : Pycaret과 Shap를 사용하여 변수 중요도 및 특정 변수와 음식물 쓰레기 배출량과의 관계를 해석하는 코드입니다.
beautifulsoup4 4.6.3
bs4 0.0.1
datawig 0.2.0
matplotlib 3.2.2
matplotlib-inline 0.1.2
numpy 1.14.6
pandas 0.25.3
pip 21.1.3
pycaret 2.3.3
requests 2.26.0
scikit-learn 0.22.1
seaborn 0.11.1
shap 0.39.0
statsmodels 0.10.2
tqdm 4.62.0
urllib3 1.24.3
이윤정 | 박지원 | 박지현 | 양지우 |