GithubHelp home page GithubHelp logo

hands-on-ml-study's Introduction

hands-on-ml-study

HandsOnML

핸즈 온 머신러닝 (2판) 책을 읽고 진행하는 스터디입니다.

학습 목표

  • 어떤 데이터셋에 대해서도 데이터 변환을 손쉽게 반복할 수 있는 실력을 키웁니다.
  • 향후 프로젝트에 사용할 수 있는 변환 라이브러리를 점진적으로 구축합니다.
  • scikit-learn, pandas, pytorch등 실제 제품을 만드는 데 쓰이는 파이썬 프레임워크들을 익힙니다.


진행 순서

  • [목,금,토,일] : 읽고 생각하기
  • [ 월 ] : 대화하면서 생각하기
  • [ 수 ] : 실습하면서 생각하기

읽고 생각하기


책을 읽으면서 머신러닝에 대한 기본 개념을 학습합니다.

학습 도중 생기는 의문점들을 스스로 해결하려고 노력합니다.

  • 의문점이 해결되었다면 팀원들한테도 알려주고 싶은 지식이라면 복습, 설명 카테고리로
  • 의문점이 해결되지 않았다면 질문 카테고리로
  • 의문점에 대해 다양한 의견을 물어보고 싶다면 토의 카테고리로

분류해 월요일에 진행하는 대화하면서 생각하기에서 의문점들을 나눕니다.


대화하면서 생각하기


의문점들을 해소하는 시간입니다.

당일에 모든 의문점들을 해소하는 것을 목표로 합니다.


실습하면서 생각하기


책을 읽으면서 시도해보고 싶었던 모든 것들을 해볼 수 있는 시간입니다.

코드를 돌려보면서 책의 내용을 확인하고 도구들을 익히는 시간을 갖습니다.



산출물

스터디를 진행하면서 남는 자료들입니다.


대화하면서 생각하기


1주 차 : 02장 머신러닝 프로젝트 처음부터 끝까지

1주 차 Quiz : 1주 차 Quiz Link

2주 차 : 03장 분류

2주 차 Quiz : 2주 차 Quiz Link

3주 차 : 04장 모델 훈련

3주 차 Quiz : 3주 차 Quiz Link

4주 차 : 05장 서포트 벡터 머신

4주 차 Quiz : 4주 차 Quiz Link

5주 차 : 06장 결정트리

5주 차 Quiz : 5주 차 Quiz Link

6주 차 : 07장 앙상블 학습과 랜덤 포레스트

6주 차 Quiz : 6주 차 Quiz Link

7주 차 : 08장 차원 축소

7주 차 Quiz : 7주 차 Quiz Link

8주 차 : 09장 비지도 학습

8주 차 Quiz : 8주 차 Quiz Link


실습하면서 생각하기


1주 차

좋은 성능의 모델을 만드는 것보다 파이프라인을 구축하는 것을 목표로 했습니다.

2주 차

파이프라인을 구축하는 방법을 숙지한 프로젝트입니다.

또한 연습문제중 spam_filter를 한번 구축해 보는 것을 추천합니다.

이메일을 파싱하는 작업은 간단하다고 생각이 되지만 실제로는 도메인에 대한 지식없이는 수행하기 어려운 Task라는 것을 깨닫게됩니다.

Misson 01 Mnist 데이터셋으로 분류기를 만들어 테스트 세트에서 97% 달성하기

Misson 02 타이타닉 데이터셋에 도전해보기!

Spam Filter

3주 차

Cats and Dogs Classify를 진행했습니다.

목표로 하였던 것은 이미 알고 있는 지식들과 이미 구현된 함수를 조합해서 빠르게 Baseline을 만드는 것이였습니다.

두 시간 안에 약 98%의 정확도에 도달하는 모델을 구현했습니다.

4주 차

이번 주는 gensim 라이브러리의 w2v, fasttext를 사용하여 단어들의 임베딩을 학습하고 시각화를 진행해보는 시간을 가졌습니다.

그리고 pytorch를 사용해서 w2v을 구현해보는 시간또한 가졌습니다.

5주 차

이번 주는 현업에서 추천시스템이 어떻게 동작하는지 배웠습니다.

학습 목표

  • 추천 시스템 파이프라인을 이해한다.
  • 전처리 과정과 후처리 과정을 이해한다.
  • Item2Vec을 이해한다.
  • RankFusion기법을 이해한다.
  • 추천시스템의 성능지표를 이해한다. (A/B 테스팅)

6주 차

이번 주는 torchensemble 라이브러리를 사용하여 모델의 앙상블을 진행했습니다.

7주 차

이번 주는 autoencoder 모델을 직접 구현 해보는 시간을 가졌습니다.

  • Dataset, DataLoader 클래스 사용법을 익힙니다.

  • nn.Module을 사용하여 AutoEncoder클래스를 직접 구현합니다.

  • transforms를 사용하여 image데이터의 자동 변환을 구현합니다.

  • trainevaluate함수를 직접 구현하여 pytorch의 모델 구현 패턴을 익힙니다.

  • TSNE을 사용하여 학습된 manifold를 시각화합니다

  • template

  • 건모_T1003

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.