Binary Prediction with a Rainfall DatasetPlayground Series - Season 5, Episode 3www.kaggle.com ◾결과3.24 ~ 3.31까지 짧게 kaggle playground 대회에 참가했다.머신러닝 파이프라인을 확고히하고 싶어서 EDA - Data Preprocessing - Modeling 코드를 다지는 걸 위주로 진행했다. 짧은 시간 안에 다양한 모델 조합을 실험했고, 결과는 상위 17%로 마무리했다.Private score가 더 좋은 제출물도 있어서 조금 아쉽긴 하지만 제출물을 잘 고르는 것도 실력이니... ㅜ.ㅜ초기 제출물들이 hyperparameter optimizing 단계에서 코딩을 잘못해서 data leakage 문제가 있었다..
◾Intro 🔻Kaggle이란? 🔸Crowdsourcing Platform : 기업들 또는 개인이 대회(Competiton)을 개최하면 전세계의 데이터 전문가들이 문제를 해결하는 플랫폼이다. 한국에서는 DACON이 데이터 크라우드소싱 플랫폼으로 유명하다. 🔸Providing Datasets : 대회 관련 또는 개인이 학습에 사용한 데이터셋들이 제공된다. 🔸Discussions & Learnings : ipynb 형식의 Kaggle Notebook을 편집하여 대중에게 공개할 수 있고, discussion을 통해 자신의 노트북을 개선할 수 있다. 또 Kaggle에서는 양질의 교육 컨텐츠도 제공하고 있다. 🔻Kaggle Notebook이란? 🔸 google Colab과 같은 통합 개발 환경이다. 🔸 개인적으로..