[AI스쿨 7기, 8주차] cat.codes, dayofweek, log1p, np.expm1, neg_root_mean_squared_error, 피처엔지니어링, 희소값, plt.axhline
221108, 0601번 실습파일 : cat.codes / 0602실습파일 : dayofweek, log취하기, expm1으로 복원, DAU, neg_root_mean_squared_error/ 피처엔지니어링 강의파일 / 0701번 실습파일 : 이상치, 희소값 멋쟁이 사자처럼 AI스쿨 7기, 박조은 강사님 강의 221108 ✅0601 실습 파일 day day는 train과 test를 나누는 기준. train은 19일까지만 있고 test는 20일 이후 데이터가 있다. 1~19일까지 학습한 것을 바탕으로 20일 이후의 데이터를 예측하면 예측에 도움이 안될 수 있다. month 월 그래프에서는 월을 넣어주는게 나아보이지만 연도에서는 2배까지 차이가 날 때도 있어서 예측하는데 혼란이 생길 수 있다. season..
2023. 4. 25.
[AI스쿨 7기, 8주차] 랜덤서치, hold-out-validation, Bike Sharing Demand Data, 랜덤포레스트Regressor, RMSLE, Data Leakage
멋쟁이 사자처럼 AI스쿨 7기, 박조은 강사님 강의 / 221107 0504 실습파일 : 랜덤서치, 홀드아웃 validation / 0601 실습파일 : Bike Sharing Demand, RMSLE, logloss, data leakage, NDCG 221107 ✅ 0504 실습파일 GridSearchCV 지정된 조합만 보기 때문에 해당 그리드를 벗어나는 곳에 좋은 성능을 내는 하이퍼 파라미터가 있다면 찾지 못하는 단점이 있다. RandomSearchCV 랜덤한 값을 넣고 하이퍼파라미터를 찾는다. 처음에는 범위를 넓게 지정하고, max_depth : The maximum depth of the tree : max_depth를 랜덤값으로 지정하기 위해 특정 범위를 지정하는 것 max_features :..
2023. 4. 25.
221104 Diary - 태블로 두 번째, 마우스, 깃허브 어렵다.
221104 강승일 강사님 태블로 수업 2번째 시간. JD을 보면 대시보드 만드는 업무도 많이 보여서 잘 배워두면 좋을 것 같은데, 혼자 하라고 하면 전혀 감이 오질 않는다. 오늘도 20분 정도 실습시간을 줬는데, 마지막 대시보드 구현을 위해 데이터를 어떻게 처리해야 할 지 어려웠다. 강사님이 올려주는 영상으로 복습을 많이 해보고, 스스로 생각을 많이 해봐야 할 것 같다. 마우스를 샀다. 파이썬 수업 할 때는 키보드를 더 많이 써서 그런가 손목이 아프다는 생각을 안하는데, 태블로는 마우스를 많이 써서 손목이 부서질 것 같다. 마침 지원금도 들어와서 로지텍 lift 사려고 했는데, 가성비로 TG삼보꺼부터 써보려고 주문했다. 깃허브 블로그 손대고 싶은데,,,언제 하지 대체
2023. 4. 22.