본문 바로가기
부트캠프(LIKELION AIS7)/TIL

221105, 221106 TIL - ML 재실행이 두렵다.

by aimaimee 2023. 4. 22.

221105 머신러닝 알고리즘 재실행이 두렵다. / 221106 랜덤서치, 그리드서치를 조금 알 것 같은 느낌 / 예측은 X_test로!!

 

221105 SAT

  • 머신러닝 알고리즘 재실행이 두렵다.
    미니프로젝트3를 했다. Airbnb New User Bookings 였다.
    원래 추천 노트북을 보면 따라하기만 해도 될 줄 알았는데, 남이 한 코드를 필사하는 것도 만만치 않다고 느꼈다. 결국 내가 생각해서 어떤 식으로 진행할 지 결정해야 했다.
    아직 어떤 알고리즘을 사용해야 할지, 피쳐엔지니어링이 뭔지, 하이퍼파라미터 튜닝을 어떻게 해야할지 어렵다.
    또 위에서 하나를 고치고 머신러닝 알고리즘을 다시 재실행하는 것이 두렵다. 너무 오래 걸린다...

221106 SUN

  • 알고리즘 선택 후, 그리드서치, 랜덤서치!
    미니프로젝트3 제출 완료. 점수는 낮지만 제출을 완료했다는 것에 의의를 두기로 했다.
    0404번 파일을 참고해서 0504번 그리드서치랑 랜덤서치를 실습해보았다.
    머신러닝 알고리즘(랜덤포레스트)를 선택해서 돌린 다음에, 그리드서치랑 랜덤서치로 튜닝해보면서 점수를 바꿔나가는 것 같다! 변수명도 조금 헷갈리지만 그냥 따라했는데, clf, clfr, model로 왜 나누는지도 이제 이해가 간다.
  • predict에 변수를 잘못 넣어서 생긴 오류
    Length of values(891) does not match length of index(418) 에러가 났다. 데이터 갯수가 달라서 나는 오류 같고, 어제 미니프로젝트3 하면서도 오류가 났었는데, 실은 어떻게 고치는지 모르고 코드를 따라했었다.
    오늘 재잘팀원이 도와줬는데, 이번에는 model.predict(X_train)으로 넣은 거였다. predict 에는 X_test로 예측하는 것을 잊지 말자!!!

댓글