[자기주도학습] 보팅(soft, hard voting), 경사하강법, XGBoost와 LightGBM 비교
앙상블에서 공부했던 내용과 천리길 스터디 내용을 토대로 보팅, 그라디언트 부스트 중 경사하강법, XG부스트와 LightGBM을 더욱 자세하게 공부해봤다. 앙상블은 여러 분류기를 하나로 연결해 개별 분류기보다 좋은 성능을 달성한다고 공부를 했다. 그 중 보팅은 여러 분류 알고리즘을 사용하고, 배깅과 부스팅은 하나의 분류 알고리즘을 사용한다. Voting 각 결정나무의 예측값이 0.7, 0.8, 0.6의 결과가 나왔다고 가정했을 때, soft voting은 평균값인 0.7을, hard voting은 0.8을 출력하게 된다. (이 예시만 보면 하드보팅은 최고의 점수를 출력하는 것 같다. 하드보팅을 다수결의 원칙이라고 하는 것에 헷갈렸는데, https://blog.naver.com/fbfbf1/222484365..
2023. 4. 25.
221109 TIL - 피처스케일링, 인코딩을 배운 날, 인코딩에서 한 번 흔들렸나..천리길 스터디 너무 재미있었다.
피처스케일링, 인코딩을 배운 날. 천리길 스터디 부스팅 배깅 설명에서 이마 탁! TIL 221109 WED 사실(Fact) : 피처스케일링과 인코딩을 배웠다. 느낌(Feeling) : houseprice가 컬럼명들도 헷갈리는데, 새로운 개념들도 배우니까 따라가느라 정신이 없었다. 교훈(Finding) 나만의 언어로 이해하고 정리해보는 것 어렵지만 다음 수업 시간부터는 적어도 한개라도 내가 고민해서 이해한대로 써보자. 오디널, 원핫 / 판다스, 사이킷런 / std, mm, rs/ pd.cut, pd.qcut 등 큰 틀 안에서 세부 개념들이 헷갈리지 않게 공부해보자! 천리길 스터디 공유해주신 자료 혼자 보고 나서, 쪽집게 수업 들으니 얻어 가는 것이 많아서 좋았다. 다음주도 열심히 공부해서 많이 가져가야지!..
2023. 4. 25.
230423 TIL - 문제가 막막할 때, 예시답이 어떻게 나온건지 원리를 찾아보자.
230423 프로그래머스 문제 순서쌍의 개수 n = 20 일 때, 순서쌍은 (1, 20), (2, 10), (4, 5), (5, 4), (10, 2), (20, 1)이다. i가 1~21까지 돌면서 반복문을 수행할 때, i로 20을 나눴는데 딱 떨어진다면( n % i == 0), answer에 +1씩 해준다. answer = []처럼 리스트로 만든다면, if문 안에서 answer.append(i)를 해주고, return 값은 len(answer)이 될 것이다. 순서쌍을 어떻게 구할지 원리를 찾는 것이 중요한 문제라서 조금 어려웠다. def solution(n): answer = 0 for i in range(1, n+1): if n % i == 0: answer += 1 return answer
2023. 4. 23.