타이타닉 과제(데이터프레임), 행과열, 그룹방, 조건, 참고 사이트 / 1006 plotly를 배우고/ 1007 통계수업 듣고/ 1008 과제들 / 1009 과제 제출, 벨로그 정리 / 1010 벨로그 정리
1. 타이타닉 과제 TIL
- 데이터프레임이 헷갈리는 부분이 많았는데, 과제로 정리가 조금 되었다.
- str.contains나 str.lower 같은 잊은 부분도 다시 복습이 되었다.
1.1 데이터프레임 행과 열의 개수 세기
항상 len()으로 데이터프레임 개수를 측정하는 것이 이해가 안되었는데, len()으로는 행의 개수를 측정할 수 있다는 것에 이해가 확 되었다. df.shape[0]과 len(df)가 같다는 것. 열은 df.shape[1]
1.2
9번에서 그룹화 해서 빈도수를 세어보라고 하였고, 13번에서도 그룹화해서 갯수를 세어보라고 했는데, groupby가 사용되지 않아 조금 헤맸다. value_counts가 유니크값을 기준으로 그룹이 묶이는 성질을 아직 완벽하게 숙지 못한 이유라고 생각이 들었다.
1.3
처음에는 두 가지 이상 조건이 걸리면 변수에 담아서 다시 출력을 했는데, 끝까지 풀어보니 df[(조건1) & (조건2)].shape와 같은 형태로 깔끔하게 묶어서 사용할 수 있다는 것을 깨달았다.
- df[조건]["보고싶은 기준 컬럼"].mean() 형태로 정리할 수 있는 부분도 배웠다.
1.4
문자는 ""안에 넣어서 조건을 주어야 하지만 숫자나 True, False로 나뉘는 데이터는 ""안에 안넣어야지 정상적인 값이 출력되었다. ex)19번 문제의 df["alone"] == True 에서 True는 ""로 감싸지 않는다.
1.5 참고
- https://blog.naver.com/janghanui/222422760365 : 행과 열의 갯수 세기, null값의 sum 하기, value_counts 등이 정리가 잘 되어 있어서 공부가 많이 되었다.
- https://teddylee777.github.io/pandas/pandas-tutorial-04 : 타이타닉 컬럼들 뜻을 참고했다. 두 가지 조건들이 있을 때 값을 구하는 것들이 연습 문제로 있다.
- https://blog.naver.com/j7youngh/222845859375 데이터프레임 집계함수(aggregation)가 정리되어 있다. 그룹바이 한 후 집계함수를 넣는 부분과, 특정 칼럼에 대한 다른 특정 칼럼의 정보를 구하는 부분을 참고했다. query 부분도 있다.
- https://jimmy-ai.tistory.com/28 그룹바이 참고
221006 Thu. TIL
- 사실(Fact) : plotly 과제로 그려본 것 이어서 완성해보았다. 0303번 파일에서는 코로나 데이터를 가져와서 배웠던 판다스의 기능들을 응용해서 사용해보았다.
- 느낌(Feeling)
- 자유자재로 사용하면 일할 때도 유용하게 쓰이겠다.
- 0303번 파일 초반에 배운 것들 쓸 거라고 기능들이 요약되있어서 좋았다. 참고해서 복습해야겠다.
- mpg 파일 다시 보자
- 교훈(Finding) : 실습파일 문제들을 미리 고민해보자.
221007 Fri. TIL
- 사실(Fact) : 기초 통계 지식을 정리했다.
- 느낌(Feelig)
통계가 이렇게 재밌을 수가 있었나? 경영경제통계 때 들어서 그런지 조금 익숙하게 받아들여서 그랬을 수도 있겠다. 강사님의 예시들이 너무 찰떡같아서 기억에도 잘 남고 웃겼다.
귀무가설도 대학 시험 때 틀렸었는데, 예시 듣고는 이제 절대 안잊겠다 싶다. 회귀분석까지 조금 더 자세하게 듣고 싶었는데 시간이 부족해서 아쉽다.
하루 종일 통계를 배운다니 가능해? 싶었는데 아쉬워지다니.
배운 내용을 파이썬에서 실습해보고 구글폼으로 제출하는 거였는데, 시간도 넉넉하게 주시고, 남이 푼 답을 볼 수 없으니까 혼자 힘으로 고민하고 시간에 쫓기지도 않고 풀 수 있어서 너무 좋았다. - 교훈(Finding)
여러 번 반복하면 어렵게만 느껴지는 것도 조금 익숙하게 받아들일 수 있구나.
221008 Sat. TIL
- 숙제인 VS Code 설치하고 영상보기 완료,
- 쥬피터 익스텐션 설치도 완료했다.
그래도 VS Code로 파이썬 과제 풀어보려고 했는데 안익숙해서인지 어려워서 결국 쥬피터랑 코랩으로 했다. - 파이썬 과제 풀기. 데이터프레임에 대한 개념이 이렇게 정리가 안되었구나 느꼈다. 하지만 문제를 풀면서 조금 정리가 많이 된 것 같아서 자신감이 생긴다.
221009 Sun. TIL
- 파이썬 과제 제출 완료 : 애먹이던 문제는 value_counts()를 제대로 숙지하지 못해서 그랬던 거였다. 으쌰팀 동기님이 도와줬다.
- 벨로그 수업 내용 10/5, 10/6, 10/7 정리 완료 : 숙제 하고 나서 보니 이해가 되는 내용들이 조금 있다. 하지만 여전히 0303번 실습 파일 연도-월 부분은 어렵다.
- SQL 중급 강의 듣기. 랜덤 문제 풀이까지 하고 싶은데 시간이 부족해서 못했다.
221010 Mon. TIL
- 벨로그 나머지 TIL, 스터디, 수업 내용 정리
- 할거는 많은데,,, 놀지도 못하고,, 시간이 너무 없다.
- 못한거
- 깃헙
- 노션 정리
- 부스트코스 완강
- 스터디 문제 미리 다 풀기
댓글