타이타닉 과제, 221006~221010 TIL - plotly, 통계 재밌다, VS Code 설치, 과제, 할게 많다..
타이타닉 과제(데이터프레임), 행과열, 그룹방, 조건, 참고 사이트 / 1006 plotly를 배우고/ 1007 통계수업 듣고/ 1008 과제들 / 1009 과제 제출, 벨로그 정리 / 1010 벨로그 정리 1. 타이타닉 과제 TIL 데이터프레임이 헷갈리는 부분이 많았는데, 과제로 정리가 조금 되었다. str.contains나 str.lower 같은 잊은 부분도 다시 복습이 되었다. 1.1 데이터프레임 행과 열의 개수 세기 항상 len()으로 데이터프레임 개수를 측정하는 것이 이해가 안되었는데, len()으로는 행의 개수를 측정할 수 있다는 것에 이해가 확 되었다. df.shape[0]과 len(df)가 같다는 것. 열은 df.shape[1] 1.2 9번에서 그룹화 해서 빈도수를 세어보라고 하였고, 13..
2023. 4. 19.
[AI스쿨 7기, 3주차] 통계
범주형, 연속형/ 분석도구/ 기술통계, 추론통계/ 중심 경향치/ 분위수/ range/ 편차, 분산/ 신뢰구간/ 귀무가설, 가설 검정/ 상관분석, 상관계수/ 회귀분석 221007 유재명 강사님 강의 1. 이상한 통계학의 용어 모수 : parameter 회귀분석: 돌아가는 것과는 직접적인 관련이 없음 통계적 가설 검정: 과학에서 검정은 실증주의(하고 싶은 주장을 입증) / 통계는 반증주의(틀린 것을 찾아서 까는 것) 용어를 보고 뜻을 짐작x 2. 변수의 종류 행 row 사례, 열 column 변수 2.1 범주형 : 종류, 이름 숫자로 표시가 되어도 양적인 개념이 아니다. ex) 주민등록번호 뒷번호 첫글자. 1,2,3,4 아빠가 1이고 아들이 3이니까 평균내서 2가나오면 여자가 한명있다?ㅋㅋㅋㅋㅋㅋ 그래서 연..
2023. 4. 14.
[AI스쿨 7기, 3주차] 주가 데이터 시각화(FAANG, 캔들스틱), 서울 코로나 데이터, nunique, accessor(dt accessor), value_counts
0302 실습파일 : 주가데이터 시각화, 캔들스틱, OHLC, FAANG / 0303 실습파일 : 서울 코로나 데이터, dulicate, index, sort_index, dt accessor, 연도-월, value_counts 221006 선그래프 연속된 수치 데이터/ 범주형 데이터는 히스토그램, 막대 그래프 shift+tab/ shift+tab+tab 설명 보는 법에 익숙해지자 캐글, 데이콘의 다른 사람 자료들을 참고하고 따라해보는 것 추천!!! 1. 0302 실습 파일 go: graph object. low level interface를 제공하고 있어서 디테일한 설정이 가능하다. 1.1 직접 수집한 주가 데이터로 시각화 fdr.DataReader("Ticker명",start,end) 등으로 시작과 ..
2023. 4. 14.
[AI스쿨 7기, 3주차] 병합하기, Merge, 종가 수집, matplotlib과 pandas 시각화 비교, plotly
map, apply/ merger, concat, join / 리스트 컴프리헨션 / matplotlib API와 pandas API/ plotly / range slider/ 캔들차트/ OHLC / loc, iloc / 논리연산자, 비트연산자/ Unnamed0 221005 ✅ 0206번 실습 파일 1. map과 apply 1.1 map 함수를 만들어서 일괄적으로 전처리, 세부 페이지 처리 등 Series에서만 사용 가능 1.2 apply BMI 지수를 구하는 등에 사용 Series와 DataFrame에서 모두 사용 가능 2. 병합하기 numpy는 반복문을 사용하지 않고, 벡터 사용. 빠르다. 수집한 view_detail이란 내용을 tolist()를 통해 리스트로 변환 후 concat으로 병합 질문 : p..
2023. 4. 14.
[AI스쿨 7기, 3주차] 서울특별시 다산콜센터의 자주 묻는 질문 데이터 스크래핑
221004 0205, 0206 실습파일 / 06번 강의파일 / 서울특별시 다산콜센터의 주요 민원(자주 묻는 질문) 내용 스크래핑/ 수도코드 / try-except / 반복문으로 여러 페이지 수집/ set_index.T / get_desc함수정의 (Status Code, Fetch/XHR, JS, BeautifulSoup, 파싱, xml, Json, tqdm, 저작권, HTML, 404에러, get_one_page함수, try-except 등) 멋쟁이 사자처럼 AI스쿨 7기, 박조은 강사님 강의 ✅ 0205 실습파일, 06번 강의파일 오늘 데이터 수집의 목표 : 목록만 수집하는 것이 아니라 내용까지 수집 1. 들어가기 전 1.1 Insert-Network GET / POST 방식을 알아볼 수 있다. Pa..
2023. 4. 14.