데이터 분석(AI) 부트캠프를 수료하고, 수료생들과 함께 '우리가 배운 꿀팁들을 Ebook으로 내면 도움이 되지 않을까?'란 아이디어에서 Ebook 집필을 시작했었습니다. 23년 02월 06일부터 시작했던 Ebook이 드디어 검색도 되는 것을 기념해서, 책에 대한 간단한 소개를 써보고자 합니다.
'데이터 분석, 한 권에 입문하기' 책 소개
부트 캠프를 수료하고 나서, '내가 부트 캠프를 시작할 때, 이 부분을 알고 시작했다면 조금 더 수월하지 않았을까?'라는 마음을 담아 책의 내용을 구성했습니다. 데이터 분석을 처음 시작하는, 아무 것도 모르는 분들이 '데이터 분석을 공부한다면, 이 개념은 아는게 좋다!'라는 부분만 추리고 정리했습니다. 용어를 모르는 사람도 읽으면 이해할 수 있는 정도를 고민을 많이 했습니다.
아래와 같은 질문이 궁금하신 분들께 답이 되는 책이라고 생각합니다.
- 데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어 등 데이터 관련 직무가 너무 많은데, 차이가 뭐지?
- JD을 많이 보라고 하는데, JD가 뭘까? JD에서 뭘 보면 되지?
- 데이터 분석, 통계를 많이 묻는데, 데이터 분석가에게 필요한 기본적인 통계 지식은 뭐가 있을까?
- 데이터 분석가는 어떤 언어를 사용하지?
- 데이터 분석 과정의 기본 중의 기본을 맛보고 싶어!
- 데이터 분석 초보자는 어떤 데이터셋을 사용해서 실습하면 될까?
- 시각화를 할 때, 흔히 하는 실수가 뭘까? 뭘 고려해야 할까?
- 비즈니스 데이터 분석에서는 어떤 분석 개념이 있을까?
- 깃헙이 뭘까?
- 데이터셋은 도대체 어디서 찾아서 하는걸까?
- 개발자 블로그, 너무 다양한데 차이점은 뭘까?
집필 파트(시각화) 소개
저는 부트 캠프를 시작할 때 'print(Hello Python!)'이란 코드도 처음 봤던, 코딩과는 1도 관련이 없는 사람이었습니다. 그래서, 시각화 라이브러리를 배울 때, 어떤 그래프(plot)이 적합한 지 선택하는 것이 가장 어려웠어요. 그 때마다 '많이 해보면 자연스럽게 알게 될 것이다.'를 가장 많이 들었습니다. 저와 같은 분들을 위해 '범주형과 수치형일 때 적합한 그래프는 무엇일지', '프로젝트 후, 완성도를 높이기 위해 시각화 시 주의해야 할 점으로 받은 피드백들은 무엇인지' 등 수료하고 나서 초보자가 전해주고 싶던 꿀팁들을 담고 싶었습니다.
시각화 파트는 아래와 같이 구성되어 있습니다.
- EDA와 시각화의 차이
- 시각화 라이브러리 소개
- 자주 쓰이는 plot(seaborn 기준)
- 시각화 시 범주형 변수와 수치형 변수
- 시각화 시 주의해야 할 점
총 40p에 달하는 분량을 15p 내외로 덜어내며, 입문자에게 적합한 내용으로만 구성하도록 노력했어요!
댓글