본문 바로가기

전체 글147

[리뷰] 맛있는 디자인 포토샵&일러스트레이터 CC 2024 책 제목 : 맛있는 디자인 포토샵&일러스트레이터 CC 2024 저자 : 빨간고래, 윤이사라 출판 : 한빛미디어 작성자의 배경 포토샵, 일러스트레이터를 만져본 적 없음 고등학생 때부터 취미에서 발전해 포토샵을 척척하는 친구들을 멋지다고 생각함 인스타나 유튜브로 작가님들의 작품 또는 영상을 꾸준히 즐김 캐치마인드나 갈틱폰으로 그림 그리며 노는 것을 좋아함 갤럭시 노트 유저일 때 펜으로 그림을 끄적여봄 최근 패드 드로잉에 대한 관심이 많음 책의 장점 디자인에 대한 막연한 동경을 가지고 데이터 분석 관련 책과 디자인 책 사이에서 고민하던 중, 덜컥 ‘맛있는 디자인 포토샵&일러스트레이터 CC 2024’로 리뷰책을 신청했습니다. 데이터 분석 업무 중 시각화도 있고, 디자인 적 요소도 고려해야 되니까, 미세한 관련은.. 2024. 2. 24.
[시각화2] plot 종류 이해하기 시각화 총 목차 1. 라이브러리 소개 2. 코드 한 줄로 만드는 시각화 보고서 3. 사용한 데이터셋 4. 가볍게 시작해보는 범주형 변수, 수치형 변수 시각화 예시 5. plot 종류 이해하기 6. 시각화 시 주의할 점 7. 퀴즈 데이터분석 공부를 시작할 시기에, 시각화에 대해 배웠던 내용을 정리 및 공부한 글입니다. 총 목차 중 파트5, plot 종류에 대해 소개합니다. 5. plot 종류 이해하기 seaborn 라이브러리를 기준으로 각 plot들이 어떻게 분류되는지, 특징은 무엇인지, 시각화 예시까지 알아봅시다. 데이터셋은 mpg 데이터셋을 사용합니다. mpg 데이터셋에서 수치형 변수는 mpg, horsepower, weight, acceleration이고, 범주형 변수는 origin, name입니다... 2024. 2. 18.
[시각화1] 기초 시각화 개념(라이브러리, 연습데이터셋, 수치형범주형변수 시각화 비교) 시각화 총 목차 1. 라이브러리 소개 2. 코드 한 줄로 만드는 시각화 보고서 3. 사용한 데이터셋 4. 가볍게 시작해보는 범주형 변수, 수치형 변수 시각화 예시 5. plot 종류 6. 시각화 시 주의할 점 7. 퀴즈 데이터분석 공부를 시작할 시기에, 시각화에 대해 배웠던 내용을 정리 및 공부한 글입니다. 총 목차 중 1~4 / 5 / 6~7로 나눠서 작성할 예정입니다. 1. 라이브러리 소개 자주 접하게 되는 시각화 라이브러리는 matplotlib 기반의 '정적 도구', JavaScript 기반의 '동적 도구'로 나뉩니다. 정적 도구는 이미지의 형태로 시각화합니다. 동적 도구는 그래프에 마우스를 올렸을 때 사용자의 목표에 따라 변화하는 데이터 수치를 보여줄 수 있습니다. 따라서, 동적 시각화는 inte.. 2024. 2. 4.
한 개의 데이터셋을 가지고 할 수 있는 분석들 (거래처 분석) 1. 서론 회사 내 데이터분석이 익숙하지 않을 때, 분석이 무엇인지 제시해야 할 수 있다. 분석을 제공할 부서에 제시할 간단한 분석과 추가 분석 요청사항을 어떻게 뽑아내면 좋을까? 2. 거래처 분석 파고들기 2-1. 사용할 데이터셋 : 견적주문데이터 물건을 제조하면, 소비자 or 거래처는 견적서를 요청하고, 견적서에 따라 주문을 넣는다. 2-2. 분석 흐름 세우기 견적주문 데이터를 훑어본다. 총 주문 금액을 통한 매출 흐름은 이미 있는 자료일 것 같다. (없다면, 함께 진행) 견적주문 데이터에서 활용할 수 있는 컬럼은 ‘지점’, ‘거래처명’, ‘견적건수’, ‘주문건수’, ‘견적금액’, ‘주문금액’, ‘등록자’일 것 같다. 데이터가 무겁기 때문에(1개년만 해도 30만건 정도), 해당 컬럼을 기준으로 간소화.. 2024. 1. 21.
데이터 분석가 A씨의 고민 : 정확한 수치의 보고란 환상일까? 서론 데이터분석을 시작하면 코딩을 하면서 짜라란 결과물을 내는 과정보다, 데이터를 뜯어보면서 전처리 및 정합성을 훑어보는 시간이 훨씬 길어서 ‘이게 맞나?’란 생각이 들 때가 있다. 같은 데이터 화면이 변화 없이 30분 지속되면 ‘쟤는 대체 뭘할까라고 생각하겠지?’라는 생각이 들 때도 있다. 데이터의 정확도에는 변수가 너무 많았다고 느껴서, 2023년 하반기 동안 마주했던 정확도를 방해하는 예시들을 정리해보았다. 크게 ‘회사의 환경적 이유’, ‘데이터가 입력될 때’, ‘보고자료를 준비하는 사람의 관점이 데이터에 반영될 때’로 나눠보았다. *모든 사례는 각색 되었습니다. 정확도에 영향을 미쳤던 경우 1. 회사의 환경적 이유 환경적 요인으로 회사의 분석 기준이 정확하게 수립되어 있지 않은 경우가 많다. 그렇.. 2024. 1. 6.
데이터분석 업무를 처음 시작하는 해의 회고 연말의 글 소재를 글또에서 추천해주었다. 데이터 분석 업무를 시작한 시기부터 연말 회고를 차곡차곡 쌓을 수 있다는 것은 정말 좋은 기회이지 않을까. 그래서 ‘한 해 동안 내가 어떤 활동을 했는지’, ‘데이터 분석 업무는 무엇을 했는지’, ‘그 외의 나의 일상에 임팩트 있는 부분이 무엇이었는지’를 회고해보고자 한다. 1. 1년 동안 어떤 활동을 했을까? 분석가 JD를 보면 필요 스킬이 다양하다. 그 스킬들을 다 하지 못한다는 것에 겁을 먹기도 했다. 그래서 아래 활동들을 보면 ‘빅쿼리’, ‘GA4’, ‘태블로’, ‘스크래핑’ 등 공고에 보이는 단어였다 하면 건드려봤다. 이게 깊이가 있었냐, 도움이 되었냐고 하면, 아직은 잘 모르겠다. 활동했던 것들 중, 현재 업무에서 사용하고 있는 기술은 ‘태블로’ 밖에 .. 2023. 12. 23.
태블로 라이선스 발급 방법 (부제 : 아무것도 모르는 당신에게 태블로 도입의 미션이 떨어졌다면) 들어가는 말 매번 태블로 퍼블릭, 스터디에서 열어주는 평가판 태블로 데스크탑만 사용했다. 입사하고, 태블로 라이선스 발급 과정을 알아보라고 미션이 떨어졌다. 태블로 라이선스에 대해 인터넷 검색 / 태블로 컨설턴트 지인 / 태블로 라이선스 발급사 등 조사하며 알아보았다. 태블로 라이선스가 정확히 무엇이고, 어떻게 발급 받아서 사용하면 될까? 1. 태블로 라이선스를 위해 선택해야 하는 개념들 1.1 호스팅 서버 선택 Tableau Cloud 와 Tableau Server(On-Premises) 택일 태블로 라이선스를 발급하는 곳에 전화로 문의를 해봤을 때, 아래와 같이 많이 나뉜다고 들었다. 대기업) 사내 서버 구축 여건이 되는 경우가 많기에 Tableau Server 선택 중소중견) 서버 구축하는 하드웨어.. 2023. 12. 3.
[태블로] 필터 선택에 해당되는 매출 상위(TopN) 품목 시각화 1. 기본 전제 1.1 매출 컬럼 구성 : 날짜 / 사업부 / 자사, 타사 제품 구분 / 품목 / 금액 1.2 태블로 필터 1.2.1 연도, 월, 사업부, 품목을 모두 필터로 선택할 수 있어야 한다. → 연도, 월, 사업부, 품목이 '이 데이터 원본을 사용하는 모든 항목' 조건으로 필터 설정 1.2.2 연도별 비교가 되어야 한다. → Current Year, Previous Year 매개변수 생성. 당해는 선으로, 지난해는 영역그래프. → 단점) 매개변수를 필터 대용으로 사용하니, 일반 필터처럼 전체 연도 선택은 없음 2. 어려웠던 요청 (*이미지 상 품목의 금액 순서대로 정렬이 안되었으나, 수정 후 최종본은 금액이 정상적으로 ranking되었음) 사업부를 선택했을 때, 해당되는 사업부의 품목이 매출 상.. 2023. 11. 21.
계층쿼리 CONNECT BY PRIOR & START WITH는 부모와 자식노드를 연결 PRIOR 상위 = 하위 : 아래에서 위로 PRIOR 하위 = 상위 : 위에서 아래로 참고(https://blog.naver.com/aza425/223210419123) START WITH 어느 데이터부터 시작할 지 설정. 아래 쿼리에서는 CHI_NM이 PAR_NM과 같은 '빨간색'인 데이터부터 시작한다. CONNECT BY PRIOR 하위 = 상위 이므로, '빨간색'인 데이터의 ID 값이 위에서 아래로 출력된다. SELECT CHI_ID -- 자식테이블 컬럼 FROM CHI -- 자식테이블 START WITH CHI_NM = ( SELECT PAR_ID FROM PAR WHERE PAR_NM='빨간색') CONNECT BY .. 2023. 9. 20.