본문 바로가기

Study19

VS Code에 DB 데이터(Oracle SQL Developer 사용) 연결해 데이터프레임으로 가져오기 (부제 : DB 데이터를 불러와 파이썬 작업할 일이 있을까?) DB를 연결해서 SQL 쿼리를 날리기 위해서는 DBMS 툴(ex. Oracle SQL Developer, DBeaver 등)을 사용할 것이다. 그런데, 굳이 DBMS 툴을 사용하지 않고, 파이썬에 DB를 연결해 작업할 일이 있을까? 1. 배경1 : 파이썬에 DB를 연결한다는 게 무엇인가여기서 파이썬에 DB 연결이라는 것은, 크게 두 가지로 해석될 수 있다.첫 번째는, VS Code를 Oracle SQL Developer처럼 쓰는 것이다. (엄밀히 말하면 VS Code는 파이썬이 아니지만..)이 경우에는 Oracle SQL Developer Extension for VSCode를 설치해 사용하면 된다. 그럼 VS Code에서 Oracle SQL Developer처럼 좌측 또는 우측에 테이블이 보이고, 편집.. 2025. 2. 15.
분석가에게 SQL 연습문제는, 단순한 문제가 아니다. 2024년 12월에 solvesql에서 ‘Advent of SQL 2024’라는 SQL 어드벤트 챌린지를 이벤트 삼아 진행했다. 어드벤트 캘린더에서 아이디어를 착안해 SQL 문제를 매일매일 풀어본다니, 아이디어가 너무 좋다고 생각했다. 또, 그냥 공부하면 하기 싫은데, 이렇게 이벤트성으로 + 완수하면 뱃지도 주고(물욕) + 한문제씩만 푼다면 부담도 없을 것 같고, 안풀려도 심도있게 고민해볼 수 있을 것 같고 + 이벤트에 참여한 다른 사람들도 있을 것이고 여러모로 흥미로운 이벤트였다.제목을 거창하게 썼지만, SQL 쿼리 연습문제를 풀어보며 실무에서 하는 부분이 문제에 많이 녹아있다는 것을 느꼈다. 기계적으로 쿼리를 작성하는 것이 아니라, 문제에 녹아있는 실무적인 부분을 상상하는 습관을 잊지말자는 다짐 차원.. 2025. 1. 19.
2024년 회고. 매일 무언가를 했다면, 지나고 보면 무언가는 쌓이지 않았을까? 2023년 - 데이터분석 업무를 처음 시작하는 해의 회고 2024년을 지내며 스스로에게 자주 던졌던 질문이 있다. 나는 매일 무엇을 하고 있을까? 이게 무엇을 위한 걸까? 혹은 매일을 그냥 보냈다면, 그 이유는 무엇일까? 이런 고민들을 반복하며, 내가 했던 일과 그로부터 만들어진 생각들에 대해 되짚어 보았다. 돌아보니 사소한 일이라도, 그것조차 나를 만드는 시간이었다는 생각이 든다. 그래서 이번 회고의 제목으로 '매일 무언가를 했다면, 지나고 보면 무언가는 쌓이지 않았을까?'를 남겨본다.2024년 회고를 쓰려니, 작년보다 시간이 더 걸린다. 이유를 생각해 보니, 2023년 회고 때 작성했던 일자별 타임라인이 꽤 유용했기 때문이다. 올해는 그 타임라인을 정리하는 데 시간을 들인 덕에, 지나간 시기를 되돌아.. 2025. 1. 5.
경영정보시각화능력을 보고(feat. 필기, 실기 합격했음) 왜 이 시험을 치게 되었는지(사실 이 부분은 마지막 문장을 위한 나만의 백그라운드를 남긴 글이라, 공부 정보를 보려면 스킵..!)2023년 하반기 ~ 2024년 상반기에는 시각화 및 대시보드 업무에 초점이 맞추어져 있었다. 데이터분석이라는게 익숙하지 않은 회사라면, 회사 내 사람들에게 데이터분석을 전할 때 ‘시각화’란 제일 잘 보이면서 쉬운 접근 방법 중 하나라고 생각한다. 왜냐하면 어느 부서든 월별 막대그래프를 한 번쯤 그려보고, ‘지표’라고 부르지는 않지만 매일 확인해야 할 수치들이 있기 때문이다. 그렇기 때문에 첫 업무로 시각화와 대시보드를 잡았었다.사실 태블로도 수업 들으며 조금, 신병훈련소를 들으며 익힌 기능이 조금이었다. 그리고 태블로 컨설턴트 직무의 지인들을 보면, 나의 대시보드는 기초가 잘.. 2024. 12. 22.
데이터 산출 쿼리에서 간과했던 부분들 (feat. 영업일, 누더기 쿼리의 시작) 최근 분석용DB 중 생산량 테이블 구축을 완료했고, 생산량 테이블을 활용하여 생산량 보고 자동화를 한 업무가 있었다. 생산량 보고를 위한 쿼리 작성 시 간과했던 부분(=영업일 개념을 반영하는 것)과 또 쿼리 수정이 필요할 때 고민이 되었던 현실(=빠른 수정 vs 더 나은 쿼리)을 기록해두고자 한다.(*아래 내용은 실제 업무 내용을 각색 또는 간소화해서 작성) 1. 쿼리 작성 시 간과했던 영업일, 생산 가동일 조건현재 회사는 제조회사이고, 생산량과는 '영업일, 생산가동일'이란 일자 개념이 연관 있다. 처음에는 영업일만 고려하여 케이스별 추출 조건을 작성하였으나, 추가적으로 중요한 '생산가동일' 개념을 놓쳤다는 것을 발견하였다. 처음에 고려했던 케이스 + 놓친 케이스, 선택할 수 있는 해결 방안과 예상 결과.. 2024. 11. 23.
분석 1년차에 돌아보는 보고에 대한 생각(feat.보고혁명 책 리뷰) 서론현 회사에 다닌지 1년이 되었다. 첫 날의 우당탕탕 보고 ~ 최근 늘어난 간이 보고를 거쳐오며, 보고에 대한 고민을 많이 한다. 내가 보고를 잘 하고 있는 것일까? 더 나은 보고를 위해서 어느 부분을 고려하면 좋을까? 란 생각을 늘 하게 된다. 좋은 팁이 있을까 싶어 '보고혁명' 책을 읽었다. 읽으며 내가 했던 실수가 생각나기도 하고, 고치면 좋을 부분도 생겨 인상 깊은 페이지들을 인용해 적어보았다. ※ 읽은 책 정보책 제목 : 보고혁명 : 현직 팀장들이 검증하는 실무 보고서 작성법저자 : 이성윤출판 : 한빛미디어 보고에 대한 생각들1. 보고는 간단명료하게 / 가끔 절충p.24 보고를 받는 사람은 내가 작성한 모든 내용을 자세하고 꼼꼼하게 정독할 시간이 없다. ... 꼭 필요한 내용을 포함했지만 장황.. 2024. 7. 28.
실무에서 SQL의 필요성을 느끼고 공부하는 글 (feat. SQLD, 책, 유데미강의(지원)) 1. SQL의 필요성을 느끼다 1.1 파이썬만 열심히 공부했는데, 실무에서는 SQL을 많이 쓴다고? 취업 준비를 할 때, 현업 분에게 포트폴리오 첨삭을 받은 적이 있다. 실무에서 SQL을 굉장히 많이 쓰기 때문에 해당 스킬셋과 관련 내용을 앞 부분에 배치한 부분이 좋았다고 했다. 당시에는 '그래도 분석은 파이썬 아닌가?'일 정도로 파이썬의 세계만 접해봤기에 SQL을 실무에서 많이 쓴다는 것이 와닿지 않았다. 이제는 취직한 친구들과 만나면, SQL 활용이 생각보다 훨~씬 많다는 이야기를 한다. BI 업무에도 원하는 데이터를 가공 및 연결하기 위해 간단한 SQL 쿼리를 작성하고, 데이터 추출/전처리/필요한 집계 테이블 구성에도 SQL 쿼리를 요청하거나 작성한다. 1.2 SQL 공부를 결심한 계기 - 내가 필.. 2024. 4. 14.
[태블로] 우린 답을 찾을 것이다. 가벼운 대시보드 진행 과정(ft. 태블로 캘린더차트 주차 수정) 서론 일별 batch를 위한 태블로 대시보드 요청이 들어왔다. 회사에서 주요하게 보는 생산부의 일일 생산량을 C레벨에서 보길 원했기 때문이다. 해당 과제를 진행한 흐름과 고민을 했던 구현 한 가지를 나눠보고자 한다. 본론 - 업무 진행 과정 1. 요구 조건 파악 나에게 주어진 요구조건은 아래와 같다. (만약 대시보드 요청이 처음인 부서라면, 아래의 요청도 없을 경우가 많다.) 한 페이지에 너무 많은 내용이 담기지 않게 연 CAPA와 월 목표량 표시 2. 가안 구상 (+추출할 데이터 형식 구상) 사실, 처음부터 자세하게 구상하면 소모되는 시간이 덜해서 좋을 것이다. 하지만 대시보드를 통해 보고 싶은 것이 있지만, 어떻게 보면 좋을지 요청부서 or 요청자가 가늠을 못하는 경우가 많다. 그래서 항상 가볍게 가.. 2024. 3. 31.
한 개의 데이터셋을 가지고 할 수 있는 분석들 (거래처 분석) 1. 서론 회사 내 데이터분석이 익숙하지 않을 때, 분석이 무엇인지 제시해야 할 수 있다. 분석을 제공할 부서에 제시할 간단한 분석과 추가 분석 요청사항을 어떻게 뽑아내면 좋을까? 2. 거래처 분석 파고들기 2-1. 사용할 데이터셋 : 견적주문데이터 물건을 제조하면, 소비자 or 거래처는 견적서를 요청하고, 견적서에 따라 주문을 넣는다. 2-2. 분석 흐름 세우기 견적주문 데이터를 훑어본다. 총 주문 금액을 통한 매출 흐름은 이미 있는 자료일 것 같다. (없다면, 함께 진행) 견적주문 데이터에서 활용할 수 있는 컬럼은 ‘지점’, ‘거래처명’, ‘견적건수’, ‘주문건수’, ‘견적금액’, ‘주문금액’, ‘등록자’일 것 같다. 데이터가 무겁기 때문에(1개년만 해도 30만건 정도), 해당 컬럼을 기준으로 간소화.. 2024. 1. 21.