본문 바로가기
Study/데이터분석가의 고민

한 개의 데이터셋을 가지고 할 수 있는 분석들 (거래처 분석)

by aimaimee 2024. 1. 21.

1. 서론

회사 내 데이터분석이 익숙하지 않을 때, 분석이 무엇인지 제시해야 할 수 있다. 분석을 제공할 부서에 제시할 간단한 분석과 추가 분석 요청사항을 어떻게 뽑아내면 좋을까?

 

2. 거래처 분석 파고들기

2-1. 사용할 데이터셋 : 견적주문데이터

물건을 제조하면, 소비자 or 거래처는 견적서를 요청하고, 견적서에 따라 주문을 넣는다.

https://terms.naver.com/entry.naver?docId=1925449&cid=42279&categoryId=42279

2-2. 분석 흐름 세우기

  1. 견적주문 데이터를 훑어본다.
  2. 총 주문 금액을 통한 매출 흐름은 이미 있는 자료일 것 같다. (없다면, 함께 진행)
  3. 견적주문 데이터에서 활용할 수 있는 컬럼은 ‘지점’, ‘거래처명’, ‘견적건수’, ‘주문건수’, ‘견적금액’, ‘주문금액’, ‘등록자’일 것 같다. 데이터가 무겁기 때문에(1개년만 해도 30만건 정도), 해당 컬럼을 기준으로 간소화된 데이터를 뽑는다.
  4. 분석 예상 리스트업 뽑기
    하나의 데이터만 가지고도 분석은 꼬리에 꼬리를 물고 다양하게 들어갈 수 있다. (사실, 이렇게 분석할 것이 보이면 좋지만, 가끔은 데이터를 보고도 어떤 분석 리스트업이 나올 지 막막할 때도 많다.)
    • 지점별 비교 : 어떤 지점이 실적이 좋을까?
    • 거래처 비교 : 어떤 거래처가 회사에 도움이 될까? = 우수 or VIP거래처
    • 건수 비교 : 견적 → 주문 전환율
    • 금액 비교 : 견적금액, 주문금액
    • 등록자 비교 : 어떤 영업사원이 실적이 좋을까? 등록자=영업사원
  5. 리스트 중 긴급하게 봐야 하는 자료 파악 후, 우선적으로 분석

2-3. 분석 진행

2-2의 5번을 통해, 보고자가 듣고자 하는 정보가 '2023년 신규거래처 수'라고 하자. 기초적인 파이썬 코드만으로도 확인할 수 있는 값들이다.

# 데이터 불러오기
jumun23 = pd.read_excel('2023년 견적 주문.xlsx')

# 신규 거래처 설정
new_deals = jumun23[jumun23['신규거래여부']=='Y']

# 중복 제외 신규 거래처 갯수 보기
new_deals['거래처'].nunique()

# 신규 거래처(중복 제외) 리스트 보기
new_deals['거래처'].unique()

⇒ 출력 결과 : 2

⇒ 출력 결과 (중복 제외 업체 리스트) : (주)B, (주)F

 

이대로만 끝나면 너무 심심(?)하니까 간단한 결과물을 더 추가해보기로 한다.

신규거래처 개수가 궁금하다면, 신규거래처가 이후에도 계속 거래를 했는지, 얼마나 거래를 했는지도 궁금하지 않을까?

# 신규거래처별로 첫 거래 날짜를 찾기
latest_deal_dates = new_deals.groupby('거래처')['견적등록일'].max()

# 결과물을 볼 데이터프레임 컬럼 설정
result_df = pd.DataFrame(columns=['거래처', '거래지속여부', '이후거래횟수'])

# 최근 거래 날짜 이후의 거래가 있는지 확인
for trader, latest_date in latest_deal_dates.items():
    ongoing_deals = jumun23[(jumun23['거래처'] == trader) & (jumun23['견적등록일'] > latest_date)]
    num_ongoing_deals = len(ongoing_deals)

    result_df = result_df.append({'거래처':trader, '거래지속여부':num_ongoing_deals>0, '이후거래횟수':num_ongoing_deals}, ignore_index=True)

# 결과 데이터프레임 출력 또는 저장
print(result_df)
# result_df.to_excel('결과_신규거래처_이후_거래.xlsx', index=False)

⇒ 출력 결과

2-4. 추가 분석 요청사항 수령

위의 결과물 제출 후, 아래 요청들이 추가로 들어왔다.

  • 신규거래처 분석한 결과를 지점별로 묶기
  • 분석 리스트 중 견적→주문 전환율
  • 우수 거래처 분석

 

3. 회고

위의 분석 흐름은, 1월 상반기 업무에서 진행한 분석 흐름을 간소화 + 각색한 것이다. 단발성으로 끝난 것도 있고, 실적 측정 방법을 바꾸거나 거래처명을 정리하는 새 프로젝트를 받게 되기도 했다.

입사 후 파이썬 코드는 건드려 볼 기회가 거의 없었는데, 파이썬을 활용할 업무를 발굴했다는 점이 뜻 깊다. ‘하고 싶은데 할 수 없다면 할 수 있게 만들자’라는 뉘앙스를 ‘내 환경에선 적용할 수 없어’라고 받아들일 때가 많았는데, 파이썬을 적용할 점을 찾아내니 계속 활용할 업무가 추가적으로 들어오는 것을 보고 ‘할 수 있게 만들자’라는 것이 무슨 느낌인지 어렴풋이 잡히는 기분이다.

사실 부트캠프나 프로젝트를 할 때도 하나의 데이터를 가지고 분석을 했는데, 그 때는 이렇게 꼬리에 꼬리를 무는 분석 주제를 생각하지 못했다. 아마 그 데이터에 대한 깊은 이해(도메인 지식)가 부족해서 그랬지 않았을까. 꼭 제조가 아니더라도 거래처가 있거나, 소비자의 주문이 있다면 응용해서 분석할 수 있을 것 같다.

(+변수명 설정은 항상 늘 너무너무너무 고민된다.)

댓글