본문 바로가기

전체 글147

[CBB 공모전](트러블슈팅) 카카오맵 API 활용, 데이터셋 주소와 위경도 매치 230523 화 💡 목표 구별 담배꽁초 쓰레기통 데이터셋에 존재하는 주소에 위경도를 매치하여, 지도 시각화 구글 API 보다 카카오 API의 위경도가 더 정확하게 나온다는 팀원의 정보에 카카오맵 API 활용 예정 ❗ 어려움 1 - 강남구 쓰레기통 설치 주소 형태 ex) 압구정로 14길 6(신사동 548-4) 도로명 주소 or 지번 주소 하나만 필요하지만, 설치주소 컬럼에 도로명주소(지번주소), 도로명주소가 혼재되어 있음 괄호('(')를 기준으로 split 후 0번째 값을 가져오도록 apply와 lambda 활용 주소 내 '앞'과 '맞은편'이 포함 공백(' ')을 기준으로 split 반복문 내 [-1] 인덱스 값이 '맞은편' 또는 '앞'이라면 [:-1]까지만 가져오도록 함. 주소 내 시와 구가 포함되어 있.. 2023. 5. 24.
230517~230523 TIL - 프로젝트를 잘 보여줄 방법에 대한 고민, 엑셀 시각화 오류 찾아주기, 범위가 광범위할 때 고민되는 목표 설정, 워드 클라우드 시각화, 도메인 배우기, 논문 오탈자 봐주기, 컨.. 230517 프로그래머스 인덱스 바꾸기 문제 풀이 슬라이싱과 + 를 활용해서 원하는 문자열을 출력할 수도 있음 간단하게 바꾸고 싶은 것을 a[1], a[2] = a[2], a[1]식으로 수정할 수도 있음 230518 프로젝트 기술서 수정해가기 ML 프로젝트를 활용할 것인가 후기 및 느낀점은 기술서에 꼭 필요한 것인가 프로그래머스 가장 큰 수 찾기 문제 풀이 for i in len(array):로 하면, int는 iterable하다고 에러가 난다. range(len(array))로 하면 반복문이 정상적으로 돌아감 for문의 range를 어떻게 둘 것인지 자료 구조를 파악하고 코드를 짜자. 엑셀 시각화 수정해주기 논문 작성하고 있는 친구의 엑셀 시각화 문제 파악하고, 수정할 부분 봐주기 성공 230519 공.. 2023. 5. 23.
GA4 - GA 익히기, UA 보고서, GA4와 UA 차이 실습으로 익히기 ✅ 5장 구글 애널리틱스 다루는 법 익히기 5.1 구글 애널리틱스 사용자 화면 사용법 익히기 사용자 화면(UI, 사용자 인터페이스)를 통해 분석 대부분의 GA 분석은 메뉴 영역과 분석 영역에서 이루어짐 샘플링 하지 않은 상태 - 초록색, 샘플링 한 상태 - 노란색 5.2 메뉴 영역 : 분석 대상은 무엇인가(What)? 대시보드 맞춤 알림 : 조건에 해당될 때 알림 발생 저장된 보고서 : p.127에서 저장한 보고서 5.3 분석 영역 : 분석을 어떻게 진행할까(How)? 세그먼트 : 분석가가 트래픽을 분류하는 기준 캘린더 주석 측정기준 : p.80 참고 고급 검색. ex) Direct를 제외해서 출력 그래프 출력 유형 분석 결과표 ✅ 6장 UA 보고서로 분석해 보기 보고서 : 잠재고객(Audience) 보.. 2023. 5. 23.
230515, 230516 TIL - 나의 킥은 뭘까. 프로젝트 기술서 수정 방향, 스크래핑 지원, 프로세스 매핑, pop(), 머리를 식히는 것도 때론 방법인 것 같다. 230515 Mon 스터디 데이터 분석 분야에서 나의 킥은 무엇일까 프로젝트 기술서 수정 방향 : 인원수, 목표-> 결과(성과), 데이터를 어떻게 수집/처리/시각화했는지 마켓센싱 최소 요구 조건(경쟁사 3사) 중 k사 스크래핑 진행이 되고 있지 않아서, 스크래핑 지원 6시간 잡고 있었나... 230516 Tue 공모전 주제 헷갈렸던 것 팀원들과 체크하고, 구체화 배경자료, 상권, 기타 5개 분류의 데이터셋 목록 정리 프로세스 맵핑을 그려보고 시작하고 싶었는데, 잘 되었나..? 배운 점 : 데이터셋을 나눠서 분석해오자고 제안했는데, 기간이 여유롭기도 해서 각자 하고 싶은 것을 분석해오자고 했다. 처음에는 같은 작업을 중복해서 할 필요가 있을까 싶었는데, 다른 관점에서 edge case를 찾아낼 수도 있다는.. 2023. 5. 17.
[마켓센싱] 셀레니움으로 다른 경쟁사 홈페이지 스크래핑(더보기 클릭, 새 탭으로 열기, id값 변화 오류들) 230515, 230516 해당 홈페이지는 페이지 번호로 이동하는 이전 홈페이지와 다르게, 더보기(see more)를 클릭하면 추가로 15개씩 기사가 출력되는 형식의 홈페이지이다. 💡 스크래핑 방향 설정 - 필요한 날짜까지 한 번에 더보기를 클릭해서 기사목록을 펼쳐둔다 > 기사를 클릭해 들어간다 > 본문 스크래핑 > 원래 페이지로 돌아옴 - is_displayed()를 활용해 코드 작성 완료 # 더보기 버튼 클릭하는 요소 more_botton = driver.find_element(By.CSS_SELECTOR, '#newsloadmore') for i in range(1, 5): # 4번 더보기 클릭하도록 설정 time.sleep(3) if more_botton.is_displayed(): more_bo.. 2023. 5. 17.
[북킷 챌린저 3기] 구글 애널리틱스 학습 계획표 🗓️3주 학습계획표 ​ 1️⃣1주차: 5월 9일(화)~5월 16일(화) 1주차 목표: 학습계획표 작성하며 목표 다지기 & GA 기본 개념 알아보기 1주차 (5/9~5/16) 1일차 2~3일차 4일차 5일차 6일차 7일차 8일차 내용 ✅책 수령 ✅1장 구글애널리틱스 알아보기 ✅2장 구글 애널리틱스 시작 준비하기 ✅3장 구글 애널리틱스의 주요 개념 ✅4장 분석 환경 설정하기 ✅2, 3, 4장 실습 따라하기 ✅3주 학습계획표 작성하기 ✅1주차 내용 복습 및 [챌린지 기록] 작성 2️⃣주차: 5월 17일(수)~5월 23일(화) 2주차 목표: 실습을 통해 GA4의 주요 기능 익히기 2주차 (5/17~5/23) 1일차 2일차 3일차 4일차 5일차 6일차 7일차 내용 ✅5장 구글 애널리틱스 다루는 법 익히기 ✅6장 .. 2023. 5. 16.
GA4 - 계정 생성, 분석 환경 설정하기 ✅ 2장 GA 계정 설정 : 계정 설정, 속성 설정, 고급 옵션 설정 계정 선택기 사용 방법 Google 애널리틱스 데모 계정 > 즐겨찾기 ❓ 학습이 더 필요한 개념 : 즐겨찾기에 추가한 각각의 데모 계정이 '속성 및 앱'에 해당한다는 것 데모 계정 : GA4 - Flood-It!, GA4 - Google Merchandise Shop, UA - Google Merchandise Shope(1 Master View) ✅ 3장 계정 : GA 어카운트 모두의GA 계정 > 구글 데모 계정 추가 속성 및 앱 : GA 데이터가 실제로 저장되는 공간 보기 UA - Google Merchandise Shop 속성에는 3개의 보기가 존재 3가지 종류의 보기를 만드는 것을 추천 GA4 스탠다드 버전은 보기가 없기 때문에.. 2023. 5. 15.
230513-230514 TIL - 스크래핑 코드 아쉬운점, isdigit(), GA4 230513 마켓센싱 프로젝트 월요일까지 스크래핑 완료가 목표, csv파일 생성은 완료함 아쉬움 점 : 코드를 전부 다 이해해서 내 것으로 만들긴 했지만, 온전히 내가 짠 코드가 아니라 누군가가 해둔 코드를 응용한 것에 불과함 아쉬운 점 2 : 셀레니움으로만 코드를 작성했는데, 1페이지 당 약 3분의 시간이 걸림. beautifulsoup으로 하면 시간이 더 적게 걸리는 지 팀원들의 결과를 월요일에 확인해보고 싶음 프로그래머스 숫자인지 판별하는 .isdigit() 이후 리스트에 append하면 string으로 들어감. ex) ["1", "2"] 그렇기 때문에 정답과 같이 [1, 2]로 보이기 위해서는 int()처리 해줌 230514 GA4 이론 부분이라서 읽고 넘어가면 되는 줄 알았는데, 실습 내용을 따.. 2023. 5. 15.
[마켓센싱] '뉴스 클릭 > 본문 스크래핑' 반복 시, 에러 잡기 230513 페이지 내 뉴스 기사(20개) 클릭 > 스크래핑 시 for문 에러 1. for z in range(5, 25) 뉴스 기사를 클릭하는 CSS_SELECTOR 경로는 'body > div.container > div:nth-child(5) > div > div.news-item-content > h3 > a' nth-child(5) 부터 20개의 기사를 클릭해야 함. for z in range(5, 25) 를 했어야 하는데, (5,26)으로 설정해서 에러가 나고 다음 페이지 클릭이 안되었던 것 2. f'body > div.container > div:nth-child({z}) > div > div.news-item-content > h3 > a' {z}라는 변수를 반복해서 변경할 것이기 때문에 .. 2023. 5. 15.