본문 바로가기

til61

VCS, SVN, Git(Github, Gitlab), CI/CD, DevOps VCS 버전 관리 시스템을 VCS(Version Control System)이라고 하며, 대표적인 버전 관리 소프트웨어로 SVN(Subversion)과 Git이 있다. 여러 명이서 작업하는 프로젝트의 버전관리나 각자 만든 소스의 통합과 같은 문제를 해결하기 위해 저장소를 만들어 그 곳에 소스를 저장해 소스 중복이나 여러 문제를 해결하기 위한 형상관리/소스 관리 툴. * 형상 관리 : 소스의 변화를 끊임없이 관리하는 것 * 형상관리툴의 종류 - Client/Server 타입 : Subversion(SVN), CVS, Perforce, ClearCase, TFS (Client/Server 타입이라고 들으면 어려워 보이지만, SVN 등은 중앙집중식 버전 관리 도구이다. 중앙서버의 저장소를 Client, 각 개.. 2023. 8. 16.
한 달 TIL - 공모전, 불용어 처리 공부, 태블로 신병훈련소, GA4 1. ~230604 까지는 공모전 2. 이후에는 마켓센싱 영어 불용어 처리 과정, nltk, 토큰화 등 자연어 처리에 대한 간단 공부 3. 230605~230618 태블로 신병훈련소 4. GA4 스터디 깃헙에 잔디 심기와 블로그 TIL 작성을 잘 하다가, 바빠지니까 신경을 쓸 수 없었다. 조금 아쉽지만 잔디에 너무 집착하지 말자. 없다고 내가 공부를 안 한 것은 아니니까. 앞으로의 목표 - 태블로로 워드 클라우드 성공하기 : 날짜, 기사, 토큰화, 불용어처리한버전 등이 포함된 파일을 그래도 태블로에 불러와서 여러 방법으로 활용할 수 있는 방안을 찾기 2023. 6. 20.
230524, 230525 TIL - 지오코딩, 지리적 데이터 시각화 시 가설검정에 대한 고민과 EDA 방법 230524 수 TIL - 지오코딩 Project 카테고리의 지도 API를 활용하는 부분 참고. 주소 → 위경도 위경도 → 주소 지번주소 → 도로명주소 등 지오코딩, 역지오코딩의 개념을 알게 되고, 익히게 되었다. 230525 목 TIL - 지도 시각화 시, 가설 검정에 대한 고민. 지리적 데이터의 EDA 방법에 대한 고민 쓰레기통의 위치를 분석하려고 하다 보니, 데이터분석적으로 위치의 설득력을 어떻게 가져갈 것인지 고민이 되었다. 예를 들어, 쓰레기통과 흡연구역의 위치를 지도 시각화를 하였다. 흡연구역과 쓰레기통의 위치는 일치하는 경향을 보인다. 이것을 시각적으로만 보고 판단했을 때, 정확할까? 설득력이 있을까?가 고민이 많이 된다. 시각화는 스타벅스 매장 시각화를 참고하였고, 해당 글에서도 가설검정을.. 2023. 6. 7.
230517~230523 TIL - 프로젝트를 잘 보여줄 방법에 대한 고민, 엑셀 시각화 오류 찾아주기, 범위가 광범위할 때 고민되는 목표 설정, 워드 클라우드 시각화, 도메인 배우기, 논문 오탈자 봐주기, 컨.. 230517 프로그래머스 인덱스 바꾸기 문제 풀이 슬라이싱과 + 를 활용해서 원하는 문자열을 출력할 수도 있음 간단하게 바꾸고 싶은 것을 a[1], a[2] = a[2], a[1]식으로 수정할 수도 있음 230518 프로젝트 기술서 수정해가기 ML 프로젝트를 활용할 것인가 후기 및 느낀점은 기술서에 꼭 필요한 것인가 프로그래머스 가장 큰 수 찾기 문제 풀이 for i in len(array):로 하면, int는 iterable하다고 에러가 난다. range(len(array))로 하면 반복문이 정상적으로 돌아감 for문의 range를 어떻게 둘 것인지 자료 구조를 파악하고 코드를 짜자. 엑셀 시각화 수정해주기 논문 작성하고 있는 친구의 엑셀 시각화 문제 파악하고, 수정할 부분 봐주기 성공 230519 공.. 2023. 5. 23.
230515, 230516 TIL - 나의 킥은 뭘까. 프로젝트 기술서 수정 방향, 스크래핑 지원, 프로세스 매핑, pop(), 머리를 식히는 것도 때론 방법인 것 같다. 230515 Mon 스터디 데이터 분석 분야에서 나의 킥은 무엇일까 프로젝트 기술서 수정 방향 : 인원수, 목표-> 결과(성과), 데이터를 어떻게 수집/처리/시각화했는지 마켓센싱 최소 요구 조건(경쟁사 3사) 중 k사 스크래핑 진행이 되고 있지 않아서, 스크래핑 지원 6시간 잡고 있었나... 230516 Tue 공모전 주제 헷갈렸던 것 팀원들과 체크하고, 구체화 배경자료, 상권, 기타 5개 분류의 데이터셋 목록 정리 프로세스 맵핑을 그려보고 시작하고 싶었는데, 잘 되었나..? 배운 점 : 데이터셋을 나눠서 분석해오자고 제안했는데, 기간이 여유롭기도 해서 각자 하고 싶은 것을 분석해오자고 했다. 처음에는 같은 작업을 중복해서 할 필요가 있을까 싶었는데, 다른 관점에서 edge case를 찾아낼 수도 있다는.. 2023. 5. 17.
230513-230514 TIL - 스크래핑 코드 아쉬운점, isdigit(), GA4 230513 마켓센싱 프로젝트 월요일까지 스크래핑 완료가 목표, csv파일 생성은 완료함 아쉬움 점 : 코드를 전부 다 이해해서 내 것으로 만들긴 했지만, 온전히 내가 짠 코드가 아니라 누군가가 해둔 코드를 응용한 것에 불과함 아쉬운 점 2 : 셀레니움으로만 코드를 작성했는데, 1페이지 당 약 3분의 시간이 걸림. beautifulsoup으로 하면 시간이 더 적게 걸리는 지 팀원들의 결과를 월요일에 확인해보고 싶음 프로그래머스 숫자인지 판별하는 .isdigit() 이후 리스트에 append하면 string으로 들어감. ex) ["1", "2"] 그렇기 때문에 정답과 같이 [1, 2]로 보이기 위해서는 int()처리 해줌 230514 GA4 이론 부분이라서 읽고 넘어가면 되는 줄 알았는데, 실습 내용을 따.. 2023. 5. 15.
230511~230512 스크래핑, 중요 순위 고민, GA4, 프로그래머스 통과하지 못한 테스트 케이스가 뭘까 230511 스터디 스크래핑 : 잘 되는 것 같은데, 오류가 계속 발생해서 골치가 아프다. 잠시 해결되었다가 같은 에러가 다시 발생. 원서 넣기에 집중해도 모자랄 것 같은데, 중요 순위를 놓치고 이것저것 하고 있는건 아닌가 고민을 하게 된다. GA4 겨우 1장 읽기 완료 230512 프로그래머스 최댓값 구하기(2) : 원래 생각한 방법은 테스트 8, 9에서 통과하지 못했는데, 통과하지 못한 케이스가 뭔지 알고싶다. 2023. 5. 12.
230510 TIL - 프로그래머스(샘플 값이 어떻게 도출되는지 고민하면, 답이 보일 때도 있다.), 셀레니움 클릭 설정에서 어려움을 겪는 중 프로그래머스 # 42. 주사위의 개수 Fact : 상자의 가로, 세로, 높이 값을 주는 box라는 변수가 있다. 샘플로 [10, 8, 6]이 주어졌을 때, 변의 길이가 3인 주사위는 12개가 된다고 한다. 주사위가 얼마나 들어가는지 계산하는 방법을 모를 때, [10, 8, 6]과 3을 어떻게 사용하면 12라는 값이 나올지 고민해봤다. - 먼저 상자를 그려보고, 왜 12개의 상자가 들어가는지 생각해봤을 때, 가로에는 3줄, 세로로는 2줄, 높이로는 2줄이 들어간다. - 그 값들을 생각해보니 box 변수 값을 n으로 나눈 몫이었다. - 그 몫들을 곱하니 12라는 결과가 나온다. Feeling : 남들에게는 쉽게 도출되는 식일지 모른다. 하지만 막막하게 느끼며 문제에 손도 못대던 때에 비하면, 왜 이 값이 나.. 2023. 5. 11.
221120 미니프로젝트4(데이콘 버스 운행시간 예측) TIL 미니 프로젝트를 진행하며 어려웠던 점 아직 X, y, train, test 개념이 확립되지 않았는지, 학습을 시키고 예측을 할 때, value error가 뜨는 등의 변수가 발생하면 어느 부분을 고쳐야 할 지 찾기가 어려웠다. 마침 내일 머신러닝 복습을 할 수 있어서, 공부해보고 다시 수정하고 싶다. 사용할 컬럼을 구분하는 것이 어려웠다. 또 object 타입인 컬럼을 사용하고 싶다면, 어떻게 데이터타입을 바꿔야 할지 고민하게 되었다. 파이캐럿을 써서 하이퍼파라미터 조정을 참고해보려고 했는데, 컴퓨터가 돌아가지 않아서 포기하게 되었다,, 인내를 가져야겠다. 시도했지만 성공하지 못한 것 xg부스트로 점수를 내보고 싶었는데, 음의 값이 있어서 에러가 떴다. 아마 그 문제 때문에 xgb_score도 0점이 나.. 2023. 5. 10.