230526 금
1. 필요한 것
흡연구역과 담배꽁초투기지역, 담배꽁초쓰레기통의 상관관계를 볼 수 있는 방법은 없을까
=> 주소와 주소의 상관관계를 구하는 방법은 없을까
2. 참고 자료
범주형 변수의 경우 상관관계 구하는 방법들.
- 데이터 자료 형태에 따른 상관분석 방법 : https://eunhye-zz.tistory.com/29
- 크래머V 레이블 인코딩 + 히트맵 참고 https://blog.naver.com/kthchunjae/222290570091
- 카이제곱검정과 크래머V 코드 참고 블로그
3. 진행
위경도를 도로명주소로 변환 → 도로명주소에서 도로명만 추출 ex) 서울특별시 마포구 마포대로 38 에서 마포대로만 추출
→ 흡연구역과 투기지역, 쓰레기통의 추출한 도로명 간 상관관계가 있을지 카이제곱검정 및 크래머V검정 진행 → 지도시각화와 상관분석 결과가 일치하는지 확인
4. 결과
시각화와 일치하지 않는 경우가 존재함. 도로명으로 추출 후 상관분석 변수로 삼은 것에 오류가 있었을까 고민하게 된다. 해당 상관 분석은 가설 검증의 자료로 사용하는 것은 보류.
댓글