0. 질문
- 서울 지하철 총 승객수는 호선에 따라 차이가 있을까?
- 총 승객수가 가장 많은 역은 어디인가?
- 12월내 총 승객수 트렌드는 어떤가?
1. 데이터
데이터 : 2020년 12월 역별 승, 하차 승객 수
등록일자는 사용일자에서 3~4일 뒤 날짜인데 아마 전산에 등록된 날짜인듯 하다.
총 승객 수를 볼거라 승차 총 승객수, 하차 총 승객수, 등록일자 열을 사용하지 않는다.
신분당선이 없다.
2. 차트
1) 서울 지하철 총 승객수는 호선에 따라 차이가 있을까?
2호선이 압도적으로 승객수가 많다. 서울을 한바퀴 도는 호선이라 그런 것 같다.
내 예상 외로 1호선이 하위권이고, 분당선 승객 수가 많다.
2) 역별 승객 수
역별 승객 수 그래프와, 거기에 색으로 호선을 색깔 구분을 한 그래프이다.
잠실, 강남, 고속터미널, 신림, 선릉 순으로 승객수가 많은데 신분당선이 데이터가 없어서 그런 것 같다. 신분당선 데이터까지 있으면 잠실보다 강남이 많을 것 같다.
고속터미널, 서울역, 가산디지털단지역을 제외하고 2호선 역들이 상위권이다.
예상 외로 고속터미널이 3위였다. 터미널이랑 백화점이 있어도 3위라니. 사람들이 고속버스를 그렇게 많이 타나 싶은데 다른 달도 그런지 궁금하다. 남부터미널은 최상위는 아니지만 상위권이긴 하다.
3) 12월 일자별 총 승객수
휴일에는 승객 수가 눈에띄게 줄어들었다.
월 초보다 중순~말일에 승객 수가적은데 아마 연말이라 연차를 낸 직장인이들이 많지않을까 싶다.
'1) 호선별 승객수'에 일자자를 색깔로넣었다. 검정은 평일, 파랑은 토요일, 빨강은 일요일 및 공휴일.
평일, 주말 구분하는 열 추가 대신 일별 레이블 색상을 칠했다.
3. 추가 분석
신분당선 데이터를 추가하면 역별 승객 수 그래프는 결과가 조금 다르게 나올 것같다.
호선별 승객수는 파이차트로 보면 얼마나 차이는지 비교가 쉬울 것같다.
호선별 승객수 평일/주말 구분 레이블 색깔로 말고 평일/주말 열을 추가해서 보면 더 깔끔하게 보일 것 같다.
4. 막대 차트
막대 차트는 방향에 따라 수직 막대 차트와 수평 막대 차트 두 가지가 있는데,
방향만 다르지만, 수직 막대 차트는 항목의 트렌드 파악, 항목 간 순위 비교에 유용하다.
수평 막대 차트는 항목이 많거나, 목표치에 대한 상대적 달성도 확인에 유용하다.
참고
황해진, 윤영진, 사례분석으로 배우는 데이터 시각화, 한빛미디어
'Data > Data Engineering & Analystics' 카테고리의 다른 글
[태블로] 인천광역시 시군구별 인구 구성 비율은 어떤가? (파이차트) (1) | 2024.12.15 |
---|---|
[태블로] 제주도 자연 휴양림 이용객 현황? (라인차트) (0) | 2024.12.15 |
[Docker] Docker 설치 필요 하드웨어 스펙 (0) | 2024.12.14 |
[AWS] RDS Public Access 설정 (0) | 2024.05.18 |
데이터 중심 애플리케이션 설계 : 4장 부호화 발전 (0) | 2024.03.31 |