서울시 따릉이(2)
앞선 글에서 정제한 데이터셋을 Tableau public에 불러와주었습니다. csv파일로 저장했기 때문에 text file로 찾기 해주어야 합니다.
1. 따릉이 혼잡도 분포
따릉이의 이용 혼잡도를 서울시 지도 위에 시각적으로 나타낸 것입니다. 위도와 경도 정보를 기반으로 각 대여소의 위치를 지도상에 배치한 뒤, 평균 혼잡도를 색상으로 표현하여 공간적인 수요 불균형을 직관적으로 확인할 수 있도록 구성했습니다.
색상은 혼잡도 값에 따라 구분되며, 푸른 계열일수록 자전거의 대여 수요가 반납보다 많은 '수요 과다 지역'을 의미하고, 주황 계열일수록 반납이 더 많은 '반납 과잉 지역'을 나타냅니다. 이를 통해 어느 지역에서 자전거가 부족하고, 어디에 과도하게 쌓이는지를 시각적으로 파악할 수 있습니다.
또한 각 마커에 커서를 올리면 해당 대여소의 ID와 도로명 주소 정보를 확인할 수 있도록 설정했으며, 오른쪽의 Time Slot, Weekday, Month 등의 필터를 통해 특정 시간대나 요일별, 월별 조건으로 혼잡도 분포를 세분화해 살펴볼 수 있게 구성하였습니다.
이러한 지도 기반 분석은 지역별 운영 전략 수립에 유용하며, 예를 들어 특정 구역이 지속적으로 수요 과다 상태라면 해당 지역에 자전거를 추가 배치하고, 반납 과잉 지역에는 수거 인력을 집중 투입하는 등 자원 재배치의 효율성을 높이는 데 활용할 수 있습니다.
2. 요일별 혼잡도
해당 시각화는 요일에 따라 따릉이 대여소의 혼잡도 평균값이 어떻게 달라지는지를 보여줍니다.
혼잡도는 대여건수와 반납건수의 차이를 기반으로 계산하였으며, 이를 통해 자전거의 수요와 공급 불균형이 얼마나 발생하는지를 파악할 수 있습니다.
분석 결과, 금요일(Fri)에 가장 높은 평균 혼잡도가 나타났으며, 이는 해당 요일에 자전거의 이동이 다른 요일보다 더 활발하게 이루어졌음을 시사합니다. 특히 퇴근 시간대의 영향이 컸을 가능성이 있습니다.
반면, 일요일(Sun)은 혼잡도가 가장 낮은 요일로 나타났으며, 이는 자전거 수요가 비교적 고르게 분산되었거나, 대여와 반납 간 균형이 잘 맞았음을 의미할 수 있습니다.
이러한 요일별 혼잡도 분석을 통해, 자전거 운영 관리팀은 수거 및 재배치 인력을 어떤 요일에 더 집중 배치해야 할지에 대한 근거 있는 판단을 내릴 수 있습니다. 또한, 추후 특정 시간대별 패턴과 결합해 운영 효율성을 더욱 높일 수 있는 인사이트를 도출하는 데 도움이 됩니다.
3. 시간대별 혼잡도
하루를 여러 시간대로 구분하여, 각 시간대별 평균 혼잡도를 비교한 그래프입니다.
이를 통해 따릉이 수거 및 재배치 작업이 어떤 시간대에 가장 많이 필요할지를 직관적으로 파악할 수 있습니다.
그래프를 보면, 퇴근시간대(Evening Rush)에 혼잡도가 가장 높게 나타났으며, 이는 퇴근 시간에 자전거 이용 수요가 급증하면서 대여소 간 자전거 분포에 불균형이 생긴 것으로 해석할 수 있습니다. 특히 이 시간대에는 반납이 몰리는 지역과 대여가 집중되는 지역이 뚜렷이 나뉘어 혼잡도가 크게 상승했을 가능성이 있습니다.
그에 비해, 심야시간대(Late Night)에는 혼잡도가 비교적 낮은 수준을 보였습니다. 이는 자전거 이용이 적은 시간대로, 수거 및 재배치 필요성이 상대적으로 낮다는 것을 의미합니다.
이러한 시간대별 분석은 단순히 전체 이용량이 아닌, 수요-공급 간의 불균형이 언제 심해지는지를 중심으로 운영 전략을 세우는 데 유용합니다. 예를 들어, 저녁 시간대에 자전거 재배치 인력을 더 집중 배치하거나, 특정 대여소의 재고를 사전에 조정하는 방식으로 운영 효율을 높일 수 있습니다.
4. TOP-N 혼잡정류장
이 시각화는 혼잡도가 가장 많이 누적된 따릉이 대여소 상위 N개를 막대그래프로 보여주는 구성입니다. 혼잡도는 SUM(Congestion)을 기준으로 집계하였는데, 이는 단기간의 일시적인 변화보다는 장기간에 걸쳐 자전거 수요와 반납 간 불균형이 반복적으로 발생한 정류장을 파악하는 데에 더 적합하다고 판단했기 때문입니다. 혼잡도가 많이 누적된 정류장은 운영상 꾸준한 개입이 필요한 핵심 지점이 됩니다.
이번 시각화에서는 Top-N 개수를 사용자가 직접 조절할 수 있도록 구성하였습니다. '상위 혼잡 정류장 수'를 선택할 수 있는 슬라이더를 만들었고, 해당 파라미터 값을 기준으로 혼잡도 총합이 높은 대여소 N개가 자동으로 표시되도록 설정하였습니다. 사용자는 슬라이더를 통해 Top 3, Top 5, Top 10 등 원하는 수준의 데이터를 즉시 확인할 수 있습니다. 이와 같은 방식은 사용자에게 더 유연한 탐색 경험을 제공하며, 데이터의 세부 흐름을 상황에 맞게 조정해볼 수 있다는 장점이 있습니다.
또한 각 막대에 마우스를 올리면 해당 대여소의 ID뿐만 아니라 도로명 주소까지 툴팁으로 함께 확인할 수 있어, 위치 파악이 훨씬 수월해졌습니다.
이 분석을 통해 운영자는 혼잡이 가장 많이 누적되는 주요 대여소를 명확하게 파악할 수 있으며, 특정 정류장을 중심으로 수거 및 재배치 인력을 집중 배치하거나, 정류장의 수용 용량 자체를 재조정하는 등 보다 전략적인 자전거 운영 방안을 수립할 수 있습니다.
5. 최종 대시보드
마지막으로, 앞서 개별적으로 시각화했던 요소들을 하나의 대시보드로 통합하여 구성하였습니다. 해당 대시보드는 2024년 6월부터 8월까지의 따릉이 혼잡도 데이터를 기반으로 제작되었으며, 공간적·시간적 시점에서의 혼잡도 분포를 한눈에 파악할 수 있도록 설계하였습니다.
좌측 상단에는 서울시 전역의 따릉이 대여소 혼잡도를 지도 위에 표시한 지도가 배치되어 있으며, 혼잡도 값에 따라 대여소마다 색상이 다르게 나타나 자전거 수요 및 반납 불균형을 공간적으로 직관적으로 확인할 수 있습니다.
오른쪽에는 요일별 혼잡도와 시간대별 혼잡도 시각화를 배치하여, 어떤 요일과 시간대에 자전거 운영이 특히 집중되는지를 비교 분석할 수 있도록 하였습니다. 혼잡도가 높은 구간은 색상 진하게 표현되어 있으며, 이를 통해 사용자와 운영자가 빠르게 혼잡 구간을 식별할 수 있습니다.
또한 하단 좌측에는 TOP-N 혼잡정류장 시각화를 함께 구성하여, 혼잡도가 가장 많이 누적된 정류장을 상위 N개까지 선별해 보여주고 있습니다. 해당 그래프는 슬라이더 파라미터를 통해 사용자가 Top 몇 개의 대여소를 볼 것인지 직접 조정할 수 있도록 구성되어 있어, 필요한 수준에서 데이터를 유동적으로 탐색할 수 있다는 장점이 있습니다.
대시보드 전반에는 Month, Time Slot, Weekday 등의 필터 기능이 포함되어 있어, 사용자가 원하는 특정 기간이나 시간대, 요일을 선택하여 전체 시각화에 동시에 반영되도록 구성하였습니다. 이를 통해 특정 조건 하에서 혼잡도가 어떻게 변화하는지, 지역·시간·대여소별로 다각도로 탐색해볼 수 있습니다.
이와 같이 구성된 최종 대시보드는 단순한 데이터 열람을 넘어, 자전거 수거 및 재배치 작업을 위한 실질적인 의사결정 도구로 활용될 수 있는 시각화 자료입니다.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------
이번 프로젝트에서는 서울시 공공자전거 따릉이 데이터를 활용해, 대여소별 혼잡도 분포를 공간적·시간적으로 분석하고 이를 시각화하는 과정을 수행하였습니다. Tableau를 활용하여 지리적 위치 기반 지도 시각화, 시간대·요일별 혼잡도 분석, 혼잡 정류장 상위 추출 등 다양한 관점에서 데이터를 해석할 수 있었고, 그 결과를 종합한 최종 대시보드를 통해 운영 전략에 도움이 될 수 있는 인사이트를 도출하고자 하였습니다.
완성된 대시보드는 아래 Tableau Public 링크에서 직접 확인하실 수 있습니다.
https://public.tableau.com/app/profile/.82612574/viz/Seoul_bicycle_17445997339190/Dashboard1
프로젝트를 진행하면서 다소 아쉬웠던 점은, 일부 대여소에 위경도 정보가 누락되어 지도 시각화에서 정확한 위치 표현이 어려웠다는 점입니다. 이를 필터링하여 제외하는 방식으로 대응하였지만, 추후에는 주소 기반 지오코딩을 통해 보완하는 방법도 고려해볼 수 있겠습니다.
또한, 시간대 범위를 나누는 기준 설정에 있어 주관적인 판단이 개입된 부분이 있었고, 혼잡도 정의 역시 '대여건수 - 반납건수'라는 단순한 방식으로 계산되었기 때문에, 보다 복합적인 지표(예: 정류소 용량 대비 잔여 자전거 수 등)를 반영한다면 현실에 가까운 분석이 가능할 것으로 생각됩니다.
마지막으로 Tableau 자체 사용에 아직 익숙하지 않아 여러 유용한 기능을 깊이 있게 활용하지 못한 점은 앞으로 보완해 나가야 할 부분이라고 느꼈습니다. 하지만 데이터 분석과 시각화 과정 전반을 직접 경험해보면서 대시보드를 직접 만들어볼 수 있었다는 점에서 의미 있는 시도였다고 생각합니다.