도심 한복판, 목이 말라 마신 음료수 캔을 버리려는데 쓰레기통이 보이지 않아 난처했던 경험이 누구나 한 번쯤 있을 것이다. 반면, 어떤 곳은 쓰레기통이 너무 자주 보여 관리가 안 되는 것처럼 느껴지기도 한다. 우리가 무심코 지나치는 길거리 쓰레기통의 위치는 단순히 감에 의존해 결정된 것이 아니다. 그 이면에는 방대한 공공 데이터 수집과 과학적인 통계 분석이 숨어 있다. 현대 도시 설계에서 쓰레기통 배치 문제를 해결하기 위해 가장 먼저 활용하는 것은 유동 인구 데이터이다. 통신사 기지국 정보나 교통카드 이용 내역 등을 통해 도시의 어느 구역에 사람들이 많이 몰리고, 어떤 경로로 이동하는지 파악한다. 단순히 사람이 많은 곳뿐만 아니라, 음료수를 사서 들고 다니는 시간이 대략 어느 정도인지, 즉 어느 지점에서 쓰레기가 발생할 확률이 높은지까지 예측한다. 이는 데이터 전처리 과정을 거쳐 분석 가능한 형태로 가공된다. 수집된 데이터는 공간 통계 분석을 통해 구체적인 위치로 환산된다. 특정 구역 내의 유동 인구 밀도와 기존 쓰레기통 간의 거리를 고려하여, 가장 효율적인 배치를 찾아내는 알고리즘을 가동한다. 무작위로 설치하는 것이 아니라, 쓰레기 발생 빈도를 예측하여 관
우리가 매일 걷는 거리, 탑승하는 버스, 가로등의 위치 등 도시의 모든 움직임은 데이터로 기록된다. 정부나 지방자치단체는 이러한 정보 중 개인정보를 제외하고 누구나 자유롭게 활용할 수 있도록 개방하는데 이를 공공 데이터라고 부른다. 공공 데이터는 단순한 엑셀 파일이나 숫자의 나열에 불과할 수 있지만 데이터 가공과 시각화 기술을 만나면 세상을 바꾸는 강력한 도구로 변신한다. 가장 대표적인 사례가 심야 버스 노선의 최적화이다. 늦은 밤 시민들이 어디서 택시를 가장 많이 탔는지, 휴대전화 통화량이 어느 지역에서 집중적으로 발생했는지 보여주는 통신사의 데이터와 시의 교통 데이터를 결합하여 가공한다. 이 복잡한 정보들을 지도 위에 시각화하면 밤늦게 유동 인구가 많지만 대중교통이 부족한 사각지대가 붉은색으로 선명하게 드러난다. 이를 바탕으로 시민들이 가장 필요로 하는 노선을 새롭게 설계할 수 있다. 또한 범죄 예방을 위해 가로등이나 CCTV가 부족한 어두운 골목길을 찾아내는 데에도 공공 데이터가 쓰인다. 지역별 범죄 발생률 데이터와 조명 설치 데이터를 겹쳐서 분석하면 어느 곳에 우선적으로 가로등을 설치해야 할지 객관적인 근거가 마련된다. 과거에는 민원이 들어와야만 수동