우리는 매일 뉴스, SNS, 광고를 통해 수많은 그래프를 접한다. 그래프는 복잡한 수치를 한눈에 보여주는 강력한 도구이지만, 때로는 설계자의 의도에 따라 진실을 교묘하게 가리기도 한다. 데이터 시각화 과정에서 발생하는 함정을 이해하는 것은 현대 사회에서 정보를 올바르게 수용하기 위한 필수 역량이다. 가장 흔한 왜곡 기법은 그래프의 세로축인 Y축을 조작하는 것이다. 특정 수치의 변화를 극적으로 보여주고 싶을 때, 작성자는 0부터 시작해야 할 Y축의 하단을 잘라내고 변화가 일어나는 구간만 확대한다. 이렇게 하면 실제로는 1%의 미미한 차이임에도 불구하고, 시각적으로는 몇 배나 급격하게 상승하거나 하락한 것처럼 보이게 된다. 이는 데이터 전처리 과정에서 고의로 특정 범위를 강조할 때 나타나는 대표적인 시왜곡 사례이다. 그래프의 형태를 부적절하게 선택하는 경우도 빈번하다. 시간에 따른 추세를 보여줄 때는 꺾은선그래프가 적합하고, 항목 간의 비중을 비교할 때는 원그래프나 막대그래프가 유리하다. 하지만 항목 간의 단순 비교를 위해 면적이나 부피를 사용하는 3D 그래프를 사용하면, 원근감 때문에 앞쪽에 위치한 데이터가 실제보다 훨씬 커 보이는 착시를 일으킨다. 이는 시각
웹사이트나 모바일 앱을 사용할 때 우리는 수많은 화면과 마주친다. 구매하기 버튼의 색상을 파란색으로 할지 빨간색으로 할지, 팝업창의 위치를 어디에 둘지 결정하는 것은 기업의 매출과 직결되는 매우 중요한 문제이다. 과거에는 이러한 디자인이나 기능의 변화를 기획자의 직감이나 책임자의 취향에 따라 결정하는 경우가 많았다. 하지만 지금은 데이터를 수집하고 시각화하여 가장 객관적인 정답을 찾아내는 방식을 사용한다. 이를 에이비 테스트라고 부른다. 에이비 테스트의 원리는 매우 단순하면서도 과학적이다. 기존의 디자인을 A안으로 두고, 새롭게 바꾼 디자인을 B안으로 설정한다. 그리고 웹사이트에 방문하는 사람들을 무작위로 절반씩 나누어 각각 A안과 B안을 보여준다. 일정 시간이 흐른 뒤 어느 쪽 디자인에서 사람들이 버튼을 더 많이 클릭했는지 데이터를 수집하여 비교 분석한다. 수집된 방대한 사용자의 행동 데이터는 가공 과정을 거쳐 막대그래프나 파이 차트 같은 시각화 자료로 변환된다. 수만 명의 방문자가 남긴 복잡한 로그 데이터들이 단순한 두 개의 막대그래프로 요약되면 어느 안이 더 우수한 성과를 냈는지 누구나 직관적으로 파악할 수 있다. 만약 빨간색 버튼인 B안의 막대그래프가
우리는 매일 뉴스나 인터넷 기사를 통해 수많은 그래프를 접한다. 복잡한 숫자 더미보다 한 장의 그래프가 정보를 훨씬 빠르고 명확하게 전달하기 때문이다. 하지만 시각화된 자료가 언제나 진실만을 말하는 것은 아니다. 때로는 제작자의 의도에 따라 데이터가 실제보다 과장되거나 축소되어 전달되기도 한다. 이것을 이른바 나쁜 시각화라고 부른다. 가장 대표적인 왜곡 수법은 그래프의 세로축을 조작하는 것이다. 보통 막대그래프는 수치의 바닥인 0에서부터 시작해야 한다. 그러나 특정 수치를 강조하고 싶은 제작자가 축의 시작점을 0이 아닌 높은 숫자로 설정하면, 아주 작은 차이도 마치 엄청난 격차가 벌어진 것처럼 보이게 된다. 반대로 수치의 변화를 숨기고 싶을 때는 축의 간격을 매우 넓게 설정하여 완만한 직선처럼 보이게 만들기도 한다. 또한 3차원 입체 그래프를 사용하는 경우에도 착시 현상이 발생한다. 원형 그래프를 비스듬하게 눕히면 앞쪽에 위치한 조각이 실제 비율보다 훨씬 크게 느껴지는 효과가 나타난다. 이는 독자가 데이터의 실제 크기를 비교하는 데 혼란을 준다. 단순히 멋을 내기 위해 선택한 디자인 요소가 정보의 본질을 가리는 셈이다. 착한 시각화란 단순히 화려한 그림을 그