월요일, 3월 23, 2020

[독서광] 데이터 시각화 교과서

오늘은 책만 사장님께서 선물로 보내주신 '데이터 시각화 교과서'에 대한 내용을 소개하겠다. 제목에 '교과서'라는 단어가 붙어 있기 때문에 사용자 인터페이스나 인지와 관련해 이론적인 내용이 전개될 것으로 예상을 했다면... 절반만 맞다. 이 책은 시작부터 그래프를 그리기 위한 (우리가 제대로 이해하고 있지 않았던) 사실부터 짚고 넘어가고, 이어서 바로 우리가 흔히 접하는 다양한 시각화 기법에 대해 좋은 예와 모호한 예와 잘못된 예를 제시하면서 실질적인 조언을 아끼지 않는다. 그리고 그래프 디자인을 하기 위한 기본 원칙을 깔끔하게 정리한다. 이 정도만 해도 도구 사용이나 미적 감각을 강조하는 기존의 시각화 서적과 차별화를 보여주는데, 개인적으로는 다른 어떤 책에서도 찾아보기 어려운 좋은 내용을 담고 있는 28장 '올바른 시각화 소프트웨어 선택법'과 29장 '스토리텔링과 요점 전달'이 가장 인상 깊었다.

이 책의 또 한 가지 놀라운 점은 전문적인 소프트웨어를 사용해 그래프 후 가공을 최대한 자제하고 R만으로 대부분의 효과를 달성했다는 사실이다. 이 책에서 사용된 코드는 깃허브에 올라와 있으므로 R로 시각화를 하시는 분들께서는 살펴보시면 많은 도움을 받을 것이다.

그래프와 표는 단순히 예쁘게 만든다고 다가 아니다. 미적이면서도, 내용은 분명하고, 복잡하거나 오해의 소지를 없애고, 정확하면서도 객관적인 시각화가 필요하다. 최근 코로나 바이러스 때문에 각 언론에서 경쟁적으로 기사를 내보내고 있는데, 솔직히 국내 언론에서 만든 대다수 인포그래픽과 차트는 뭔가 이상하다는 느낌이 드는데(물론, 감탄할만한 기획 기사로 인포그래픽에 상당히 신경을 쓰는 국내 언론도 분명히 존재하고 향후 발전을 기대하고 있다), 이 책을 읽고 나면 도대체 어디서부터 문제인지를 정확하게 인식할 수 있을 것이다. 로이터와 뉴욕타임즈는 이 책에서 제시하는 지침에 가장 근접하는 훌륭한 시각화로 무작정 부풀리고 뻥튀기는 방법으로 사람의 감정에 호소하는 대신 살짝 건조하기까지 느껴지는 사실만으로도 훨씬 더 정보를 정확하고 효과적으로 전달한다.

일례로 로이터의 ReutersGraphics 트위터The Korean clusters를 보면 이 책에서 제시하는 거의 모든 우수 사례를 그대로 따르는 동시에 로이터 자체의 고유한 아이덴티티까지 부여하는 정말 표준적인 잘 만든 인포그래픽을 보여준다. Vox도 9 questions about the Covid-19 coronavirus pandemic, answered라는 기사에서 멋진 인포그래픽을 제시한다(물론, "flattening the curve"에 대한 그래프가 문제가 있다는 지적이 나오기도 했지만 이 책에도 나오지만 일반 독자를 이해시키기 위해 정확도를 떨어뜨린 것으로 보인다). 뉴욕 타임즈도 Watch How the Coronavirus Spread Across the United StatesA Different Way to Chart the Spread of Coronavirus라는 기사에서 상당히 모범적인 인포그래픽을 제시한다.

물론 전문가가 포진한 주류 언론의 수준까지는 도달하지 못하더라도 원리 원칙을 충실히 따르면서 자신이 사용하는 도구를 최대한 활용해 정확하고 깔끔한 그래프를 그리면 얼마든지 주목을 받을 수 있을 것이라 생각한다.

결론: 데이터 시각화에 관심이 있는 모든 분들께 강력 추천한다. 연구 논문이나 보고서 작성 뿐만 아니라 대시 보드 개발에도 큰 도움이 될 것이다. 2020년 1분기에 읽은 최고의 서적이다.

보너스: Ten Considerations Before You Create Another Chart About COVID-19를 보면 COVID-19에 대한 차트를 만들기 앞서 고려해야 하는 10가지 사항이 나온다. 인터넷에서 접하는 (다소 민감한) 정보를 만들 때 이 책에 나온 정확한 정보 전달을 위한 시각화 기법와 대중에 정보를 전달할 때 주의해야 하는 사항을 함께 고려하면 더 바랄 나위가 없겠다.

추가: 이코노미스트는 Mistakes, we’ve drawn a few라는 글에서 오해의 여지가 있거나, 혼란스럽거나, 주장을 밝히는 과정에서 실패한 사례를 분석한 글을 올렸다. 이 책 내용을 토대로 분석하면 좋겠다.

EOB

댓글 없음:

댓글 쓰기