토요일, 12월 07, 2019

[독서광] 세상에서 가장 재미있는 통계학

오늘은 간만에 독후감을 하나 올려본다. 머신러닝 관련 작업을 하다보니까 통계에 대한 기초를 다시 한 번 짚고 넘어갈 필요성이 생겼는데, 대학교 때 배우던 통계책을 보려니까 아픈 기억(?)이 되살아나서 대안을 찾으려 교보문고에 가서 뒤적거리다 발견한 '세상에서 가장 재미있는 통계학'을 처음부터 끝까지 읽고 말았다.

우선 이 책은 만화로 구성되어 있다는 사실을 짚고 넘어간다. 그렇다고해서 어린이용 학습서라는 이야기는 결코 아니다. 그림을 그린 사람이 『세상에서 가장 재미있는 세계사』를 만든 래리 고닉이라는 사실을 알면 아마 이 책을 다시 평가하게 될지도 모르겠다. 이 책은 통계에 대해 모든 것을 설명하지는 않지만(그랬다가는 책 두께가... T_T), 통계에 꼭 필요한 기본적인 개념을 이해하기 쉬우면서도 정확하게 소개하는 특징이 있으므로 고등학교를 졸업하고(대학에서 교양(?)으로 확률과 통계를 배우신 분에게 더 적합할지도...) 사회에서 갑자기 통계에 대해 뭔가 기초 지식이 필요할 경우에 딱 맞는 특성이 있다.

이 책은 사람들이 통계에서 많이 어려워하는 몇 가지 개념을 정면으로 돌파하기 때문에 정신을 조금 차리고 읽을 필요가 있다. 다음 문제를 한 번 볼까?

1개의 주사위를 네 번 굴려서 6이 한 번 나오는 경우와 2개의 주사위를 24번 굴려서 동시에 6이 한 번 나오는 경우 중 어느 쪽이 확률이 더 높은가?

드 메레라는 도박사가 이 문제를 놓고 머리가 아팠던 이유는 상식선에서 생각하면 둘 다 확률이 2/3처럼 보이지만 실제 현장에서 겪어보면 두 번째 도박에서 패배할 확률이 높았기 때문이었다. 이 문제는 드 메레의 친구인 파스칼(여러분이 알고 있는 바로 그 수학자다)이 체계적으로 정리했다. 이미 눈치챈 분도 계시겠지만 조건부 확률과 특별 곱셈 정리를 동원하지 않으면 제대로 풀지 못한다. 이 책에서는 유머러스하게 공식을 유도하고 정리하면서 드 메레의 골칫거리를 정리해준다.

또한 수업 시간에 늘 햇갈린 중심극한정리에 대해 명쾌하게 짚고 넘어간다(나는 지금까지 내 머리가 나쁜줄 알고 있었는데, 이 책을 읽고 나서 수업 시간에 왜 이렇게 쉽게 가르쳐주지 않았는지에 대해 의아해하고 있다. T_T). 평균의 표본분포와 관련해 표본평균의 추정량도 역시 근사적으로 정규분포를 따른다는 이론인데 중심극한정리에 대해 제대로 이해하고 넘어가야 뒤에 나오는 t분포와 신뢰구간이 머리에 들어오게 된다. 공식만 댑다 외워서 언제 뭘 쓰는지 몰라서 시험칠 때마다 틀렸는데 진작 이렇게 제대로 정리해줬으면 얼마나 좋았을까 후회하고 있다.

베이즈 정리와 잘못된 양성반응과 관련한 내용도 상당히 잘 정리되어있다. 만화라는 장점을 극대화해서 2x2 조건 표를 만든 다음에 산식으로 확률을 계산하는 방법을 보고 있으면 뭔가 속이 시원해지는 느낌이 올 것이다.

결론: 통계 관련 기초 내용을 빠르고 쉽고 정확하게 이해하고 싶은 분들께 추천한다. 단, 가장 처음 보는 입문용으로는 곤란하다.

EOB

댓글 없음:

댓글 쓰기