-
한빛미디어의 "이렇게 쉬운 통계학"을 읽어보자Daily NoPD/rEvieW 2019. 4. 12. 07:30728x90
수학은 스트레스일까?
요즘도 비슷한 커리큘럼인지 모르겠지만 공과대학을 다니면서 배웠던 전공 과목중에 "확률통계" 가 있었다. 명색이 공대생이었지만 고등학교 시절부터 "수학은 나와 관계 없는 학문인거 같아"라고 생각했기 때문에 미분적분학부터 시작하여 공업수학, 확률통계학 등은 무척 괴로웠다는 기억이 가득하다.
작년 회사 동료들과 함께 코세라(Coursera)에서 머신러닝 기초 과정을 들으면서 "확률과 통계가 이렇게 쓰이네?"하는 생각을 무척 많이 했다. 그러면서 어렴풋이 했던 생각이 "수학을 좀 다시 들여다 보고 싶어졌어" 였다. 물론, 그 이후 실천 없이 시간이 흘렀고 한빛미디어에서 출간한 "이렇게 쉬운 통계학"을 보기 전까지 수학을 다시 들여다 본적은 1초도 없긴했다.
쉽다. 술술 읽힌다.
일본에서 나온 서적들이 기초적인 내용들에 대하여 손쉽게 이해하는데 도움이 된다는 이야기는 여기저기서 많이 들었던 것 같다. 다만, 스스로 그 이야기를 이해할 수 있었던 것이 이번이 처음이라는 것에 한 번 놀랐고, 나의 게으름에 한 번 더 놀랐다. 그리고, 이 책에서 중요하면서 기초적인 통계의 용어나 개념을 "더하기 빼기란?" 보다 쉽게 알려주는 것에 마지막으로 한 번 더 놀랐다.
대량의 데이터와 모델링을 기반으로 하는 머신러닝이 소화해 줄 수 있는 영역인지는 모르겠지만 생업으로 삼고 있는 트레픽 엔지니어링에서 매년 한번 씩 돌아오는 스트레스가 미래 트레픽에 대한 예측이다. 패턴화 하기 힘든 것이 제품의 출시 일정이고 이에 대한 사람들의 반응이기 때문에 "과연 미래의 트레픽은 예측할 수 있을까? 학습으로 커버가 가능할까?"의 의심이 많은 편이다.
이런 의심은 결국 스스로 확보된 데이터와 휴리스틱하게 판단해야 하는 많은 외부 요인을 통찰력 있게 바라보고 숫자를 만들어 나가야 하는 부담으로 다가온다. 만들어낸 숫자를 보다 합리적으로 보일 수 있도록 해야 하는 것, 이 부분을 일반적이고 기초적인 통계학에서 찾아볼 수 있지 않을까 하는 기대로 이 책을 즐겁게 읽었던 것 같다.
만족스럽다. 여러가지 관점에서.
사람마다 다르겠지만 책을 읽는 즐거움 중의 하나는 어딘가에서 썰을 풀어낼 수 있는 백데이터(Backdata)를 제공받는 거라 생각한다. 이미 다들 알고 있는 내용도 당연히 있겠지만, 누군가 -나처럼- 처음 이야기를 듣는 사람들이 "오? 진짜?" 하는 반응을 보일 수 있는 아이템들을 이 책에서 꽤 많이 얻었다. 나이팅게일의 닭 볏 (우리말의 공식 용어인지는 모르겠다) 그래프가 대표적인 예이다.
중간에 짧게 소개되는 엑셀의 통계 관련 함수들 역시 무척 흥미로웠다. 엑셀이 만능의 도구라는 것은 익히 알고 있으며 (수혜자 중 한명이다) 근래에는 머신러닝에 써먹는 사람도 많다는 이야기를 들어오기도 했지만, 정규분포 함수와 같은 것들이 기본적으로 제공될거라는 생각은 전혀 해본적이 없었다. 액셀은 정말 데이터를 다루는데 있어서 파이썬 보다도 접근이 쉽고 유용하며 비용 효율적인 툴임을 다시 한 번 알게 되었다.
본 포스팅은 한빛미디어에서 제공한 "이렇게 쉬운 통계학" 책을 직접 읽고 작성했습니다.
제공 받은 책이지만 이건 정말 강추네요.
- NoPD -
728x90