과거에 데이터 분석과 앞으로 나아가야 할 데이터 분석에 대한 책이다.
제목에서 보듯 분석을 하는 목적은 예측을 하는 것이다.
예측을 하는 소스는 과거 우리가 쉽게 접할수 있는 수치통계자료와 같은 정형적 자료들이 대부분이었지만 이제는 비정형 데이터인 텍스트도 예측분석을 하는데 유용한 자원으로 활용해 나가고 있는 것이다.
책에 보면 이런표현이 있는데 지구에 있는 물이 데이터라고 한다면 그중에 80%정도를 차지하는 바다가 텍스트라고 한다.
비정형 데이터를 측정하는 방법으로 다양한 사례들을 설명해 주는데 요약을 하자면 데이터가 있고 이런데이터를 수집하여 어떤방법으로 분류를 하고 점수화하여 나타난 수치를 통해 효과정인 정보를 분석하는 것이다. 책에서는 이러한 모델들을 만들어 다양하게 빅데이터를 분석하는 사례가 나온다.
다섯가지 예측의 효과로 예측효과, 데이터효과, 귀납효과, 앙상블효과, 설득효과에 대한 내용이 나오고 예측분석 응용 사례가 분야별로 정리되어 나온다.
특히 기계학습 부분을 강조를 많이 하는 것 같은데 많이 쓰이긴 하나보다.
댓글