웹로그분석은 자연스럽게 통계랑 연결됩니다. 어떻게 보면 웹로그를 분석하는 이유가 통계를 알기 위해서이니 당연할 수 있는데요. 이런 통계에서 왜곡을 줄이고 정확하게 사용하기 위해서는 데이터 세그먼트가 중요합니다. 쉽게 말하면 데이터 세그먼트는 간단하게 말하면 수집된 자료를 세분화 시키는 과정을 말하는데요.
세분화되지 않은 데이터는 전반적인 양을 파악하는데 도움이되지만 세부적인 곳에서는 많은 오류를 불러올 수 있습니다. 이런 데이터 통계의 오류를 가장 잘 보여주는 사례가 바로 "심슨 패러독스" 라는 사례인데요. 흔하게 알고 있는 그 심슨은 아닙니다.
심슨 패러독스의 주 내용은 다음과 같습니다.
아래와 같은 A병원과 B병원이 있다고 가정하고 암환자 1000명을 대상으로 생존률을 파악했습니다. 지표를 보면 B병원의 암치료를 더 잘하는 것으로 보인데요. 암이 걸리면 A병원보다는 B병원을 가야하겠네요.
하지만 같은 데이터를 한번 세그먼트 하겠습니다.
아래 데이터는 위암에 대한 생존률인데요. B병원이 압도적으로 높네요. 역시 B병원입니다!!
하지만 아래 대장암 생존률을 보니 어라?? A병원의 대장암 생존률이 더 높은 것으로 나타납니다.
대장암이 걸린 환자가 1번표를 보면 B병원으로 가야겠지만 만약에 통계 자료가 세분화된 2번표와 3번표를 봤다면 당연히 A병원으로 가야합니다. 이렇게 데이터는 어떻게 세분화해서 보느냐에 따라 전혀 다른 결과를 불러올 수 있습니다.
이런 이유로 웹로그분석을 통해 데이터를 만다는 경우 최대한 세그먼트를 통해 데이터를 세분화해 문제를 찾고 해겷하는 과정을 아주 중요합니다. 웹로그분석 도구로 GA를 사용하시는 분들은 구글 애널리틱스에 세그먼트 기능있다는 것을 알고 있으신데요. 생각보다 활용은 많이 안하시는거 같네요, 지금부터라도 한번 세그먼트 기능을 살펴보세요.
'로그분석(GA)' 카테고리의 다른 글
구글애널리틱스자격증 GAIQ 인증서 취득 독학하기 (0) | 2016.03.21 |
---|---|
구글 애널리틱스 인구통계 및 관심분야 신뢰도와 측정원리 (0) | 2016.03.03 |
광고효과 측정 직접 캠페인 설정(utm)하고 평가 할 수 있습니다. (0) | 2016.02.25 |