웹 로그 분석 데이터의 사용과 이해


* 데이터가 보고서에 나타나기 전 어떻게 수집되고 처리되는지 알기


구글 애널리틱스의 작동과정의 4가지 요소


1. 데이터 수집  2. 구성  3. 데이터 처리  4. 보고



1. 애널리틱스를 통해 웹사이트, 모바일 앱, 디지털 연결 환경, POS 데이터 수집 가능


<추적 기본 사항> 웹사이트 추적하면서 소량의 자바스크립트 코드를 이용해 정보를 수집한다. 이 때 웹사이트에는 코드가 삽입되어야 한다. 


웹사이트 정보(URL), 언어, 브라우저 이름, 기기, 운영체제 정보 수집, 추천 소스로 데이터를 수집하낟.


-> 이러한 정보 패키지 하나를 '조회' 또는 '상호작용'이라 한다.



- 모바일 앱 추적에서는 데이터 수집을 위해 자바스크립트 코드가 아닌 다른 방법을 사용한다. 이 또한 기기 운영체재마다 다르다. 각 '페이지뷰'에서 데이터 자동 포착 대신 모바일 앱 추적에서는 '활동'이 발생한 후 데이터를 수집한다


따라서 추적하려는 '활동'별로 별도의 코드를 추가해야 한다.



- 모바일은 인터넷에 늘 연결되어있는 상태가 아니기 때문에 실시간으로 수집서버에 전송되지 않을 수 있다.


- 웹 추적 : 애널리틱스 태그가 추가된 페이지를 사용자가 조회할 때마다 '조회' 전송된다.



3. 처리 : 원시데이터를 유용한 데이터로 바꾸는 전환 과정 


<예> 기기를 모바일, 비모바일로 분류, 데이터에 필터를 적용한다. - 보고서에서 특정 유형의 데이터를 포함 또는 제외시키는 역할을 한다. / 내부 사용자 데이터는 제외




* 데이터 유형의 종류 


- 2가지 측정 항목 : 표로 표시, 첫번째열은 측정 기준, 나머지열은 측정 항목이 표기된다.


1. 측정 기준 : 사용자, 세션, 액션의 특징을 나타내는 데이터


2. 측정 항목 : 이런 기준들을 숫자 값으로 나타낸 것



- 측정 기준 : 지리적 위치, 트래픽 소스, 사용자 액션 '페이지 이름'


- 측정 항목을 보면 사용자의 행동 파악에 도움이 된다. 웹사이트, 앱, 앱 총사용자 수 등 특정사항의 발생빈도를 집계한다. 또는 평균값 집계 -> 참여도 측정 시 사용


- 뉴스레터 가입 건수, 구매수, 방문자수, 사용자수, -> 페이지 방문 순 사용자 / 잠재고객 전체규모 파악할 시 사용



- 웹사이트 방문자는 신규 사용자와 재방문 사용자로 나눈다.


- 세션 : 동일 사용자의 연속적 활동시간 나타난다. 설정 가능하나 보통 세션 만료시간은 30분이다.


- 세션 만료시간 설정하는 것이 중요한 이유 : 덱스트 기반 사이트와 스트리밍 동영상  사이트에서 사용자의 행동이 다르기 때문



- 웹사이트

'페이지뷰수' : 방문 또는 세션 1회 이상의 상호작용에 참여 / 동영상 작용 : 이벤트


- 방문자의 세션이 '활성' 상태를 유지하려면 페이지뷰, 이벤트 상태여야 한다.


- 사용자 활동의 스트리밍 조회에 기반해 집계

<예>'방문시간' : 사용자의 첫 번째 상호작용시간(페이지 조회, 이벤트)을 마지막 상호작용 시간에서 뺀다.


      '페이지에 머문 시간' : 특정 페이지에 머문 시간을 다음 페이지뷰 시간에서 뺀다.


- 이탈률 : 사용자 상호작용이 1회 뿐인 세션의 비율


-> 이탈률이 높다는 것은 방문자가 기대하는 정보를 사이트에서 제공하지 못한 다는 의미가 될 수 있다.  





'book mark' 카테고리의 다른 글

흑과 다의 환상  (0) 2016.12.21
북마크는 아니고 즐겨찾기  (0) 2016.12.06
구글 애널리틱스 공부 1  (0) 2016.11.21
원예반 소년들  (0) 2016.10.19
목요조곡  (0) 2016.10.18