본문 바로가기
DAta 이론

[데이터 분석 알아보기] 1-1. 데이터 전처리_사용자 행동 데이터 분석

by DAkimble 2024. 8. 6.

데이터 분석가가 가장 기본적으로 하는 일이 뭘까요?

 데이터 분석가는 물론 데이터를 다룹니다. 그런데 데이터는 '자체로는 의미 없는 객관적 사실'이라지만, 분석가들이 업무에서 마주치는 데이터는 대부분 어떤 움직임 혹은 '행동'의 기록들이예요. 그것이 앱 서비스 사용자의 기록이든 물류의 이동이나 습도의 변화이든 말이죠. 그래서 분석가들은 데이터에서 보이는 이 행동과 변화에 주의를 기울여야 해요.

 특히 이번에 저희 내배캠 팀이 공부한 아티클들에서는 현업에서 많이 쓰이는 앱 서비스 사용자 행동에 대한 데이터 분석법을 다뤘어요. 사용자 행동 데이터고객들이 서비스를 원활하게, 잘 쓰고 있는지를 가늠할 수 있는 대표적인 방법이죠. 그 분석을 통한 발 빠른 고객 요구사항 확인과 피드백이 중요하다고 하는데요, 그렇다면 고객들의 사용 패턴이 개발자와 분석가의 의도와 다르다면 어떻게 할까요? 혹은 분석 수치에서 어떤 오류가 발견된다면 어떻게 하죠? 아티클을 읽어보면서 같이 알아보도록 해요!

 

1. 현업에서 이용하는 데이터의 종류 

 1) 서비스 데이터

  • 회원가입, 결제, 제출 등 서비스 운영을 위해서 반드시 필요한 정보
  • 데이터 규모는 비교적 작지만 무결성을 요하여 주로 트랜잭션 데이터베이스에 저장. 서비스 오류 등 확인에 유용

※ 트랜잭션: 한꺼번에 수행되어야 할 연산을 모아놓은 작업의 단위. 한 트랜잭션에서 작업이 끊긴다면 오류가 발생한 것

 

 

  2) 사용자 행동 데이터 ★

  • 사용자들의 행동 패턴을 확인하기 위해 별도로 저장하는 데이터
  • ex) 앱 로그 데이터, 이벤트 데이터, 사용자 로그 데이터. 웹사이트 페이지뷰, 스크롤, 클릭 등으로 발생
  • 누락, 중복 집계되는 등 데이터 신뢰도가 비교적 낮음
  • 하지만 거대한 데이터 규모와 고객 행동 정보의 직접성으로 인해 본고에서 앞으로 다룰 서비스 피드백에 유용

 

2. 서비스 개발팀에서는 데이터로 무엇을 하는가?

 1) 기본적인 서비스 기획부터 개발, 출시, 마케팅

    이 과정에서도 잠재 이용자들의 데이터 수집, 활용 필요

 

 2) 출시 후의 고객 의견, 이용패턴 피드백

  • ‘사용자들이 이 기능을 우리 생각대로 잘 쓰는가?’, ‘기능 사용에 어려움을 느끼는 이유는?’, ‘무엇을 개선해야 기능을 더 잘 쓸까?'
  • 이러한 질문들을 통해 사용자가 서비스를 잘 이용하고 있는지 끊임없이 확인해야 한다. 

 

3. 사용자가 서비스를 잘 사용하는지 아는 방법

1) 사용자 직접 관찰

- 사용자의 섭외를 통한 직접적 관찰

- 장점: 니즈를 무의식적인 부분까지 명확히 파악할 수 있다 // 단점: 직접 섭외로 인한 많은 시간과 비용이 발생. 관찰자의 주관성 개입

2) 사용자 인터뷰

3) 사용자 행동 데이터 분석

-장점: 가장 적은 비용과 분석 시간의 자율성. 관찰자 주관성 개입 줄일 수 있음 // 단점: 결국 해석은 주관적이기 마련이다. 

 

4. 사용자 행동 데이터를 분석할 때 주의할 점

 

 

1) 사용자들의 의외성

  • 사용자들은 개발자가 만들어놓은 루트보다 지름길로 가기도, 샛길로 빠지기도 한다
  • 의외성에 놀라지 말고 산출된 행동 데이터 수용하여 사용자들의 편의성 향상을 목적으로 해야 한다.

Team insight: 사용자 의외성이 편의성 문제인지 오류나 수칙 위반의 문제인지도 살펴봐야 한다. 게임 유저가 버그를 악용한다면?

 

 

 2) 서비스 데이터 기록 방식 제대로 이해

  • 사용자들 외에 서비스의 데이터 기록 방식이 예상을 빗나가기도 한다
  • 예를 들어 회원가입 시 'sign up' 데이터가 저장되는 시점은 언제일까? 이메일 인증 완료 시점? 회원가입을 누른 시점? 후자라면 사실 회원가입이 완료되지 않았는데 발생한 데이터일 수 있다. 

Team insight: 이러한 면에서 데이터 분석가도 서비스 기획 등 타 부서와의 긴밀한 소통이 중요할 것이다.

 

 

 3) 서비스 이용 매체나 회사에 따른 차이

  • 서비스를 이용하는 매체나 회사마다 데이터 기록 방식의 차이가 생기기도 한다.
  • 위의 예에서 'sign up' 데이터 저장 시점이 애플 앱에서는 이메일 인증 완료, 안드로이드 앱에서는 회원가입을 누른 때일 수 있다.
  • 이에 따라 중복으로 데이터가 쌓이는 경우도 있으므로 데이터의 정합성, 즉 무모순성 확인이 중요(데이터가 잘못 중복되지 않았는가?)

 

 4) 데이터 조회 시 주의

  • 사용자 행동 데이터는 짧은 기간에도 매우 많은 데이터가 쌓인다
  • 따라서 데이터 베이스의 과부하 등 하드웨어적인 지점도 주의

 

인사이트: 정말 생각할게 많구나!!! 큰일났다

데이터 분석가는 계속해서 공부하고 트렌드와 최신 기술을 따라가야 하는 직업이라고 들었어요. 그런데 뿐만 아니라 업무에 있어서도 끊임없이 고객의 행동 양식을 파악하고 피드백하며 다른 팀과의 소통도 해나가야 한다는 점에서 결코 쉽지는 않겠네요.. 그래도 한편으론 역동적이라 재밌을 것 같은 생각도 들고요!

 

참고자료

사용자 행동 데이터 분석: ①사용자 행동 데이터 왜 필요할까요?

사용자 행동 데이터 분석: ③데이터를 분석할 때 주의할 점 4가지