본문 바로가기
DAta 이론

[데이터 분석 알아보기] 2-1. 데이터 시각화는 무엇이고 왜 필요할까?

by DAkimble 2024. 8. 15.

 

데이터 시각화는 데이터 분석가 업무의 꽃입니다

 

  저는 데이터 분석가가 하는 일을 크게 '의사소통, 데이터 작업 및 분석, 데이터 시각화'라고 이해하고 있어요. 여기서 의사소통이 회사 동료들과 만나 해결할 문제를 식별하고 결과로서 인사이트를 전달하는 업무의 시작과 끝이고 데이터 작업이 데이터를 수집, 정리, 의미화하는 과정이라면 데이터 시각화는 마지막 의사소통을 위해 분석결과와 인사이트를 차트, 그래프, 대화형 대시보드 등의 방식으로 담아내는 일이죠. 데이터 작업과 분석이 팀원들은 볼 수 없는, 분석가 혼자만의 지난한 과정이라면 시각화는 (여전히 작업 자체는 거의 혼자하겠지만..)비로소 결과를 발표하며 업무의 결과를 드러내려는 작업이예요. 백조로 비유하면 분석작업이 호수 아래의 쉼없는 발길질이라면 시각화는 고고해보이는 겉모습이라고 할 수 있죠! 이번 글에서는 앞으로 데이터 시각화를 본격적으로 배우기에 앞서서 시각화가 정확히 무엇이고 분석가가 왜 해야하는지 알아보도록 하겠습니다.

 


 

 

1. 데이터 시각화란?

 

데이터 시각화란 데이터에서 도출한 정보를 그래픽 형태로 표현해서 시각적으로 이해할 수 있도록 표현하는 작업이예요. 이를 통해 데이터 분석가는 작업 과정에서 데이터를 더 쉽게 이해하고 인사이트를 발견할 수 있고 이를 발표해서 팀원과 나누는데 이용할 수도 있죠.

 

 

2. 우리 주변에서 흔한 시각화의 예

 

매핑(mapping)

  간략히 말하면 어떤 값을 다른 값에 대응시키는 과정이예요. 예를 들어 지도앱에서는 교통 정보를 각종 시각요소로 대응하죠. 노선 정보에서 1, 2호선 등을 색깔로 구분하고 총 소요 시간이 짧은 경로부터 차례대로 추천되는 식으로 말이예요. 이를 통해서 분석가는 짧은 시간과 작은 화면에서도 정보를 효율적으로 전달할 수 있습니다. 지도앱 외에도 태풍의 예상경로나 코로나 확진자 현황, 선거 결과 차트 등등 여러가지 매핑이 있어요

 

 

3. 시각화는 왜 필요할까? 

 

1) 감각의 한계와 효율성

인간의 감각은 시간당 처리할 수 있는 정보의 양에 한계가 있죠. 그런데 시감각에서 그래픽은 텍스트에 비해 60,000배나 빠르게 처리된다고 해요. 따라서 트위터 같은 매체에서도 이미지가 훨씬 더 선호되는 경향이 있습니다.

 

2) 수많은 정보 속 인사이트를 직관적으로 전달

예를 들어서 직업, 연령별로 사람들이 하루 종일 하는 행동들에서 어떤 행동을 얼마나 할애하는지를 전달한다고 생각해보세요. 그걸 표로 전달한다면 적어도 평균, 중간값, 표준편차 같은 통계학적 지식이 필요할 겁니다. 하지만 그 정보를 그래프로 전달 숨겨진 인사이트를 훨씬 쉽게 전달할 수 있겠죠. 

 

03 결론: 의사 결정에 도움을 준다

  시각화는 무엇보다 대규모의 데이터 속에서 큰 그림을 파악하는데 도움을 줍니다. 이를테면 직업, 연령별 행동양식에 관한 정보가 있다면 엄청난 양이라 쉽게 의미를 발견하기 어렵겠지만 시각화 자료로 전달한다면 분석가의 의도를 쉽게 전할 수 있어요. 10대 학생들이 학교가 끝나고 부모님이 집에 없어 특별히 할 일이 없는 시간이 많으니 여러가지 방과후 활동을 제공해야 한다는 식으로 말이죠.

 

→ 하지만 어떤 큰 그림을 전달한다 해도 디테일을 이해하는 일은 결코 쉽지 않은 경우가 있고, 그렇다고 분석가가 의도적으로 정보의 방향을 정해 시각화를 한다면 여러가지 부작용을 낳을 수 있어요. 예를 들어 학생들은 나름대로 학교가 끝나고 친구들끼리 즐거운 시간을 보내고 그러면서 사교성이나 창의성을 기르고 있을 수도 있거든요. 억지로 방과후 활동을 시켜서 불만만 많아질 수도 있는거죠! 따라서 분석가는 자신만의 인사이트를 시각화에 잘 담아내면서도 데이터의 해석의 여지를 남겨 여러 사람들과 의견과 관점을 나눌 수 있어야 합니다.