Tableau Desktop_데이터 집계방법과 세분화 하기

2024. 10. 15. 00:54Tableau

데이터 준비

오늘 사용할 데이터는 국가별 할인률과 판매수, 고객ID등이 담긴 판매매출 데이터이다.

 

 

데이터 집계 목표

지역별 매출과 할인율은 어떻게 다른지 데이터 시각화를 통해 살펴보기

먼저 매출과 할인율을 구하기위해 워크시트의 행과 열에 각각 매출과 할인율을 드래그앤 드롭으로 집계해준다.

이때 태블로는 디폴트로 합계를 보여주기때문에 할인율의 값을 평균으로 바꿔준다.

현재 데이터를 보면 평균할인율은 0.1497이고 매출은 3,566,521원으로 나타는데 알고자 하는 값은 지역별로 매출과 할인율의 차이점이기때문에 마크탭에 국가/지역탭을 걸어 데이터를 다시 집계해준다.

이렇게 마크탭에 국가/지역을 추가하면 국가와 지역별로 할인율과 매출을 볼 수 있는데, 이렇게 점으로만 표시되어있을때 국가/지역데이터를 다시 마크에 추가하여 레이블로 나타내주면 레이블이 표시되어 그래프를 값을 보다 구체적으로 볼 수 있다.

보다 구체적인 데이터 파악을 위해 인구 세그먼트의 정보까지 추가하여 국가/지역과 같은 방법으로 레이블까지 나타나도록 설정했고, 세그먼트와 국가/지역의 구분을 위해 국가/지역은 색상으로, 세그먼트는 도형으로 표시하도록 했다.

하지만 이  상태에서는 의미있는 데이터 시각화라고 할 수 없다. 할인율과 매출만 가지고는 적절하게 할인과 판매율이 발생한건지 알 수 없기때문에 여기서 주문건수를 확인하기위해 주문ID를 추가한다.

주문ID를 마크탭에 추가한 모습이다. 데이터가 이렇게 어지럽게 시각화 된 이유는 주문ID의 중복값까지 모든 정보가 그래프에 표시됐기때문이다. 하지만 우리가 알고싶은 값은 말그대로 주문건수이기 때문에 주문ID의 값을 고유값의 카운트로 바꿔주어야한다.

데이터 시각화 대시보드의 최종결과를 확인해보면 매출이 가장 높은 국가는 오스트레일리아로 주문건수 743건에 매출이 약 500만원이었으며, 할인율이 가장 높았던 나라는 몽골로 주문건수는 1건이다. 이처럼 데이터를 무작정 시각화로 만드는 것보다 어떤 데이터가 보고싶은지, 시각화로 어떤 데이터의 결과물을 보여주고싶은지 등을 고려하여 집계햐여야한다. 만약 할인율과 매출의 상관관계 분석을 위해 국가/지역별 매출에따른 할인율을 보고자했을때 몽골의 할인율이 가장 높았으니 매출이 많이 일어났을것이라고 생각했다면 사실상 주문건수는 1건이라 할인이 크게 영향을 주지 못했다는것을 알 수 있다. 이처럼 여러가지의 가설과 확인하고자 하는 데이터의 조합을 잘 이용하여 데이터를 집계해야한다.

 


학습일기

오늘은 태블로 프렙이 아니라 태블로데스크탑을 사용해보았다. 태블로 프렙과 태블로 데스크탑둘다 사용해보니, 확실히 태블로 프렙은 데이터를 전처리하는 작업에 더 적합하고, 태블로 데스크탑은 프렙으로 전처리한 데이터를 태블로 데스크탑에서 시각화하여 인사이트를 얻는데 더 적합하다고 느꼈다. 태브로 데스크탑은 정말진짜 확실히 편하다..! 태블로 프렙과 태블로 데스크탑 둘다 너무 재밌고 신세계다...이렇게 데이터 시각화를 할 수 있다니..대용량 데이터 처리하면 진짜 재밌을것 같다...