Tableau Desktop_데이터 계층(자동계층과 사용자 지정계층)

2024. 10. 15. 13:14Tableau

계층

태블로에서는 계층이라는 개념이있다. 계층이란 데이터 필드를 그룹화하여 세분화 하는 작업을 말한다. 데이터가 날짜와 같이 연속적인 값을 가지고있다면 태블로에서 자동으로 자동계층이라는것을 생성해주고, 문자형이나 범주로 구분되는 불연속적인 데이터라면 사용자 지정계층을 통해 데이터를 계층화 할 수 있다.

 

 

데이터 준비

오늘 사용할 데이터는 super store라는 테이블로, 구체적인 제품판매에 관한 데이터가 수집된 테이블이다. 오늘 계층을 통해서 날짜별 매출과 제품 및 제조업처에 따른 매출합계를 알아보도록 하자.

 

자동계층

날짜별 매출합계를 확인하기위해 열에 매출값을, 행에 날짜데이터를 삽입했다. 현재 년도별로 매출합계가 표시된 데이터이다. 만약 여기서 분기나, 월별로 매출을 확인하고싶다면 자동계층을 사용하면 된다.

 

자동계층사용법은 계층화 하고싶은 필드 왼쪽부분의 +버튼을 눌러 원하는 계층을 선택하면 된다. 이렇게 해당 년도의 분기별 데이터를 확인할 수도 있고

한번더 하위계층으로 옮겨가면 년도의 분기에서에서 월까지 데이터가 세분화 되어 계층화된것을 확인할 수 있다.

 

연속적데이터와 불연속적 데이터

지금까지 수집된 데이터를 년도와 월로 확인하고싶어, 월의 계층만 남기고 상위계층을 지운상황이다. 이 그래프는 보기에는 문제가 없어보이지만, 해당 년도의 월별매출이 아니라 날짜로 기록되어있는 년도의 모든 1월매출의 합산, 2월매출의 합산으로 표시된 결과이다.  이런 문제는 날짜데이터가 연속적인 날짜데이터가 아니라 1월, 2월처럼 하나의 범주값으로 구분되기때문인데, 이런 문제를 해결하기 위해서는 1월부터 2월까지의 개념을 가지는 연속적인 데이터로 변경해주어야한다.

먼저, 시트에서 데이터 필드를 제거한 후, 연속형데이터로 변환한 뒤에 다시 계층으로 로드하면 된다.

연속형으로 바꾸면 필드역시 숫자형태를 의미하는 초록색의 형태를 띄게되며, 다시 계층을 월까지의 하위범주로 로드해주면 원하는 형태의 그래프를 확인할 수 있다.

 

 

사용자 지정계층

사용자 지정계층을 만드는 방법은 계층화를 원햐는 두 데이터를 합쳐주고 계층의 이름을 입력하면된다. 합쳐줄 데이터는 하위범주와 범주 데이터인데, 범주 중에서 사무용품이면서 용지인것, 사무영품이면서 레이블인것 이렇게 그룹으로 묶여 계층화가 진행된다고 보면 된다. 

그러면 이렇게 범주안에서도 하위범주의 제품군들끼리 그룹으로 묶여, 범주안에서의 매출합계를 한눈에 살펴볼 수 있다.

 

 

계층 정렬

현재 데이터의 범주 안에서 매출이 높은 순서대로 정렬하고싶다면 정렬하고싶은 값에서  정렬 필드를 합계로 바꿔주면

이렇게 범주,그리고 하위범주안에서 매출이 정렬되어 훨씬 보기좋은 데이터 시각확 대시보드가 된것을 확인할 수 있다.

여기서 제조업체필드를 하나더 추가하여, 범주, 하위범주안에서도 제조업체중에서 판매량이 가장 많았던 즉, 매출이 가장 높았던 제조업체 별로 그래프를 만들어보도록 하겠다.

 

하지만 필드의 정렬을 합계로 다시 설정해도 판매량이 높은 순서대로 정렬되지않는다. 그 이유는 태블로 자제에서 범주, 하위범주, 제조업체이렇게 한꺼번에 데이터를 인식하는것이 아니라, 제조업체 자체만을 인식하기때문에 제조업 자체에서 판매량이 가장 높은 safco업체가 가장 첫번째로 정렬되는 것이다. 이걸 범주화로 묶어 정렬하고 싶다면

일반 필드가 아니라 중첩을 사용하여야 한다.

그럼 이렇게 범주, 하위범주, 제조업체까지 모두 하나로 인식되어 그 안에서 매출이 높은 순서대로 정렬된것을 확인할 수 있다.

 


학습일기

오늘은 태블로 데스크탑에서 자동계층과 사용자 지정계층에 대해 학습했다. 쿼리문에서 계층을 하려면 복잡하진 않더라도 나름 긴 쿼리를 써야하는데 태블로에서는 드래그앤드롭과 몇번의 설정만으로 계층화 하여 데이터를 볼 수 있다는것이 신기했고, 편리했다.

사용자 지정계층이 특히 더 신기했는데, 같은 데이터라도 사용자 지정계층을 했을때와 하지 않았을때에 얻을 수 있는 인사이트가 달라보였기때문이다. 게다가 위에서 학습한 것처럼 종류별로 판매하는 제품군이 많은 기업이나, 공장에서 재고관리를 할때 처럼 범주값과 하위범주값이 많은 데이터에 이용하면 좋을것 같다고 생각했다. 이것저것 데이터를 조합해보면서 사용자 지정계층에대해 빨리 익혀두면 좋을것 같다..!