Tableau Desktop_데이터 구간차원(bin) 생성하기

2024. 10. 15. 15:54Tableau

구간차원

데이터를 일정한 구간(bin)으로 나눠 분석하는 방법으로 구간차원에 사용하는 데이터는 불연속적인 범주형 데이터로 바꿔주어야한다.

 

 

데이터 준비

오늘 구간차원에서 사용할 데이터는 태블로의 super store데이터이고, 주문건수 1건당 판매되는 제품수량의 분포를 알아볼 예정이다.

 

 

구간차원 만들기

먼저, 수량의 개수를 구해야하는데 수량이 연속적인 데이터값이기때문에 이를 범주형데이터인 구간차원으로 나눠주어야한다.

만들기 탭에서 구간차원을 클릭해준다.

그럼 구간차원을 설정할 수 있는 창이나오는데, 태블로에서 디폴트로 계산된 구간차원크기인 1.77이 디폴트 값으로 적혀있겠지만, 현재 수량을 1건으로 계산하여야하기때문에 구간차원의 크기를 1로 맞춰준다. 현재 최소값이 1이고 최대값이 14인데 고유카운트가 14개인것으로보아 1에서 14까지 한건도 빠짐없이 전부 고유값으로 있다는 것을 알 수있다. 구간차원 편집이 끝난 후  확인을 눌러주면 수량(구간차원)의 불연속적인 범주값 필드가 새롭게 생긴것을 확인할 수 있다.

 

새롭게 생성한 구간차원의 수량값을 열값에 두고 주문건수를 계산하기 위해 카운트 고유로 주문ID필드를 행에 두어 그래프를 만들어주었다. 

 

레이블 추가하기

그래프 시각화의 목적에 맞춰 개수의 분포파악을 위해 카운트 고유로 주문ID필드를 레이블로 변경하여 추가했다.

현재 데이터에서는 주문 1건당 제품2개를 주문하는 경우가 가장 많았고, 13개를 주문하는 경우가 가장 적은것을 알 수 있다.

 

구간비율 구하기

이렇게 분포를 파악하는 경우에는 전체구간에서 특징되는 값들의 비율을 함께 게시하는 것이 좋다. 현재 테이블에서는 2건이 가장 많기때문에 2건이 전체 주문건수가 100이라면 차지하는 비율의 값을 구하기 위해서는 구성비율값을 구해주면된다. 먼저 마크에 주문ID값을 카운트고유값으로 바꿔준 후, 퀵테이블 계산 탭에서 구성비율을 선택해준다.

 

그 후 카운트 고유값인 주문ID값인 필드를 레이블로 바꿔주면 각각의 데이터들이 전체비율에서 몇퍼센트를 차지하고있는지가 한눈에 보인다.

 

한눈에 그래프가 더 직관적으로 확들어왔으면 좋겠어서 같은 방법으로 주문ID값을 다시 마크에 추가하고 색상으로 바꿔주었다!