전체 글(72)
-
Tableau Desktop_히스토그램을 활용하여 날짜별 배송소요시간 분포도 파악하기
데이터 시각화 목표날짜별 배송 소요시간 분포도를 파악하여, 자사의 평균 배송시간 파악하기 사용데이터_출처(Tableau)Super store 배송 소요시간 필드 만들기_(계산된 필드) 현재 데이터에서는 배송 소요시간을 기록한 필드가 없기때문에 계산된 필드를 이용하여 일자(day)를 기준으로 주문 날짜에서 배송 날짜의 값을 빼주었다. 구간차원 만들기 그 다음 계산된 필드로 만들어진 배송 소요시간의 필드를 구간차원으로 만들어주었다. 1일 기준으로 값이 나뉘어져야하기때문에 차원의 크기를 1로 설정했다. 데이터 시각화 하기구간차원으로 만든 값을 열에 추가하고 그에 따른 주문건수를 파악하기 위해 주문ID필드를 카운트고유값으로 변경한 후 행의 열에 추가했다. 그래프 에서 4시간인 배송건수가 가장 많았다는것을 ..
2024.10.15 -
Tableau Desktop_데이터 구간차원(bin) 생성하기
구간차원데이터를 일정한 구간(bin)으로 나눠 분석하는 방법으로 구간차원에 사용하는 데이터는 불연속적인 범주형 데이터로 바꿔주어야한다. 데이터 준비오늘 구간차원에서 사용할 데이터는 태블로의 super store데이터이고, 주문건수 1건당 판매되는 제품수량의 분포를 알아볼 예정이다. 구간차원 만들기먼저, 수량의 개수를 구해야하는데 수량이 연속적인 데이터값이기때문에 이를 범주형데이터인 구간차원으로 나눠주어야한다.만들기 탭에서 구간차원을 클릭해준다.그럼 구간차원을 설정할 수 있는 창이나오는데, 태블로에서 디폴트로 계산된 구간차원크기인 1.77이 디폴트 값으로 적혀있겠지만, 현재 수량을 1건으로 계산하여야하기때문에 구간차원의 크기를 1로 맞춰준다. 현재 최소값이 1이고 최대값이 14인데 고유카운트가 14개인..
2024.10.15 -
Tableau Desktop_데이터 필터로 추출하기
필터태블로에서 필터 기능을 사용하면 원하는 데이터만 추출하여 시각화 할 수 있다. 필터의 종류일반와일드카드조건상위 데이터 준비오늘 필터에서 사용할 데이터는 국가/지역별 판매데이터를 수집한 super store이다. 해당 데이터를 지도그래프로 시각화하였고, 주문ID를 고유카운트하여 마크로 표시해, 주문이 가장 많은 국가 상위10개를 추출해볼 예정이다. 필터 사용하기필터를 사용하려면, 필터를 하고싶은 필드를 필터탭에 놓아주면 된다. 일반 필터일반필터는 내가 직접 목록에서 추가하거나 제외할 필드를 선택하여 직접 필터를 거는 것을 말한다. 전체를 누르면 필드의 전체가 체크되고, 없음을 클릭하면 전체 체크된걸 없앨 수 있다. 와일드카드와일드 카드는 문자형 데이터를 필터링할 때 특정 패턴이나 규칙에 맞는 항목만..
2024.10.15 -
Tableau Desktop_데이터 계층(자동계층과 사용자 지정계층)
계층태블로에서는 계층이라는 개념이있다. 계층이란 데이터 필드를 그룹화하여 세분화 하는 작업을 말한다. 데이터가 날짜와 같이 연속적인 값을 가지고있다면 태블로에서 자동으로 자동계층이라는것을 생성해주고, 문자형이나 범주로 구분되는 불연속적인 데이터라면 사용자 지정계층을 통해 데이터를 계층화 할 수 있다. 데이터 준비오늘 사용할 데이터는 super store라는 테이블로, 구체적인 제품판매에 관한 데이터가 수집된 테이블이다. 오늘 계층을 통해서 날짜별 매출과 제품 및 제조업처에 따른 매출합계를 알아보도록 하자. 자동계층날짜별 매출합계를 확인하기위해 열에 매출값을, 행에 날짜데이터를 삽입했다. 현재 년도별로 매출합계가 표시된 데이터이다. 만약 여기서 분기나, 월별로 매출을 확인하고싶다면 자동계층을 사용하면 된..
2024.10.15 -
Tableau Desktop_데이터 집계방법과 세분화 하기
데이터 준비오늘 사용할 데이터는 국가별 할인률과 판매수, 고객ID등이 담긴 판매매출 데이터이다. 데이터 집계 목표지역별 매출과 할인율은 어떻게 다른지 데이터 시각화를 통해 살펴보기먼저 매출과 할인율을 구하기위해 워크시트의 행과 열에 각각 매출과 할인율을 드래그앤 드롭으로 집계해준다.이때 태블로는 디폴트로 합계를 보여주기때문에 할인율의 값을 평균으로 바꿔준다.현재 데이터를 보면 평균할인율은 0.1497이고 매출은 3,566,521원으로 나타는데 알고자 하는 값은 지역별로 매출과 할인율의 차이점이기때문에 마크탭에 국가/지역탭을 걸어 데이터를 다시 집계해준다.이렇게 마크탭에 국가/지역을 추가하면 국가와 지역별로 할인율과 매출을 볼 수 있는데, 이렇게 점으로만 표시되어있을때 국가/지역데이터를 다시 마크에 추가..
2024.10.15 -
Tableau Prep_공공데이터로 서울시 상권데이터 전처리하기
데이터 전처리 목표서울시 상권데이터와 인구수에 관련된 데이터를 수집 후, 상권의 직장인과 생활인구를 행정동 단위로 파악하기 사용데이터_출처(서울시 공공데이터포털)서울 행정동 정보.csv상권분석_직장인구.csv상권분석_생활인구.csv상권분석_상권영역.csv 데이터 소개상권분석_직장인구첫번째 데이터 상권분석_직장인구데이터는 총 28개의 필드로 구성된 데이터이며, 10~60대까지의 연령대별 인구수, 10~60대별 성별인구수, 날짜, 상권코드, 상권코드명, 그리고 총 직장인구수를 기록한 데이티이다. 행정동 정보행정동 정보 데이터는 총 2개의 필드로 구성된 데이터이며, 각 행정동의 코드와 행정동명을 기록한 데이터이다. 상권분석_상권영역상권분석_상권영역 데이터는 총11개의 필드로 구성되어있으며, 날짜, 상권코드, ..
2024.10.14