태블로_Tableau Prep 데이터 로드 및 필드 확인과 데이터 조인

2024. 10. 12. 20:03Tableau

data join

태블로에서는 각각의 테이블의 데이터를 조인할 수 있다. 태블로에서 가능한 조인의 종류는 다음과 같다.

 

join의 종류

  • inner join
  • leftouter join
  • rightouter join
  • full outer join

 

데이터 로드 및 필드 확인

 

먼저 사용할 데이터 테이블을 준비해주고 시작하자. 오늘 사용할 데이터는 책의 정보가 담긴 book데이터에서 책의 정보 자체가 담긴 book과 책의 수상정보인 Award테이블을 사용할 예정이다. 엑셀파일을 로드할경우, 시트와 테이블이 함께 전부 로드된다. 여기서 드래그로 사용할 테이블을 끌어다 창에 놓아주면

홈에 테이블이름과 함께 그 테이블의 정보를 확인할 수 있다. 현재 book테이블안에 3개의 열이 있는것을 확인할 수 있다.

여기서 조인을 하기위해 하나의 테이블을 하나더 로드해보자.

이번에는 Award테이블을 로드했더니 두개의 테이블이 홈에 등장했고, 마찬가지로 Award테이블의 행 정보도 확인할 수 있었다.

 

 

정리단계

간단하게 행의 정보뿐만아니라 조금더 구체적인 테이블의 정보를 확인하고 싶다면 

구체적으로 확인하고 싶은 테이블의 +버튼을 누른후 정리단계를 클릭하면 보다 구체적인 테이블정보를 확인할 수 있다. 현재 Award테이블은 3개의 필드를 가지고있으며 18개의 행을 가지고있는데 잘보면 첫번째 Title에는 17개만 있다고 쓰여있다. 필드명옆에 나타나는 숫자는 고유값이므로 이는 이 필드에 중복값이 있다는 의미이다. 

 

 

 

inner join

테이블을 조인하는 방법으로는 조인하고싶은 테이블을 드래그로 가져다대면 유니온을 할것인지 조인을 할것인지에 대한 창이 두개가 등장하는데 조인을 선택하여 드롭해주면 된다.

그럼 이렇게 두 테이블이 조인된 결과를 볼 수 있다. 조인을 했을때는 inner조인이 디폴트이기때문에 조인을 하면 바로 inner조인으로 조인되며, 밑에 조인유형의 벤다이어그램 그래프를 클릭하여 조인 유형을 바꿀 수 있다. inner조인의 결과는 조인결과요약 탭에서 볼 수 있는데 book에서 17개, Award에서 18개가 조인되었으며, 총 조인결과는 18개의 데이터가 조인되었다는것을 알려준다. inner조인이기 때문에 일치하는 값만 조인되는데 book의 데이터값이 하나가 더 적은데도 전부 조인 되었고 개수도 18개라는 것으로 보아, book에서 상을 두번 중복으로 수상한 책이 있다는 것을 알 수 있다. 

 

rightouter join

 

rightouter 조인의 결과이다. 테이블기준 오른쪽에 있는 테이블의 데이터는 전부 출력되고 왼쪽에 있는 테이블은 오른쪽의 테이블과 일치하는 값만 출력된다. 현재 오른쪽에 있는 book테이블의 결과는 전부 출력되기때문에 58개의 행이 전부 출력된것을 확인할 수 있다. 

 

 

left outer join

left outer 조인의 결과이다. rightouter 조인과 다르게 왼쪽에 있는 데이터는 전부 출력되고 오른쪽에있는 데이터는 조인된는 값만 출력되기때문에 테이블기준으로 왼쪽에 위치한 Award의 행이 전부 출력된것을 알 수있다.

 

 

full outer join

 

fullouter조인의 결과이다. fullouter 조인은 inner join, rightouter join, leftouter join의 결과가 모두 출력이 되는 조인이다. 사실상 지금이 데이터에서의 fullouter조인은 rightouter 조인의 결과와 동일한데, 그 이유는 Award에 기록된 상을 book에 있는 데이터들이 전부 수상했기때문에 Award행은 계속해서 전부 출력이 되는 것이다. 

 

fullouter조인의 결과로 중복조인된 결과값이 뭔지 확인해보았다. 조인의 결과대로 같은 책이 다른 상을 두번 수상한 것을 확인할 수 있었다.

 


 

학습일기

와..드디어 태블로 강의실습을 수강한 첫날..!! 진짜 너무 재밌었다..ㅋㅋㅋㅋ 사실 join내용은 sql과 거의 동일하기때문에 너무 익숙한 내용이여서 더 재미있었는지..ㅎㅎ 계속 배우고싶었던 시각화 파트여서 그런지 수업 듣는 내내 와 와..! 연발했던 하루였던것 같다. 그리고 태블로의 가장 큰 장점인 노코딩으로도 쉽게 데이터를 전처리하고 조작할 수 있다는걸 정말 많이 느꼈다. 그저 드래그앤 드롭으로만 데이터테이블을 조작할 수 있다니...ㅠ 진짜 열심히 공부해서 시각화 대시보드를 만들고싶다...!