분류 전체보기(72)
-
Tableau Prep_데이터 출력 방법과 옵션 종류
데이터 출력하기원하는데이터 전처리 작업이 끝났다면, 전처리된 데이터를 파일 형태로 출력해주어야한다. 출력하기 위해서는 최종 데이터 흐름에서 +버튼을 눌러 출력을 클릭한다.출력을 누르면 이렇게 전처리나 내가 원하는대로 구조를 변경한 데이터를 파일의 형식으로 출력할 수 있는 환경이 셋팅된다. 데이터를 출력할 환경셋팅이 전부 끝났다면, 데이터를 출력할 형태를 정해주어야하는데, 파일은 다르지만 형식은 대부분 비슷하다. 파일은 말그대로 데이터를 파일의 형태로 출력하겠다는 의미이고 게시된 데이터원본은 데이터소스로 출력을 의미하고 데이터 베이스 및 클라우드 저장소는 DB로 출력하겠다는 의미이다. 이렇게 본인이 원하는 파일 형태를 지정해준다. 그 다음에는 출력유형을 선택하면되는데 여기서는 엑셀파일로 데이터를 추출할 ..
2024.10.13 -
Tableau Prep_데이터 집계 및 조인까지
데이터 집계데이터집계는 데이터포인트를 결합하여 하나의 값을 생성하는 프로세스로, 데이터를 집계할때사용할 수 있는 함수들은 다른 언어들과 비슷한 sum,count,average, group,max,min등이 있다. 데이터 준비태블로에서 집계작업에 사용할 데이터를 로드해준다. 오늘 사용할 데이터는 지역별, 년도별 할당량이 저장되어있는 Quota테이블과고객ID, 판매량 등, 주문에 대한 정보가 구체적으로 담겨있는 Oders데이터를 사용할 예정이다. 오늘 이 두데이터를 가지고 공통적으로 존재하는 년도와 지역을 그룹화한 후, 조인하여 년도, 국가별 전체 판매량과 그에대한 고객수를 한 테이블로 정리하여 추출할 예정이다. 데이터 설명Quota첫번째 Quota테이블먼저 정리단계로 살표보면 년도가 행으로 되어있는게 아니..
2024.10.13 -
Tableau Prep_Data Pivoting(rows to columns, columns to rows)
Data Pivoting태블로에서는 데이터의 구조를 바꿔주는 피봇팅을 할 수 있다. 그 종류는 다음과 같다. rows to columns(pivot)긴 형태 → 넓은 형태하나의 열의 고유 값들을 새로운 열 헤더로 전환columns to rows넓은 형태 → 긴 형태여러열을 취해서 두 개의 열, 보통 '키'와 '값'으로 재구조화 Pivoting 환경 셋팅사용할 데이터먼저 로드해준다. 오늘 사용할 테이블은 Quota라는 지역별 년도별 득표수를 표기한 데이터를 사용할 예정이다. 로드해준 원본테이블의 +버튼을 눌러 피벗을 선택한다.그럼 이렇게 피벗을 진행할 수 있는 환경이 셋팅된다. unpivot지금은 unpivot을 진행할 예정이기때문에 열을 행으로를 클릭해준다. (영어버전인 경우 column to r..
2024.10.12 -
태블로_Tableau Prep 데이터 로드 및 필드 확인과 데이터 조인
data join태블로에서는 각각의 테이블의 데이터를 조인할 수 있다. 태블로에서 가능한 조인의 종류는 다음과 같다. join의 종류inner joinleftouter joinrightouter joinfull outer join 데이터 로드 및 필드 확인 먼저 사용할 데이터 테이블을 준비해주고 시작하자. 오늘 사용할 데이터는 책의 정보가 담긴 book데이터에서 책의 정보 자체가 담긴 book과 책의 수상정보인 Award테이블을 사용할 예정이다. 엑셀파일을 로드할경우, 시트와 테이블이 함께 전부 로드된다. 여기서 드래그로 사용할 테이블을 끌어다 창에 놓아주면홈에 테이블이름과 함께 그 테이블의 정보를 확인할 수 있다. 현재 book테이블안에 3개의 열이 있는것을 확인할 수 있다.여기서 조인을 하기위해 하나..
2024.10.12 -
R복습_회귀분석 코드연구 (1차 단순회귀분석, 다중회귀분석, 로지스틱 회귀분석)
단순회귀분석 코드연구단순 회귀분석 코드연구 1예측 모델링 설계목적 : diamonds데이터에서 가격별 무게의 상관관계를 알아보고 가격의 변동에 따른 무게예측하기사용 데이터 : diamonds(r내장데이터)#데이터 셋 로드diamonds#상관관계분석cor.test(diamonds$price,diamonds$carat)#p-value = 회귀분석 코드연구 1 다이아몬드 데이터의 무게와 가격의 상관관계를단하 분석한 결과이다. p-value가 내장그래프인 plot을 사용하여 상관성을 확인하였을때도 어느정도 한 방향으로 관측점들이 분포하고있어, 상관성이 있다고 판단되었다. #기울기, 절편 구하기modellm함수를 이용하여 기울기와 절편을 구했고, coef함수를 이용하여 기울기와 절편을 추출했다. 회귀모델을 평가할..
2024.10.11 -
R복습_회귀분석 (1차 단순회귀분석, 다중회귀분석, 로지스틱 회귀분석)
회귀분석회귀분석은 한개 또는 그 이상의 변수들(독립변수)에 대하여 다른 한 변수(종속변수) 사이의 관계를 설명하고 예측하는 분석기법을 말한다. 현재의 데이터로 일정한 패턴을 계산하여 예측하는 분석방법인데, 주로 가격, 매출, 주가, 수량 등 연속적인 값을 갖는 데이터를 예측하는데 주로 사용한다. 회귀분석의 기본 개념분석모형이 예측하고자 하는 결과 : 종속변수(예측변수)예측을 위해 모형이 사용하는 속성 : 독립변수(설명 변수) ex) y=x1 + x2 +10 x1,x2 : 독립변수, y : 종속변수독립변수와 종속변수에 해당하는 데이터를 모아 관계를 분석하고 예측에 활용할 수 있도록 통계적으로 정리하는과정을 예측모델(모형)이라고 하며 이는 회귀식이 된다. 회귀분석의 종류단순회귀 : 독립변수가..
2024.10.10