분류 전체보기(72)
-
R복습_데이터 시각화2_ (그래프에 회귀선그리기(단순회귀분석), 그래프 객체 추가,도형 및 화살표 추가)
그래프에 사선그리기그래프에 사선을 추가하게되면 그래프 추세를 확인할 수 있다. 그래프에 사선을 그리려면 단순하게 함수만 이용해서는안되며, 상관분석, 기울기, 절편값 구하기등 단계가 조금 복잡하다. 그래프에 회귀 사선을 추가하는 단계는 다음과 같다 그래프에 사선추가 단계cor.test(상관분석 진행) : 상관성이 있어야 기울기, 절편 구하기 가능 lm(종속변수, 독립변수) : 절편과 기울기 구하기coef() : 모델의 데이터에서 절편과 기울기 추출geom_abline(intercept=절편, slope=기울기) : 함수에 기울기, 절편 전달#패키지 불러오기library(ggplot2)#그래프에 사선그리기#ggplot에 저장된 economics 데이터셋economics#1)geom_abline() : 꺾은선..
2024.10.07 -
R복습_데이터 시각화1_ ggplot2(산점도, 꺾은선, 막대, 누적,박스,히스토그램, 선버스트,gridExtra 등)
데이터 시각화데이터시각화란 숫자로 구성된 수치 데이터를 이미지화 하여 그 내용을 시각적으로 전달하는것을 의미한다. ggplot2패키지 설치#ggplot2패키지 #패키지 설치 install.packages('ggplot2') library(ggplot2) #R의 내장 데이터셋 불러오기 airquality #1973년 뉴욕의 대기 측정 데이터 ggplot2 패키지#그래프 기본틀 생성 str(airquality) #str()데이터프레임 요약함수 ggplot(airquality,aes(x=Day,y=Temp))#아직 값이 안들어가고 틀만 만들어진 상태데이터 시각화 시 사용하는 패키지로, 각종 그래프 함수가 포함되어있다. 기본적인 대부분의 시각화는 ggplot2패키지로 표현능하며, 실무에서도 r에서 데이터 시각화..
2024.10.07 -
R복습_reshape2패키지와 함수(melt,cast,데이터구조 가공)
reshape2데이터분석을 하게되면 동일한 데이터를 가지고 분석을 하더라도, 목적에 따라 분석기준이 달라지게된다. 이때 데이터의 구조를 데이터를 분석하는 방향성에 맞게 변경해주어야하는데, 이때 사용할수있는 패키지가 바로 reshape2 패키지이다. reshape2패키지는 수집한 데이터의 구조를 분석하기 쉬운형태로 가공할때 사용한다. reshape2패키지 설치와 데이터 생성#reshape2 패키지install.packages('reshape2')library(reshape2)#데이터 생성stu.df 다른 패키지들과 마찬가지로 일단 패키지를 설치한후 라이브러리에 로드한다.그후 reshape2패키지에서 사용할 데이터 프레임을 생성해준다. melt()#melt(데이터, id.vars=기준이되는 열, meas..
2024.10.06 -
R복습_stringr패키지와 함수(문자열 가공)
stringr패키지문자열 데이터를 가공하기 위해 자주 사용되는 유용한 패키지로, 문자열 치환, 벡터연산, 함수의 결과를 반복문 없이 저장해주는 등의 편리한 함수들을 가지고 있다. stringr패키지 설치#stringr패키지#패키지 설치install.packages('stringr')library(stringr)다른 패키지들과 마찬가지로 install.packages를 사용하여 패키지를 설치해준 후, library에 로드한 후 사용해야한다. str_count()#1)str_count(문자열1, 문자열2) : 문자열1에서 문자열2의 개수를 카운트str_count('abaabb','a') #3개str_count('안녕하세요','안')#str_count벡터사용str_v str_count는 str_count(..
2024.10.05 -
R복습_dplyr패키지(추출및 정렬함수,통계요약함수,샘플데이터추출함수)
패키지패키지란 다른 사용자가 만든 여러함수들을 기능에따라 묶어서 제공하는기능을 말한다. 하나의 패키지를 r스튜디오안에 설지하면 그 패키지안에 포함된 여러함수들을 사용할 수있다. dplyr 패키지패키지의 종류는 상당히많다. 그중에서는 거의 사용되지않는 패키지도있을뿐더러 자주 사용되는패키지도 있다. 그중 dplyr패키지는 데이터가공시 실무에서 자주 사용되는패키지중 하나로, r의 내장함수와 비슷한역할을하는 함수들이 있지만, 내장함수보다도 더빠르고 쉽게 이용이 가능하다. 패키지 설치#패키지 설치install.packages('dplyr')library(dplyr)패키지 안에 있는 내장함수를 사용하려면 먼저 패키지를 스튜디오 내부에 설치해야한다. 설치방법은 install.packages('패키지명')이며..
2024.10.04 -
R복습_파일입출력(text,csv,excel,절대경로와 상대경로)
파일입출력파일입출력은 r에서 쿼리문을 통해 파일을 작성하고 내보내는 것을 의미한다. 파일입력은 input이라고도 부르며, 기존에 작성된 파일을 r로 불러읽어들이는것을 말하고, 파일 출력은 output이라고도 부르며 기존 파일에 새로운 내용을 추가하거나 새로운 파일을 생성하는 것을 의미한다. r에서 사용하는 파일 확장자 종류text파일 : .txtcsv파일 : .csvexcel파일 : .xlsx 절대경로와 상대경로절대결오는 최상위 위치부터 내가 있는 (경로가 있는 파일명)위치까지 모두 작성하는 것을 말하며, 파일을 생성할때 파일명만 작성하는 경우, 현재 작성하고있는 r파일과 동일한 위치에 저장된다. 상대경로의 경우 현재 내 위치를 기준으로 이동하는 경로를 의미한다. ./ : 지금 내경로, 현재위치../ ..
2024.10.01