R분석(18)
-
R복습_회귀분석 코드연구 (1차 단순회귀분석, 다중회귀분석, 로지스틱 회귀분석)
단순회귀분석 코드연구단순 회귀분석 코드연구 1예측 모델링 설계목적 : diamonds데이터에서 가격별 무게의 상관관계를 알아보고 가격의 변동에 따른 무게예측하기사용 데이터 : diamonds(r내장데이터)#데이터 셋 로드diamonds#상관관계분석cor.test(diamonds$price,diamonds$carat)#p-value = 회귀분석 코드연구 1 다이아몬드 데이터의 무게와 가격의 상관관계를단하 분석한 결과이다. p-value가 내장그래프인 plot을 사용하여 상관성을 확인하였을때도 어느정도 한 방향으로 관측점들이 분포하고있어, 상관성이 있다고 판단되었다. #기울기, 절편 구하기modellm함수를 이용하여 기울기와 절편을 구했고, coef함수를 이용하여 기울기와 절편을 추출했다. 회귀모델을 평가할..
2024.10.11 -
R복습_회귀분석 (1차 단순회귀분석, 다중회귀분석, 로지스틱 회귀분석)
회귀분석회귀분석은 한개 또는 그 이상의 변수들(독립변수)에 대하여 다른 한 변수(종속변수) 사이의 관계를 설명하고 예측하는 분석기법을 말한다. 현재의 데이터로 일정한 패턴을 계산하여 예측하는 분석방법인데, 주로 가격, 매출, 주가, 수량 등 연속적인 값을 갖는 데이터를 예측하는데 주로 사용한다. 회귀분석의 기본 개념분석모형이 예측하고자 하는 결과 : 종속변수(예측변수)예측을 위해 모형이 사용하는 속성 : 독립변수(설명 변수) ex) y=x1 + x2 +10 x1,x2 : 독립변수, y : 종속변수독립변수와 종속변수에 해당하는 데이터를 모아 관계를 분석하고 예측에 활용할 수 있도록 통계적으로 정리하는과정을 예측모델(모형)이라고 하며 이는 회귀식이 된다. 회귀분석의 종류단순회귀 : 독립변수가..
2024.10.10 -
R복습_데이터 시각화2_ (그래프에 회귀선그리기(단순회귀분석), 그래프 객체 추가,도형 및 화살표 추가)
그래프에 사선그리기그래프에 사선을 추가하게되면 그래프 추세를 확인할 수 있다. 그래프에 사선을 그리려면 단순하게 함수만 이용해서는안되며, 상관분석, 기울기, 절편값 구하기등 단계가 조금 복잡하다. 그래프에 회귀 사선을 추가하는 단계는 다음과 같다 그래프에 사선추가 단계cor.test(상관분석 진행) : 상관성이 있어야 기울기, 절편 구하기 가능 lm(종속변수, 독립변수) : 절편과 기울기 구하기coef() : 모델의 데이터에서 절편과 기울기 추출geom_abline(intercept=절편, slope=기울기) : 함수에 기울기, 절편 전달#패키지 불러오기library(ggplot2)#그래프에 사선그리기#ggplot에 저장된 economics 데이터셋economics#1)geom_abline() : 꺾은선..
2024.10.07 -
R복습_데이터 시각화1_ ggplot2(산점도, 꺾은선, 막대, 누적,박스,히스토그램, 선버스트,gridExtra 등)
데이터 시각화데이터시각화란 숫자로 구성된 수치 데이터를 이미지화 하여 그 내용을 시각적으로 전달하는것을 의미한다. ggplot2패키지 설치#ggplot2패키지 #패키지 설치 install.packages('ggplot2') library(ggplot2) #R의 내장 데이터셋 불러오기 airquality #1973년 뉴욕의 대기 측정 데이터 ggplot2 패키지#그래프 기본틀 생성 str(airquality) #str()데이터프레임 요약함수 ggplot(airquality,aes(x=Day,y=Temp))#아직 값이 안들어가고 틀만 만들어진 상태데이터 시각화 시 사용하는 패키지로, 각종 그래프 함수가 포함되어있다. 기본적인 대부분의 시각화는 ggplot2패키지로 표현능하며, 실무에서도 r에서 데이터 시각화..
2024.10.07 -
R복습_reshape2패키지와 함수(melt,cast,데이터구조 가공)
reshape2데이터분석을 하게되면 동일한 데이터를 가지고 분석을 하더라도, 목적에 따라 분석기준이 달라지게된다. 이때 데이터의 구조를 데이터를 분석하는 방향성에 맞게 변경해주어야하는데, 이때 사용할수있는 패키지가 바로 reshape2 패키지이다. reshape2패키지는 수집한 데이터의 구조를 분석하기 쉬운형태로 가공할때 사용한다. reshape2패키지 설치와 데이터 생성#reshape2 패키지install.packages('reshape2')library(reshape2)#데이터 생성stu.df 다른 패키지들과 마찬가지로 일단 패키지를 설치한후 라이브러리에 로드한다.그후 reshape2패키지에서 사용할 데이터 프레임을 생성해준다. melt()#melt(데이터, id.vars=기준이되는 열, meas..
2024.10.06 -
R복습_stringr패키지와 함수(문자열 가공)
stringr패키지문자열 데이터를 가공하기 위해 자주 사용되는 유용한 패키지로, 문자열 치환, 벡터연산, 함수의 결과를 반복문 없이 저장해주는 등의 편리한 함수들을 가지고 있다. stringr패키지 설치#stringr패키지#패키지 설치install.packages('stringr')library(stringr)다른 패키지들과 마찬가지로 install.packages를 사용하여 패키지를 설치해준 후, library에 로드한 후 사용해야한다. str_count()#1)str_count(문자열1, 문자열2) : 문자열1에서 문자열2의 개수를 카운트str_count('abaabb','a') #3개str_count('안녕하세요','안')#str_count벡터사용str_v str_count는 str_count(..
2024.10.05