-
[R] 상관분석, 그래프 그리기(히트맵)프로그래밍/R 2021. 6. 9. 22:57
본 내용은 '2021년 혁신성장 청년인재 집중양성 사업'의 ‘인공지능 개발자 양성 과정’ 강좌를 수강하면서 강의 및 강의노트를 참고하여 작성한 내용입니다.
일반 휘발유와 고급 휘발유의 도시 연비 t 검정
ls() rm(list = ls()) # 전체 OB 삭제 ls() gc() # 메모리 사용량 library(ggplot2) mpg class(mpg) mpg <- as.data.frame(ggplot2::mpg) # data frame으로 변환 class(mpg) str(mpg) library(dplyr) mpg %>% select(fl, cty) %>% filter(fl %in% c("r", "p")) mpg_diff2 <- mpg %>% select(fl, cty) %>% filter(fl %in% c("r", "p")) table(mpg_diff2) t.test( data = mpg_diff2, cty ~fl, var.equl = T )
상관분석 - 두 변수의 관계성 분석
- 상관계수
- 0~1 사이의 값을 지니고 1에 가까울수록 관련성이 크다는 것을 의미
- 양수 - 정비례 관계
- 음수 - 반비례 관계
실업자 수와 개인 소비 지출의 상관관계
- unemploy : 실업자 수
- pce : 개인 소비 지출
library(ggplot2) economics <- as.data.frame(ggplot2::economics) cor.test(economics$unemploy, economics$pce)
상관행렬 히트맵 만들기
install.packages("corrplot") library(corrplot) head(mtcars) car_cor <- cor(mtcars) round(car_cor, 2) corrplot(car_cor) corrplot(car_cor, method = "number") col <- colorRampPalette(c("#BB4444", "#EE9988", "#FFFFFF", "#77AADD", "#4477AA")) corrplot(car_cor, method = "color", type = "lower", order = "hclust", addCoef.col = "black", tl.col = "black", tl.srt = 45, diag = F )
1에 가까울수록 연관성이 높다, -1에 가까울수록 연관성이 낮다
상관계수 그래프
- 상관계수 클수록 원의 크기 ↑ & 색깔이 진하다
- 양수면 파란색, 음수면 빨간색 계열
'프로그래밍 > R' 카테고리의 다른 글
교재 정리, 요약 (0) 2021.06.10 [R] 지도 시각화 (미국 주별 강력 범죄율 단계 구분도, 대한민국 시도별 인구, 결핵 환자 수 단계 구분도, 지도 시각화, 구글 차트) (0) 2021.06.08 [R] 텍스트 마이닝 (웹 특정 페이지 읽어오기 (0) 2021.06.08 [R] wordcloud2 패키지 실습 (0) 2021.06.07 [RStudio, 스크랩] Error-.onLoad가 loadNamespace()에서 'rJava'때문에 실패했습니다 (0) 2021.06.06 - 상관계수