2020 전산통계학 4차 과제 - plot, ggplot
코딩 공부/R-전산 통계학 2020. 10. 27. 08:321번) 다음 사진과 같은 plot을 나타내기 (데이터는 mtcars (R에 있는 dataset) 에 변수 중, y=mpg, x=wt, cyl 로 설정할 것)
data(mtcars)
attach(mtcars)
x <- mtcars$wt ; y <- mtcars$mpg
plot(x,y
,xlim = c(1,6), ylim = c(10,35)
,main = "Weight vs Milage"
,xlab = "Weight", ylab = "Milage")
2번) ggplot2 패키지를 이용하여 사진과 같은 ggplot 을 나타내기 (데이터는 역시 mtcars 이용)
library(ggplot2)
g <- ggplot(mtcars, aes(x=wt, y=mpg)) + geom_point() + geom_smooth(method = "auto")
g1 <- g + coord_cartesian(xlim=c(1.5,5.5), ylim=c(10,35))
g2 <- g1 + labs(y="Miles per Gallon", x="Weight (x 1000lbs)")
plot(g2)
3번) ggplot2 패키지를 이용하여 사진과 같은 ggplot 을 나타내기 (데이터는 역시 mtcars 이용)
ggplot(mtcars, aes(x=wt, y=mpg)) +
geom_point(aes(x=wt, y=mpg, color=factor(cyl))) +
coord_cartesian(xlim=c(1.5,5.5), ylim=c(10,35)) +
labs(y="Miles per Gallon", x="Weight (x 1000lbs)", color="Number of Cylinders") #Change legend name
4번) ggplot2 패키지를 이용하여 사진과 같은 ggplot 을 나타내기 (데이터는 역시 mtcars 이용)
ggplot(mtcars, aes(x=wt, y=mpg)) +
geom_point(aes(x=wt, y=mpg, color=factor(cyl))) +
coord_cartesian(xlim=c(1.5,5.5), ylim=c(10,35)) +
facet_grid(~cyl) + labs(color="cyl")
<과제 총평>
1번 : 이 문제가 plot 의 가장 기초적인 요소 (x, y축의 범위, 이름 설정, 축 이름 설정) 를 보여주는 예시라고 할 수 있음
2번 : ggplot 튜토리얼을 참고해서 쉽게 할 수 있으나 method 설정이 뭔지 모를 수 있음
(method="lm" 으로 바꾸면 이 것이 선형 회귀선임 = 데이터 분석때 가장 많이 다룸)
3번 : 색깔을 어떤 데이터$변수에 따라서 주는 것인지는 이해가 되지만, 'factor' 화 시키지 않으면 계속해서 범위별로 색을 구분해버리게 하는 문제가 생김, 그 것만 빨리 알아차리면 역시 쉬운 문제
4번 : "facet_grid (~변수)" 와 "facet_grid (변수~)" 가 어떤 차이가 있는지 직접 해보면 더 좋은 문제가 될 것임