게임 제작 관련/개발환경(프로그램)

R 시각화(그래프 그리기) 전 준비

김바보 2022. 10. 27. 17:41

시각화 연습하라고 R에는 다양한 데이터가 내장되어 있다.

data()

입력하면 R에 내장된 데이터와 설명을 볼 수 있다.

 

 

 

1. 데이터 호출

내장 데이터에 있는 mtcars로 실습을 할 것이다.

많은 수업에서 첫 데이터 가공으로 mtcars를 선택하는데 이유는 잘 모르겠다.(데이터 정리가 잘 되어있나?)

mtcars는 'Motor Trend Car Road Tests'라고 써져있는데... 대충 자동차에 관한 데이터다.

?mtcars
변수에 대한 설명, 안에 무슨 데이터가 있는지

attach(mtcars)
mtcars안 변수명을 mtcars$mpg 등 일일이 알려줄 필요없이 변수명만 부르기 가능

detach(mtcars)
변수명만 부르기 해제

 

 

2. 산점도 그리기

plot(mpg ~ disp, data = mtcars) # ~:관계연산자, 앞이 y 뒤가 x축
plot(mpg ~ disp)                # attach 했을때

 

disp-mpg 산점도

헷갈리지만 "mpg ~ disp"에서 앞 쪽이 y축에 그려진다는 것을 기억하자.

 

 

2-1. 데이터 랜덤 생성

x = rnorm(100) #표준정규분포로부터 100개의 랜덤 표본 추출하는 함수
y = 2+2*x + rnorm(100)
plot(x, y)

 

x, y 관계 산점도

## y는 2+2x+epsilon (단, epsilon~N(0,sigma^2)) 으로 생성된다.

갑자기 이러면 문과는 당황스럽다.

 

그냥 쉽게 epsilon = error term(오차항)인데, 회귀분석을 배운 사람이라면 이해가 단번에 갈 것이고

그런거 안배운 나는 그냥 y = 2x + 2식에 오차항만큼 벗어나는 값들을 대입해서, 데이터가 흐트러지게끔 하는 것으로 이해했다.

 

 

 

글 길이가 매우 짧은 이유는

카카오 데이터센터 날아가서 tistory 며칠동안 복구가 안돼서 그냥 워드에 작업했더니

설명 달 시간이 없어서 그렇다.