게임 제작 관련/개발환경(프로그램)
R 시각화(그래프 그리기) 전 준비
김바보
2022. 10. 27. 17:41
시각화 연습하라고 R에는 다양한 데이터가 내장되어 있다.
data()
입력하면 R에 내장된 데이터와 설명을 볼 수 있다.
1. 데이터 호출
내장 데이터에 있는 mtcars로 실습을 할 것이다.
많은 수업에서 첫 데이터 가공으로 mtcars를 선택하는데 이유는 잘 모르겠다.(데이터 정리가 잘 되어있나?)
mtcars는 'Motor Trend Car Road Tests'라고 써져있는데... 대충 자동차에 관한 데이터다.
?mtcars
변수에 대한 설명, 안에 무슨 데이터가 있는지
attach(mtcars)
mtcars안 변수명을 mtcars$mpg 등 일일이 알려줄 필요없이 변수명만 부르기 가능
detach(mtcars)
변수명만 부르기 해제
2. 산점도 그리기
plot(mpg ~ disp, data = mtcars) # ~:관계연산자, 앞이 y 뒤가 x축
plot(mpg ~ disp) # attach 했을때
헷갈리지만 "mpg ~ disp"에서 앞 쪽이 y축에 그려진다는 것을 기억하자.
2-1. 데이터 랜덤 생성
x = rnorm(100) #표준정규분포로부터 100개의 랜덤 표본 추출하는 함수
y = 2+2*x + rnorm(100)
plot(x, y)
## y는 2+2x+epsilon (단, epsilon~N(0,sigma^2)) 으로 생성된다.
갑자기 이러면 문과는 당황스럽다.
그냥 쉽게 epsilon = error term(오차항)인데, 회귀분석을 배운 사람이라면 이해가 단번에 갈 것이고
그런거 안배운 나는 그냥 y = 2x + 2식에 오차항만큼 벗어나는 값들을 대입해서, 데이터가 흐트러지게끔 하는 것으로 이해했다.
글 길이가 매우 짧은 이유는
카카오 데이터센터 날아가서 tistory 며칠동안 복구가 안돼서 그냥 워드에 작업했더니
설명 달 시간이 없어서 그렇다.