기술통계
2014. 8. 26. 13:57
빅데이터/R-last
반응형
모집단과 표본
원래의 집단 전체를 모집단이라하고 추출된 일부를 표본이라고 한다.
기본 명령어
|
명령어 |
실습 |
표본수 |
length() |
|
평균 |
mean() |
|
분산 |
var() |
|
표준편차 |
sd() |
|
표준오차 |
sd()/sqrt(length()) |
|
변동계수 |
sd()/mean() |
|
기본으로 제공되는 데이터 cars의 speed 열을 가지고 기본 통계명령어를 테스트 하였다.
사분위수
이에 대한 사분 범위는 다음과 같이 구할 수 있다.
사분위수를 그래프로 나타내 보자.
히스토그램
기본적인 히스토그램의 출력 명령이다. 아무 옵션도 없이 hist 함수를 사용하면 y축이 도수로 표현되어 그래프가 생성된다.
다음 실습은 옵션을 추가하여 도수가 밀도로 나타내어지게 한다.
두 번째 lines 명령으로 히스토그램에 분포선을 추가한다.
Q-Q plot
다음 그래프를 통해 정규분포에 얼마나 근접한지 알 수 있다.
반응형