[데이터 핸들링] 데이터 정렬 - plyr
plyr 라이브러리의 arrange 함수를 이용해 손쉽게 데이터를 정렬해보자
library(plyr)
d3 = read.csv(path2,header=T)
d3 = arrange(d3, d3$Kg)
정렬 전
정렬 후
plyr 라이브러리의 arrange 함수를 이용해 손쉽게 데이터를 정렬해보자
library(plyr)
d3 = read.csv(path2,header=T)
d3 = arrange(d3, d3$Kg)
정렬 전
정렬 후
변수 값만 지정 후 pie 그래프 출력
> pie(weights, main="채권관리", col=rainbow(length(weights)), labels=c("채권계약","채권보전","채권시효","채권추심"))
결과는 다음과 같다.
main 파라매터에 그래프의 이름을 적고, col 파라매터에 색상을 지정한다. label 파라매터에 각 값에 대한 라벨을 적는다.
이번에는 pie에 바로 넣지 않고 변수에 담아서 넣어보자.
colors 변수에 원하는 색상을 담고, weights_labels에 각 값에 대한 비율을 계산하여 저장한다. 그 후 pie 함수를 사용하여 pie 그래프를 그리고 legend 함수를 사용해 범례를 작성하여 label에 비율을 적고 이전에 label에 있던 정보는 범례로 작성한다.
one-sample t-test를 포함한 모든 t-test는 자료가 정규분포를 따를 경우 사용한다.
검정통계량 t=0.653이다.
의 값은 다음과 같다.
의 값은
1-pt(t,df=9) 이다.
※df 는 degree of freedom 자유도 이다.
독립변수의 자료형을 factor(요인)으로 변경
선이 만나는 것은 교호작용이 존재한다는 것을 뜻한다.
종속변수 : 내키, 독립변수 : 종교, 성별
interaction을 제외하고 두 개의 그룹변수만 모형에 넣으면 된다.
pie 그래프 그리기 (0) | 2014.09.03 |
---|---|
one-sample t-test (0) | 2014.08.26 |
일원분산분석 (0) | 2014.08.26 |
기술통계 (0) | 2014.08.26 |
R 맛보기 (0) | 2014.08.26 |
tapply() 함수를 사용하여 sex에 대한 myheight의 평균과 표준편차를 구한다.
lm()함수로 회귀분석을 한 후 anova()는 분산분석표를 구한다.
다음 명령을 통해 기본 가설을 진단한다.
원래의 집단 전체를 모집단이라하고 추출된 일부를 표본이라고 한다.
|
명령어 |
실습 |
표본수 |
length() |
|
평균 |
mean() |
|
분산 |
var() |
|
표준편차 |
sd() |
|
표준오차 |
sd()/sqrt(length()) |
|
변동계수 |
sd()/mean() |
|
기본으로 제공되는 데이터 cars의 speed 열을 가지고 기본 통계명령어를 테스트 하였다.
이에 대한 사분 범위는 다음과 같이 구할 수 있다.
사분위수를 그래프로 나타내 보자.
기본적인 히스토그램의 출력 명령이다. 아무 옵션도 없이 hist 함수를 사용하면 y축이 도수로 표현되어 그래프가 생성된다.
다음 실습은 옵션을 추가하여 도수가 밀도로 나타내어지게 한다.
두 번째 lines 명령으로 히스토그램에 분포선을 추가한다.
다음 그래프를 통해 정규분포에 얼마나 근접한지 알 수 있다.
각각의 변수에 대하여 6개의 기술통계량을 보여준다.
boxplot() 함수를 사용하여 도표로 나타낸다.
pairs() 함수를 사용하여 산포도를 나타낸다.
위 방법은 데이터를 읽는 기본적인 방법이다. R은 Linux와 동일하게 /로 디렉토리를 구분한다. 다음으로 소개할 방법은 workspace를 지정하는 방법이다.
setwd 로 작업 공간을 지정하고 그 이후 파일을 읽어올때는 경로를 적어 줄 필요가 없다.
install.packages("rJava")
R_HOME 변수 등록 ( rJava 패키지를 설치한 프로그램의 위치)
64bit : %R_HOME%\bin\x64; %R_HOME%\library\rJava\jri\x64;
32bit : %R_HOME%\bin\i386; %R_HOME%\library\rJava\jri\i386;
생성된 프로젝트에 library\rJava\jri 경로에 있는 JAR파일을 모두 복사한다.
Java Build Path에서 Add JARs
복사한 JAR파일을 추가한다.
저장된 결과
Application이나 Platform을 구축할 경우 분석 영역의 솔루션으로 R을 사용하는 것이 용이하다.
(시스템 통합의 용이성)