R을 본격적으로 학습하기 전에, 기술 통계에 관한 기초적인 분석을 한다.



R 시작하기

R을 설치하고 나면, dataset이라는 패키지가 기본으로 설치된다. 여기에는 ‘trees, chickwts, cars, mtcars, iris’ 등의 데이터가 기본적으로 내장되어있다.
데이터의 이름을 입력하면 해당 데이터의 변수들을 볼 수 있다.

>> trees
>> chickwts
>> cars

basic-of-R 이것들을 사용하여 가장 기초적인 데이터 분석을 실습해보자.

기술통계(Description Statistic)

1) summary()

summary()를 사용하면 speed, dist 각 변수에 대한 기술통계(Description Statistic)를 보여준다.

>> summary(trees)

stat-summary

2) boxplot()

boxplot()을 사용하면 박스 그림을 통해 데이터의 분포를 보다 쉽게 나타낼 수 있다.

>> boxplot(trees)

stat-boxplot

3) pairs()

pairs를 사용하면 산점도(Scatter, 데이터들이 얼마나 퍼져있는 지)를 쉽게 나타낼 수 있다.

>> pairs(cars)

stat-pairs