# 숫자를 다루는 함수
# 기초통계량에 사용되는 함수
# head() : 앞에 6개를 가져와라
head(iris) #iris 가져오라
#tail:마지막 6개를 추출해주세요
tail(iris)
head(iris,15) # 15개 까지 보여주세요
# summary : 기초 통계에서 많이 사용하는 데이터 5개를 보여주세요 # 숫자 형태의 데이터 구조 볼 때 사용
summary(iris)
#전체 구조를 보여주세요 -> 데이터 프레임, 150개 데이터, 5개의 변수로 이루어짐
# $ 속성, : num -> 자료형, vector로 되어있음
str(iris)
val<- c (1,2,3,4,5,6,7,8,9)
val
summary(val) #데이터 형태가 숫자다 하면 사용, 데이터 셋의 형태나 구조 볼 때 str
# vector (벡터) : 하나의 데이터 형을 가지고 있는 데이터 집합 / index 는 1부터 시작
# 결칙치 / 결칙값 / na : 누락된 값
x <- c(1,2,3,4,5,6)
x
# rnorm(갯수) : 정규분포 난수를 발생시켜주는 함수
xx <- rnorm(30)
xx
length(x) # vector 구성하는 요소의 개수
mean(x) # 평균값
range(x) # 범위( 최솟값, 최댓값)
var(x) # 분산 : 평균값에서 얼마나 떨어져있는지
sd(x) # 표준 편차
x
x[2]
x[-2]
#벡터 합치기
x <- c(3,6,9,12,15)
y <- c(5,10,15,20,25)
z <- append(x,y) # 뒤에 추가하는 함수
z
c(1,2) + c(4,5)
c(1,2,3)+1
v <- -5:5
v
# seq() : 연속된 값을 가지는 벡터 생성
q <- seq(1,5)
qq <- seq(1,10,by=2)
q
qq
x <- c(1,2,3)
y <- c(4,2,7)
x == y # 비교 연산자
(xx <- rep(c("a","b","c"), times=4)) # rep : 반복하기 위해 , 벡터 times = 숫자만큼 반복
yy <- unique(xx) # 중복 제거
yy