
R | dplyr | 샘플 데이터 무작위 추출 - sample_frac(), sample_n()
·
R/dplyr
dply 패키지에 데이터를 무작위로 추출해주는 함수 sample_frac() : 특정 비율만큼 무작위 추출 sample_n(): 특정 개수만큼 무작위 추출 그 외에 R 내장 함수인 sample()도 같은 역할을 수행한다. 00. 데이터 불러오기 MASS 패키지의 내장 데이터 셋인 'cars93' 데이터 셋 사용 ※ MASS 패키지의 select()함수와 'dplyr' 패키지의 select() 함수가 충돌하기 때문에 MASS 패키지를 먼저 불러온 후 dplyr 패키지를 불러와야 한다. library(MASS) library(dplyr) df % sample_n(size = 10, replace = F) 01-2. sample_frac : 전체 행의 10% 무작위 추출 df %>% sample_frac(si..