R | dplyr | 그 외 데이터 추출 - slice() , top_n()

이전 포스팅에서 dplyr 패키지에서 무작위 추출 시 사용하는 sample_n, sample_frac 함수와 달리

무작위 추출이 아닌 순서대로 뽑거나 원하는 구간을 설정해서 데이터를 뽑는 slice()와

상위의 값을 추출해주는 top_n() 함수도 있다.

MASS 패키지의 내장 데이터 셋인 'cars93' 데이터 셋 사용

※ MASS 패키지의 select()함수와 'dplyr' 패키지의 select() 함수가 충돌하기 때문에 MASS 패키지를 먼저 불러온 후 dplyr 패키지를 불러와야 한다.

library(MASS)
library(dplyr)
df <- Cars93 
df <- df %>% select(Manufacturer:Price) # 1~5열까지만 select / 93행 5열

# 3번째에 위치한 행 추출
df %>%  slice(3)

# 2, 3, 6번째에 위치한 행 추출
df %>% slice(2,3,6)

# 2에서 6번째에 위치한 5개의 행 추출
df %>% slice(2:6)

# type별로 첫번째 위치한 행 추출
df %>% group_by(Type) %>% slice(1)

df %>% top_n(2, Price)

df %>% top_n(-2, Price)

df %>% group_by(Type) %>% top_n(1, Price)

df %>% group_by(Type) %>% top_n(-1, Price)

참고 문헌(reference)

참고 사이트

R \| dplyr \| 샘플 데이터 무작위 추출 - sample_frac(), sample_n() (0)	2023.01.02
R \| dplyr \| mutate, mutate_if , mutate_at - 새로운 변수 생성 및 처리 (1)	2022.12.28
R \| dplyr \| 변수 추출 select(), select_if() (0)	2022.12.15
R \| dplyr \| 데이터 정렬(arrange) (0)	2022.12.09
R \| dplyr \| 조건에 맞는 행 추출(filter) (0)	2022.12.09

티스토리툴바