R | 전처리 | 결측치 처리
·
R/preprocessing
결측치 젤 중요해..... 00. 데이터 불러오기 # library(dplyr) imdb % head() 01. 결측치 확인 - is.na(x): x 객체 안에 NA 값이 있으면 그 자리에 TRUE를 반환하고, 없으면 FALSE를 반환한다. is.na(imdb$Metascore)[1:30] sum(is.na(imdb$Metascore)) # Metascore 열의 NA 갯수 출력 imdb %>% filter(is.na(Meta_score)) # Meta_score가 NA인 데이터 출력 - 결측치 빈도 출력 # imdb내 모든 변수별 결측치 개수 출력 colSums(is.na(imdb)) # True가 1이니깐 table(is.na(imdb)) # 결측치 157개 02. 결측치 제거 - na.omit() ..