R | ggmap | 지도 시각화(3) - polygon
·
R/ggplot2
저번 지도 시각화(2)에서는 ggmap 패키지를 사용하여 차량 주행 궤적 데이터와 항공노선 데이터를 지도 위에 geom_line, geom_path(ggplot2)로 선(경로)으로 표현하였다. 이번 포스팅에서는 ggmap 패키지와 geom_polygon(ggplot2)을 사용하여 시도, 시군구별 shape file과 , 행정구역_시도별 인구수 데이터를 활용해 지도 위에 그려볼 것이다. 01. 대한민국 지도 폴리곤 시각화 하기 대한민국 지도를 폴리곤으로 시각화하는 방법은 두 가지이다. ① raster 패키지의 지도 데이터를 사용하여 시각화 ② shape file의 지리 정보를 사용하여 시각화 1) raster 패키지를 사용해 시각화하기 대한민국 지도를 시각화 하기 위해서는 대한민국의 시군구 지리정보 데이터..
R | ggplot2 | Text (geom_text)
·
R/ggplot2
ggplot2 패키지에서 산점도나 막대그래프의 레이블을 표시하는 방법 중 가장 간단한 것은 geom_text() 함수에서 aes 객체로 label을 설정하는 것이다. geom_label()도 사용할 수 있지만 밑에서 보면 알겠지만 레이블이 사각형으로 둘러 쌓여 있어 레이블이 오버랩이 되는 경우가 있어 geom_text()를 더 많이 사용한다. geom_text( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., parse = FALSE, nudge_x = 0, nudge_y = 0, check_overlap = FALSE, na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) ..
R | ggplot2 | Line Plot
·
R/ggplot2
Line Plot, 선 그래프는 x축의 연속형 변수 or 순서나 크기가 있는 이산형 변수, ordered factor의 변화에 따른 y축의 변화를 선으로 이어서 보여주는 그래프이다. 여기서 x축이 시간의 순서이면 시계열 그래프(Time Series Graph)가 된다. ggplot2 패키지에서는 선 그래프를 그리기 위한 geom_path(), geom_line() 함수를 제공한다. 이번 포스팅에서는 geom_line()를 사용하여 선 그래프를 그릴 것이다. geom_line( mapping = NULL, data = NULL, stat = "identity", position = "identity", na.rm = FALSE, orientation = NA, show.legend = NA, inherit..
R | ggplot2 | Scatter Plot(산점도)
·
R/ggplot2
Scatter Plot , 산점도는 두 개의 연속형(continuous) 데이터의 상관관계를 파악하기에 매우 유용한 그래프이다. ggplot2 패키지에서는 Scatter Plot을 그리기 위한 geom_point() 함수를 제공한다. geom_point( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) · 주요 Argument Argument 사용 방법 설명 stroke point의 외곽 라인의 두께 지정 1) stroke = 1 fill point의 채우기 색상 1) fill = "컬러코드" 1) mapping 밖에 사용..
R | ggplot2 | Boxplot
·
R/ggplot2
Boxplot은 데이터를 요약하는 데 있어서 매우 유용한 그래프이다. 박스플롯을 그리기 위해서 x축은 Descrete(이산형) 변수를, y축에는 Continuous(연속형) 변수를 배치 해야 됨. · Boxplot 구조 Boxplot은 자료에서 얻은 다섯 수치 요약(five number summary)을 가지고 그린다. 다섯 수치 요약은 아래와 같다. 최솟값 : 제 1사분위에서 1.5 IQR을 뺀 위치이다 제 1사분위(Q1) : 25%의 위치를 의미한다. 제 2사분위(Q2) : 50%의 위치로 중앙값(median)을 의미한다. 제 3사분위(Q3) : 75%의 위치를 의미한다. 최댓값 : 제 3사분위에서 1.5 IQR을 더한 위치이다. IQR이란, Interquartile range의 약자로써 Q3 - Q..
R | ggplot2 | Density Plot (밀도 플롯)
·
R/ggplot2
Density Plot , 밀도 플롯은 숫자형 변수(연속형)의 분포를 볼 때 유용하다. Density Plot은 히스토그램의 평활화 버전으로 데이터의 분포를 근사적으로 파악하는 데 도움을 줌. ggplot2 패키지에서는 Density Plot을 그리기 위해서 geom_density( ) 함수를 제공한다. geom_density( mapping = NULL, data = NULL, stat = "density", position = "identity", ..., na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE, outline.type = "upper" ) · 주요 Argument 사용 방법 설명 adjust adjust = n 밀..