R/ggplot2
-
저번 지도 시각화(2)에서는 ggmap 패키지를 사용하여 차량 주행 궤적 데이터와 항공노선 데이터를 지도 위에 geom_line, geom_path(ggplot2)로 선(경로)으로 표현하였다. 이번 포스팅에서는 ggmap 패키지와 geom_polygon(ggplot2)을 사용하여 시도, 시군구별 shape file과 , 행정구역_시도별 인구수 데이터를 활용해 지도 위에 그려볼 것이다. 01. 대한민국 지도 폴리곤 시각화 하기 대한민국 지도를 폴리곤으로 시각화하는 방법은 두 가지이다. ① raster 패키지의 지도 데이터를 사용하여 시각화 ② shape file의 지리 정보를 사용하여 시각화 1) raster 패키지를 사용해 시각화하기 대한민국 지도를 시각화 하기 위해서는 대한민국의 시군구 지리정보 데이터..
R | ggmap | 지도 시각화(3) - polygon저번 지도 시각화(2)에서는 ggmap 패키지를 사용하여 차량 주행 궤적 데이터와 항공노선 데이터를 지도 위에 geom_line, geom_path(ggplot2)로 선(경로)으로 표현하였다. 이번 포스팅에서는 ggmap 패키지와 geom_polygon(ggplot2)을 사용하여 시도, 시군구별 shape file과 , 행정구역_시도별 인구수 데이터를 활용해 지도 위에 그려볼 것이다. 01. 대한민국 지도 폴리곤 시각화 하기 대한민국 지도를 폴리곤으로 시각화하는 방법은 두 가지이다. ① raster 패키지의 지도 데이터를 사용하여 시각화 ② shape file의 지리 정보를 사용하여 시각화 1) raster 패키지를 사용해 시각화하기 대한민국 지도를 시각화 하기 위해서는 대한민국의 시군구 지리정보 데이터..
2023.01.27 -
저번 지도 시각화(1)에서는 ggmap 패키지를 사용하여 대전광역시 상권정보를 ggmap과 geom_point, stat_density2 d(ggplot2)로 위치를 점으로 표현하고, 상권 밀집 정도를 밀도와 등고선으로 표현하였다. 이번 포스팅에서는 역시 ggmap 패키지와 geom_line(ggplot2)을 사용하여 차량 궤적 데이터와, 항공노선을 지도 위에 그려볼 것이다. 01. 차량 궤적 데이터 (ggmap + geom_line) 1) 데이터 불러오기 https://www.data.go.kr/data/15041797/fileData.do 한국전자통신연구원_자율주행 기술 개발을 위한 차량 주행궤적 데이터셋_20191204 본 데이터셋은 한국전자통신연구원(ETRI)에서 구축한 자율주행 기술 개발 용 차..
R | ggmap | 지도 시각화(2) - line저번 지도 시각화(1)에서는 ggmap 패키지를 사용하여 대전광역시 상권정보를 ggmap과 geom_point, stat_density2 d(ggplot2)로 위치를 점으로 표현하고, 상권 밀집 정도를 밀도와 등고선으로 표현하였다. 이번 포스팅에서는 역시 ggmap 패키지와 geom_line(ggplot2)을 사용하여 차량 궤적 데이터와, 항공노선을 지도 위에 그려볼 것이다. 01. 차량 궤적 데이터 (ggmap + geom_line) 1) 데이터 불러오기 https://www.data.go.kr/data/15041797/fileData.do 한국전자통신연구원_자율주행 기술 개발을 위한 차량 주행궤적 데이터셋_20191204 본 데이터셋은 한국전자통신연구원(ETRI)에서 구축한 자율주행 기술 개발 용 차..
2023.01.26 -
R에서는 지도 시각화를 위한 'ggmap' 패키지를 제공한다. Google map에서 지도 그림을 가져와 조각조각 붙인다. 이를 위해서는 위도, 경도 좌표값이 꼭 필요하다. 참고로 예전에는 구글맵 api를 등록하지 않고도 ggmap을 사용할 수 있었는 데, 지금은 등록해야됨. 이번 포스팅에서는 ggmap 패키지를 사용하여 지도시각화를 진행할 것이며, 크게 아래 3가지 시각화를 진행할 것이다 get_map와 ggmap을 사용한 간단한 지도 불러오기 공공데이터포털의 상가정보를 사용해 ggmap에 geom_point 그리기 공공데이터포털의 상가정보를 사용해 ggmap에 stat_density2d()을 사용해 등고선 및 밀도 추가 00. 구글맵 API 등록 - 구글맵 api는 밑의 주소에서 간단하게 등록할 수 ..
R | ggmap | 지도 시각화(1)R에서는 지도 시각화를 위한 'ggmap' 패키지를 제공한다. Google map에서 지도 그림을 가져와 조각조각 붙인다. 이를 위해서는 위도, 경도 좌표값이 꼭 필요하다. 참고로 예전에는 구글맵 api를 등록하지 않고도 ggmap을 사용할 수 있었는 데, 지금은 등록해야됨. 이번 포스팅에서는 ggmap 패키지를 사용하여 지도시각화를 진행할 것이며, 크게 아래 3가지 시각화를 진행할 것이다 get_map와 ggmap을 사용한 간단한 지도 불러오기 공공데이터포털의 상가정보를 사용해 ggmap에 geom_point 그리기 공공데이터포털의 상가정보를 사용해 ggmap에 stat_density2d()을 사용해 등고선 및 밀도 추가 00. 구글맵 API 등록 - 구글맵 api는 밑의 주소에서 간단하게 등록할 수 ..
2023.01.25 -
ggplot2 패키지에서 산점도나 막대그래프의 레이블을 표시하는 방법 중 가장 간단한 것은 geom_text() 함수에서 aes 객체로 label을 설정하는 것이다. geom_label()도 사용할 수 있지만 밑에서 보면 알겠지만 레이블이 사각형으로 둘러 쌓여 있어 레이블이 오버랩이 되는 경우가 있어 geom_text()를 더 많이 사용한다. geom_text( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., parse = FALSE, nudge_x = 0, nudge_y = 0, check_overlap = FALSE, na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) ..
R | ggplot2 | Text (geom_text)ggplot2 패키지에서 산점도나 막대그래프의 레이블을 표시하는 방법 중 가장 간단한 것은 geom_text() 함수에서 aes 객체로 label을 설정하는 것이다. geom_label()도 사용할 수 있지만 밑에서 보면 알겠지만 레이블이 사각형으로 둘러 쌓여 있어 레이블이 오버랩이 되는 경우가 있어 geom_text()를 더 많이 사용한다. geom_text( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., parse = FALSE, nudge_x = 0, nudge_y = 0, check_overlap = FALSE, na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) ..
2023.01.19 -
Line Plot, 선 그래프는 x축의 연속형 변수 or 순서나 크기가 있는 이산형 변수, ordered factor의 변화에 따른 y축의 변화를 선으로 이어서 보여주는 그래프이다. 여기서 x축이 시간의 순서이면 시계열 그래프(Time Series Graph)가 된다. ggplot2 패키지에서는 선 그래프를 그리기 위한 geom_path(), geom_line() 함수를 제공한다. 이번 포스팅에서는 geom_line()를 사용하여 선 그래프를 그릴 것이다. geom_line( mapping = NULL, data = NULL, stat = "identity", position = "identity", na.rm = FALSE, orientation = NA, show.legend = NA, inherit..
R | ggplot2 | Line PlotLine Plot, 선 그래프는 x축의 연속형 변수 or 순서나 크기가 있는 이산형 변수, ordered factor의 변화에 따른 y축의 변화를 선으로 이어서 보여주는 그래프이다. 여기서 x축이 시간의 순서이면 시계열 그래프(Time Series Graph)가 된다. ggplot2 패키지에서는 선 그래프를 그리기 위한 geom_path(), geom_line() 함수를 제공한다. 이번 포스팅에서는 geom_line()를 사용하여 선 그래프를 그릴 것이다. geom_line( mapping = NULL, data = NULL, stat = "identity", position = "identity", na.rm = FALSE, orientation = NA, show.legend = NA, inherit..
2023.01.18 -
Scatter Plot , 산점도는 두 개의 연속형(continuous) 데이터의 상관관계를 파악하기에 매우 유용한 그래프이다. ggplot2 패키지에서는 Scatter Plot을 그리기 위한 geom_point() 함수를 제공한다. geom_point( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) · 주요 Argument Argument 사용 방법 설명 stroke point의 외곽 라인의 두께 지정 1) stroke = 1 fill point의 채우기 색상 1) fill = "컬러코드" 1) mapping 밖에 사용..
R | ggplot2 | Scatter Plot(산점도)Scatter Plot , 산점도는 두 개의 연속형(continuous) 데이터의 상관관계를 파악하기에 매우 유용한 그래프이다. ggplot2 패키지에서는 Scatter Plot을 그리기 위한 geom_point() 함수를 제공한다. geom_point( mapping = NULL, data = NULL, stat = "identity", position = "identity", ..., na.rm = FALSE, show.legend = NA, inherit.aes = TRUE ) · 주요 Argument Argument 사용 방법 설명 stroke point의 외곽 라인의 두께 지정 1) stroke = 1 fill point의 채우기 색상 1) fill = "컬러코드" 1) mapping 밖에 사용..
2023.01.17 -
Boxplot은 데이터를 요약하는 데 있어서 매우 유용한 그래프이다. 박스플롯을 그리기 위해서 x축은 Descrete(이산형) 변수를, y축에는 Continuous(연속형) 변수를 배치 해야 됨. · Boxplot 구조 Boxplot은 자료에서 얻은 다섯 수치 요약(five number summary)을 가지고 그린다. 다섯 수치 요약은 아래와 같다. 최솟값 : 제 1사분위에서 1.5 IQR을 뺀 위치이다 제 1사분위(Q1) : 25%의 위치를 의미한다. 제 2사분위(Q2) : 50%의 위치로 중앙값(median)을 의미한다. 제 3사분위(Q3) : 75%의 위치를 의미한다. 최댓값 : 제 3사분위에서 1.5 IQR을 더한 위치이다. IQR이란, Interquartile range의 약자로써 Q3 - Q..
R | ggplot2 | BoxplotBoxplot은 데이터를 요약하는 데 있어서 매우 유용한 그래프이다. 박스플롯을 그리기 위해서 x축은 Descrete(이산형) 변수를, y축에는 Continuous(연속형) 변수를 배치 해야 됨. · Boxplot 구조 Boxplot은 자료에서 얻은 다섯 수치 요약(five number summary)을 가지고 그린다. 다섯 수치 요약은 아래와 같다. 최솟값 : 제 1사분위에서 1.5 IQR을 뺀 위치이다 제 1사분위(Q1) : 25%의 위치를 의미한다. 제 2사분위(Q2) : 50%의 위치로 중앙값(median)을 의미한다. 제 3사분위(Q3) : 75%의 위치를 의미한다. 최댓값 : 제 3사분위에서 1.5 IQR을 더한 위치이다. IQR이란, Interquartile range의 약자로써 Q3 - Q..
2023.01.16 -
Density Plot , 밀도 플롯은 숫자형 변수(연속형)의 분포를 볼 때 유용하다. Density Plot은 히스토그램의 평활화 버전으로 데이터의 분포를 근사적으로 파악하는 데 도움을 줌. ggplot2 패키지에서는 Density Plot을 그리기 위해서 geom_density( ) 함수를 제공한다. geom_density( mapping = NULL, data = NULL, stat = "density", position = "identity", ..., na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE, outline.type = "upper" ) · 주요 Argument 사용 방법 설명 adjust adjust = n 밀..
R | ggplot2 | Density Plot (밀도 플롯)Density Plot , 밀도 플롯은 숫자형 변수(연속형)의 분포를 볼 때 유용하다. Density Plot은 히스토그램의 평활화 버전으로 데이터의 분포를 근사적으로 파악하는 데 도움을 줌. ggplot2 패키지에서는 Density Plot을 그리기 위해서 geom_density( ) 함수를 제공한다. geom_density( mapping = NULL, data = NULL, stat = "density", position = "identity", ..., na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE, outline.type = "upper" ) · 주요 Argument 사용 방법 설명 adjust adjust = n 밀..
2023.01.16 -
히스토그램은 막대그래프와 유사하지만 연속형 변수를 시각화 한다는 점에서 차이가 있다. ggplot2 패키지에서는 geom_histogram()로 히스토그램을 시각화 할 수 있음. geom_histogram( mapping = NULL, data = NULL, stat = "bin", position = "stack", ..., binwidth = NULL, bins = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE ) · binwidth: X축을 나누는 bin의 너비 설정, 숫자벡터를 사용할 수 있다. (bin과 binwidth는 동시에 사용될 수 없다) · bins: X축을 나누는 bin의 개수 설정 00. 데이터..
R | ggplot2 | Histogram히스토그램은 막대그래프와 유사하지만 연속형 변수를 시각화 한다는 점에서 차이가 있다. ggplot2 패키지에서는 geom_histogram()로 히스토그램을 시각화 할 수 있음. geom_histogram( mapping = NULL, data = NULL, stat = "bin", position = "stack", ..., binwidth = NULL, bins = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE ) · binwidth: X축을 나누는 bin의 너비 설정, 숫자벡터를 사용할 수 있다. (bin과 binwidth는 동시에 사용될 수 없다) · bins: X축을 나누는 bin의 개수 설정 00. 데이터..
2023.01.10 -
ggplot2 패키지를 사용하여 bar chart 막대그래프 그리는 방법 막대그래프는 주로 숫자형 변수와 범주형 변수의 관계를 볼 때 사용됨. X축의 값만 지정하여 그리는 방법(하나의 이산형 변수 사용) X축 1개 Y축 1개 각각 지정하여 그리는 방법(하나의 이산형 변수, 하나의 범주형 변수) ·ggplot2 패키지에는 총 3가지 함수 제공 geom_bar() , geom_col() , stat_count() geom_bar( mapping = NULL, data = NULL, stat = "count", position = "stack", ..., just = 0.5, width = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.ae..
R | ggplot2 | bar chartggplot2 패키지를 사용하여 bar chart 막대그래프 그리는 방법 막대그래프는 주로 숫자형 변수와 범주형 변수의 관계를 볼 때 사용됨. X축의 값만 지정하여 그리는 방법(하나의 이산형 변수 사용) X축 1개 Y축 1개 각각 지정하여 그리는 방법(하나의 이산형 변수, 하나의 범주형 변수) ·ggplot2 패키지에는 총 3가지 함수 제공 geom_bar() , geom_col() , stat_count() geom_bar( mapping = NULL, data = NULL, stat = "count", position = "stack", ..., just = 0.5, width = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.ae..
2023.01.03