시각화/R

▶R로만드는 데이터시각화 :: ggplot 기초 - 기본개념

비주얼라이즈 2014. 3. 20. 20:58


R로만드는 데이터시각화
ggplot 배우기


요즘은 ggplot관련 공부를 하고 있습니다.
공부를 하기위해 서점에서 [R로하는 데이터시각화]라는
책을 구매하였습니다. 

이 책을 기반으로 여러가지 공부를 해볼 생각입니다.
정말 도움이 많이 되는 책인 것 같습니다^^

그리고 저자님의 홈페이지에도
유용한 정보가 많았습니다.


 [R기반의 데이터시각화 
http://freesearch.pe.kr/]



이번 포스팅에서는 여러가지 패키지 중
 최근 공부하고 있는 ggplot 관련해서 소개해볼까합니다.


우선 데이터연습을 하기전에 
서울 공공데이터포털에서 [지하철]관련 데이터를 얻었습니다.


지하철 1호선부터 9호선까지의

수송인원, 수입, 운행횟수, 혼잡도까지 다양한 데이터를

정리해 둔 파일입니다.



다운로드 받으셨다면 

먼저 패키지를 설치해줍니다.


install.packages("ggplot2")

패키지가 정상적으로 설치되셨을 것입니다.

그러면 다음으로 라이브러리로 데려옵니다.



library(ggplot2)

여기까지 무리없이 실행되셨다면

데이터를 불러와줍니다.



 subway2012 <- read.csv("subway2012.csv", sep=",", header=TRUE)

데이터를 이용하여

차트를 그려보겠습니다.



ggplot(subway2012, aes(AVG_ONEDAY, RUNNINGTIMES_WEEKDAYS)) 

+ geom_point(aes(colour = LINE, size = AVG_CROWDEDNESS))


첫 번째 줄에서는,

X축은 평균 일 평균 승차인원으로 설정했고

Y축은 각 노선의 운행횟수로 설정했습니다.


두 번째 줄에서는,

각 원의 색상은 노선별로 다르게 설정했고

원의 크기는 평균 혼잡도로 설정했습니다.




결과를 살펴볼까요?


이런 결과를 보실 수 있으실 텐데요~

한가지 문제가 있습니다 ㅠㅠ


X축이 작은 수에서 큰 순서로

정렬되어있지않은 모습입니다.


ㅠㅠ


열심히 해결방법을 찾아봐야겠네요