시각화/R 31

▶R의 데이터시각화 패키지 :: Color Package 활용하기

▶R의 데이터시각화 패키지 :: Color Package 활용하기 이번글에서는 우리가 R에서 plotting을 할 때, 색상관련기능들을 어떻게 효과적으로 활용할지에 대해서 정리해보고자 한다. R에서 기본적으로 제공하고있는 색상 구성표에 대하여 R에서 제공하는 기본적인 색상 구성표는 끔찍하다. 사실, 기본적으로 R이 통계프로그램이라는 점에서보면 그리 놀랄일도 아니다. 다행히도, 최근까지 R은 다양한 plot, graph 등의 색상을 다루거나 명확하게하는 부분에 있어서 많은 개발이 이루어져왔다는 점이다. 또한, 이밖에도 R에서는 기본 색상표를 가뿐히 능가하는 다양한 외부 패키지를 불러올 수 있기때문에 적어도 우리가 색상에 관심을 갖고 있는 한, R의 기본 구성표로인해 애를 먹을일은 없다. Colors 1, ..

시각화/R 2015.02.27

▶R의 데이터시각화 패키지 :: ggplot2 ①

▶R의 데이터시각화 패키지 :: ggplot2 ① ggplot2는 R의 그래픽패키지이다. 《R로 만드는 데이터시각화》의 저자인 전희원씨도 ggplot을 자주 활용하고 있고, Oreilly에서 펴낸 《R Graphics Cookbook》에는 ggplot2에 대한 내용이 따로 한 챕터를 구성하고 있을 만큼, R에서 시각화를 다룰때 있어서 보편적으로 많이 다루고 있는 패키지라고 할 수 있다. ggplot패키지를 개발한 것은 해들리위캠(Hadley Wichkam)교수이다. 한 특강에서 듣기로, R은 해들리위캠의 ggplot이 만들어지기 '이전'과 '이후'로 나눠질정도라고한다. ggplot2이란? 이 ggplot2패키지의 문법은 데이터기반으로 기하학적 객체들(점, 선, 막대 등)에 미적 특성(색상, 모양,크기)를..

시각화/R 2015.02.14

▶R의 시각화 패키지 :: The Lattice Plotting System

▶R의 시각화 패키지 :: The Lattice Plotting System The Lattice Plotting System in R - R의 Lattice 플로팅 시스템(이하 Lattice)은 R에서 기본 플로팅시스템과 작동방법이 많이 다르다. - Lattice는 다차원의 데이터를 사용하려고 할 때, 한번에 많은 플롯을 생성할 수 있다는 점에서 유용하다. 또한 Lattice에서는 기본 플로팅 시스템의 방법을 'mfrow'와 'mfcall'이라는 인수를 통해 활용할 수 있다. - Lattice는 높은 밀도의 플롯을 효과적으로 그려내는데 최적화 되어있으며, 그밖에 여러 목적에 따라 활용되고있다. 이글에서 'Lattice'에 대해서 다루고있는 내용 - Lattice 시스템의 기능 - Lattice 시스템의..

시각화/R 2015.02.12

▶비개발자의 R 배우기 ① 경로설정 및 프로젝트 생성

▶비개발자의 R 배우기 ① 경로설정 및 프로젝트 생성 이번 글에서는 "비 개발자의 R배우기"라는 주제 중에서, 'R Studio에서 경로를 설정하는 방법'과 프로젝트별 관리에 대해서 살펴보고자합니다. Path setting path setting은 쉽게말해 '경로를 지정해준다'라는 말입니다. 우리지갑속에 있는 여러가지 카드에도 각각 해당하는 계좌와 연결되어있는 것 처럼 R에서 프로젝트를 생성하고 진행할 때, 어떤 경로안에 있는 데이터와 정보들을 이용할지, 그리고 작업한 내용을 저장할지에 대한 설정이라고 보면 됩니다. getwd() #R studio에서 현재 워킹디렉토리를 확인하기setwd("/Users/*****/Desktop") #사용하고자하는 워킹디렉토리를 설정한다.getwd() #워킹디렉토리가 잘 ..

시각화/R 2015.02.01

▶R로하는 데이터시각화 :: 데이터불러오기

▶R로하는 데이터시각화 :: 데이터불러오기 이번글에서는 데이터를 Rstudio에 불러오는 방법과 그에 관련된 함수에 대해서 살펴보고자 한다. read.csv()함수 사용하기 개인적으로 가장 자주 활용하는 기능이다. read.csv()는 데이터를 R로 불러들이되, 지금 사용중인 컴퓨터 메모리(주기억장치)에 저장하는 것은 아니다. sample Set Working Driectory > Choose Directory 또는 Ctrl + Shift + K를 입력하면된다. 데이터로드 - 요인(Factor)과 벡터(Vector)형식 R에서는 기본적으로 데이터파일안에 들어있는 문자열(Strings)를 요인(Factor)로 취급하는 것이 기본이다. 만약 요인으로 설정하지 않고 불러오고 싶다면 readCSV()함수내에 s..

시각화/R 2015.01.29

▶R로만드는 데이터시각화 :: 히트맵 만들기

▶R로만드는 데이터시각화 :: 히트맵 만들기 오늘은 R을 이용하여 히트맵을 만드는 과정을 살펴보려고합니다. 위의 사진은 제가 예전에 만들었던 히트맵의 모습입니다. 제주유나이트의 개인 성적을 바탕으로 히트맵을 만들어보았었습니다. 그러면 R을 이용하여 히트맵을 만드는 과정을 다시한번 살펴보도록 하겠습니다. library(ggplot2) 예제를 위해 ggplot2 패키지를 로드해주었습니다. presidents str(presidents) 오늘 예제에서 사용할 데이터는 'presidents'입니다. str함수를 이용하여 구조를 살펴보겠습니다. 히트맵을 만들기 위해서는 지금의 형태에서 바꿔줄 필요가 있습니다. 아래와같은 방법으로 데이터를 다듬어줍니다. pres_rating

시각화/R 2014.05.27

▶R로만드는 데이터시각화 :: Hello ggplot2 - bar, histogram그리기

▶R로만드는 데이터시각화 :: Hello ggplot2 - bar, histogram그리기 오늘 살펴볼 것은 빈도수 막대그래프와 히스토그램입니다. 사용할 데이터는 'diamonds'라는 내장 데이터입니다. 데이터 형식을 먼저 살펴보겠습니다. library(ggplot2) str(diamonds) ggplot2패키지를 로드하고, diamonds의 내용을 str()g함수를 이용하여 살펴보겠습니다. [str(diamonds)로 살펴본 diamonds데이터의 정보] cut, dolor, clarity는 factor(요인)데이터이며 나머지 대부분의 데이터는 문자열(strings)데이터인 것을 확인할 수 있습니다. 이산적인 x축을 바탕으로하는 빈도수 막대그래프 이중에서 cut(factor)데이터를 바탕으로 빈도수 ..

시각화/R 2014.04.30

▶R로만드는 데이터시각화 :: Hello ggplot2 - ggplot2 시작하기

오늘 포스팅은 ggplot2에 대한 내용입니다. '기초적인 내용이 탄탄해야 응용이 가능하겠구나'라는 생각을 하고, 처음부터 다시 꼼꼼하게 정리해보려고 합니다. Hello ggplot2! R을공부하는데 있어서 'ggplot2'은 꼭 정리해야겠다는 생각을 했습니다. 다음은 ggplot2을 만든 해들리교수와, Rcookbook의 저자인 윈스턴 챙 말입니다. 기본 그래픽 시스템은 그림을 그리기 위해 좋은 툴이지만 ggplot2는 데이터를 이해하는 데 좋은 시각화 툴이다 - Hadley Wichham 단순한 그래프 이상을 그리고 싶다면 ggplot2로 갈아타는 게 현명하다. 왜냐하면 기본 그래픽 패키지에는 알아야 하는변경자와 케이스가 한 아름인데반해, ggplot2는통일된 인터페이스와 옵션들을 제공하기 때문이다...

시각화/R 2014.04.26