R 26

▶d3.js 튜토리얼 :: projection과 path의 활용

▶d3.js 튜토리얼 :: projection과 path의 활용D3를 활용하여 웹에서 시각화를 구현하고자 할 때, Topojson 또는 GeoJSON파일 등을 활용하면 보다 효과적인 시각화결과를 얻을 수 있다. d3.geo에 대한 기능은 지도를 활용한 데이터매핑을 하기전에 앞서 꼼꼼하게 살펴보아야할 API이다. 사진 : Geo Paths에 관한 기술문서 페이지 화면. 정말 다양하고 자세한 기술문서가 존재한다. d3.geo.path()의 기능d3.js의 한국어 API(부분적으로 제공중이다.)는 d3.geo.path()기능에 대해 다음과 같이 정리하고 있다. "지리 경로 제레네이터를 새로 생성한다. 기본값은 albersUsa 투영법과 반지름 4.5 픽셀의 포인트다."한국어로 된 설명이 있는것 자체가 굉장히 ..

시각화/D3.js 2015.04.15

▶R의 데이터시각화 패키지 :: Color Package 활용하기

▶R의 데이터시각화 패키지 :: Color Package 활용하기 이번글에서는 우리가 R에서 plotting을 할 때, 색상관련기능들을 어떻게 효과적으로 활용할지에 대해서 정리해보고자 한다. R에서 기본적으로 제공하고있는 색상 구성표에 대하여 R에서 제공하는 기본적인 색상 구성표는 끔찍하다. 사실, 기본적으로 R이 통계프로그램이라는 점에서보면 그리 놀랄일도 아니다. 다행히도, 최근까지 R은 다양한 plot, graph 등의 색상을 다루거나 명확하게하는 부분에 있어서 많은 개발이 이루어져왔다는 점이다. 또한, 이밖에도 R에서는 기본 색상표를 가뿐히 능가하는 다양한 외부 패키지를 불러올 수 있기때문에 적어도 우리가 색상에 관심을 갖고 있는 한, R의 기본 구성표로인해 애를 먹을일은 없다. Colors 1, ..

시각화/R 2015.02.27

▶EDA :: 계층적 클러스터링[Hierarchical clustering]

▶EDA :: 계층적 클러스터링[Hierarchical clustering] 이번 글에서는 계층적 클러스터링[Hierarchical clustering]에 대하여 살펴보고자한다. 계층적 군집방법 [Hierarchical Clustering] 고차원 또는 다차원 데이터를 시각화하는 데 있어 기본적인 방법 중 하나이며, 사용하기에 매우 간단하다. 아이디어가 대부분의 사람들에게 매우 직관적이며, 고차원의 데이터 셋에서 어떤 일이 일어나고 있는 지에 대해 빠르게 확인할 수 있는 방법이다. 군집분석[Cluster Analysis]의 사전적 정의균일한 하부 그룹에서 여러 개체들을 그들의 상호 유사성이나 계층 관계 등에 기초하여 배열하는 절차를 말한다. 출처 : [네이버지식백과] 군집분석, 지구과학사전, 2009.8..

시각화 2015.02.26

▶R의 데이터시각화 패키지 :: ggplot2 ①

▶R의 데이터시각화 패키지 :: ggplot2 ① ggplot2는 R의 그래픽패키지이다. 《R로 만드는 데이터시각화》의 저자인 전희원씨도 ggplot을 자주 활용하고 있고, Oreilly에서 펴낸 《R Graphics Cookbook》에는 ggplot2에 대한 내용이 따로 한 챕터를 구성하고 있을 만큼, R에서 시각화를 다룰때 있어서 보편적으로 많이 다루고 있는 패키지라고 할 수 있다. ggplot패키지를 개발한 것은 해들리위캠(Hadley Wichkam)교수이다. 한 특강에서 듣기로, R은 해들리위캠의 ggplot이 만들어지기 '이전'과 '이후'로 나눠질정도라고한다. ggplot2이란? 이 ggplot2패키지의 문법은 데이터기반으로 기하학적 객체들(점, 선, 막대 등)에 미적 특성(색상, 모양,크기)를..

시각화/R 2015.02.14

▶R의 시각화 패키지 :: The Lattice Plotting System

▶R의 시각화 패키지 :: The Lattice Plotting System The Lattice Plotting System in R - R의 Lattice 플로팅 시스템(이하 Lattice)은 R에서 기본 플로팅시스템과 작동방법이 많이 다르다. - Lattice는 다차원의 데이터를 사용하려고 할 때, 한번에 많은 플롯을 생성할 수 있다는 점에서 유용하다. 또한 Lattice에서는 기본 플로팅 시스템의 방법을 'mfrow'와 'mfcall'이라는 인수를 통해 활용할 수 있다. - Lattice는 높은 밀도의 플롯을 효과적으로 그려내는데 최적화 되어있으며, 그밖에 여러 목적에 따라 활용되고있다. 이글에서 'Lattice'에 대해서 다루고있는 내용 - Lattice 시스템의 기능 - Lattice 시스템의..

시각화/R 2015.02.12

▶R로만드는 데이터시각화 :: 히트맵 만들기

▶R로만드는 데이터시각화 :: 히트맵 만들기 오늘은 R을 이용하여 히트맵을 만드는 과정을 살펴보려고합니다. 위의 사진은 제가 예전에 만들었던 히트맵의 모습입니다. 제주유나이트의 개인 성적을 바탕으로 히트맵을 만들어보았었습니다. 그러면 R을 이용하여 히트맵을 만드는 과정을 다시한번 살펴보도록 하겠습니다. library(ggplot2) 예제를 위해 ggplot2 패키지를 로드해주었습니다. presidents str(presidents) 오늘 예제에서 사용할 데이터는 'presidents'입니다. str함수를 이용하여 구조를 살펴보겠습니다. 히트맵을 만들기 위해서는 지금의 형태에서 바꿔줄 필요가 있습니다. 아래와같은 방법으로 데이터를 다듬어줍니다. pres_rating

시각화/R 2014.05.27

▶R로만드는 데이터시각화 :: Hello ggplot2 - bar, histogram그리기

▶R로만드는 데이터시각화 :: Hello ggplot2 - bar, histogram그리기 오늘 살펴볼 것은 빈도수 막대그래프와 히스토그램입니다. 사용할 데이터는 'diamonds'라는 내장 데이터입니다. 데이터 형식을 먼저 살펴보겠습니다. library(ggplot2) str(diamonds) ggplot2패키지를 로드하고, diamonds의 내용을 str()g함수를 이용하여 살펴보겠습니다. [str(diamonds)로 살펴본 diamonds데이터의 정보] cut, dolor, clarity는 factor(요인)데이터이며 나머지 대부분의 데이터는 문자열(strings)데이터인 것을 확인할 수 있습니다. 이산적인 x축을 바탕으로하는 빈도수 막대그래프 이중에서 cut(factor)데이터를 바탕으로 빈도수 ..

시각화/R 2014.04.30

▶R로만드는 데이터시각화 :: Hello ggplot2 - ggplot2 시작하기

오늘 포스팅은 ggplot2에 대한 내용입니다. '기초적인 내용이 탄탄해야 응용이 가능하겠구나'라는 생각을 하고, 처음부터 다시 꼼꼼하게 정리해보려고 합니다. Hello ggplot2! R을공부하는데 있어서 'ggplot2'은 꼭 정리해야겠다는 생각을 했습니다. 다음은 ggplot2을 만든 해들리교수와, Rcookbook의 저자인 윈스턴 챙 말입니다. 기본 그래픽 시스템은 그림을 그리기 위해 좋은 툴이지만 ggplot2는 데이터를 이해하는 데 좋은 시각화 툴이다 - Hadley Wichham 단순한 그래프 이상을 그리고 싶다면 ggplot2로 갈아타는 게 현명하다. 왜냐하면 기본 그래픽 패키지에는 알아야 하는변경자와 케이스가 한 아름인데반해, ggplot2는통일된 인터페이스와 옵션들을 제공하기 때문이다...

시각화/R 2014.04.26

▶R로만드는 데이터시각화 : 기본예제 - Data import

​ R로만드는 데이터시각화 :: 기본예제 - data import [ 데이터파일 로드하기 ] 오늘 살펴볼 것은 R에서 데이터를 불러오는 과정입니다. csv, xlsx, spss등 다양한 형식에 맞추어 데이터를 불러오는 과정에대해서 꼼꼼하게 정리해두는 것이 좋을 것 같습니다^^ data import ▶구획문자로 구분된 텍스트 데이터파일 불러오기 exampleCSV

시각화/R 2014.04.26