본문내용 바로가기
MD의선택 무료배송 소득공제

R로 하는 빅데이터 분석: 데이터 전처리와 시각화 개념적 기초에서 심층 활용까지

김권현 지음 | 숨은원리 | 2019년 03월 01일 출간
클로버 리뷰쓰기
  • 정가 : 25,000원
    판매가 : 22,500 [10%↓ 2,500원 할인]
  • 혜택 :
    [기본적립] 1250원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2,000원 추가적립 안내 [회원혜택] 회원 등급 별, 3만원 이상 구매 시 2~4% 추가적립 안내 [리뷰적립] 리뷰 작성 시 e교환권 최대 300원 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 개정정보 : 2020년 01월 출간된 개정판이 있습니다. 개정판 보기
  • 도서상태 : 절판
상품상세정보
ISBN 9791196014476(1196014477)
쪽수 326쪽
크기 177 * 250 * 24 mm /750g 판형알림

책소개

이 책이 속한 분야

이 책은 쿡북(Cookbook)이 아니다!

물론 프로그래밍 언어으로 원하는 목적을 달성하는 가장 빠른 방법은 이미 작동하는 소스 코드를 실행하는 것이다. 하지만 소스 코드를 고쳐야 한다면!?!

그 때부터는 수많은 문법오류, 논리오류(버그)에 잘 돌아가던 프로그램도 안 돌아가는 신비한 경험을 하게 된다. 그 버그란 무엇 때문에 생기는가? 실수, 수면부족, 주의 산만 등 다양한 원인이 있겠지만, 또 다른 주요 원인은 튼튼하지 못한 기초에 있다!

● NA > 3은 왜 NA이고, NA | TRUE는 왜 TRUE인가?
● 데이터테이블(data.table)의 복잡한 문법은 어떻게 이해해야 하는가?
● 정규표현식의 메타문자는 무엇이고, 어떻게 다루어야 하는가?
● ggplot2의 수많은 옵션은 어떻게 외워야 할까?

패키지, 벡터, 데이터프레임 등 기초부터 데이터테이블, 정규표현식, ggplot2까지
데이터 전처리와 시각화를 위한 핵심을 모두 담았다!

상세이미지

R로 하는 빅데이터 분석: 데이터 전처리와 시각화 도서 상세이미지

목차

서문

1 들어가기
1.1 R … … … … … … … … … … … … 8

2 R의 패키지(Packages)
2.1 패키지 설치 … … … … … … … … … … . 9
2.2 패키지 관련 정보 … … … … … … … … … . 10
2.3 패키지 불러오기/확인하기/제거하기 … … … … … … 11
2.4 패키지 관리하기 … … … … … … … … … . 12
2.5 중복되는 함수와 변수 … … … … … … … … . . 12

3 R의 변수, 자료형, 연산/함수
3.1 R의 변수 … … … … … … … … … … . . 13
3.2 R의 데이터 타입(자료형) … … … … … … … … 17
3.3 연산(Operations)과 함수(Functions) … … … … … . . 20
3.4 특별한 값 … … … … … … … … … … . . 26

4 데이터 구조
4.1 벡터(Vector) … … … … … … … … … … 31
4.2 데이터 구조에 따른 생성, 참조, 수정, 추가, 삭제 함수 … … … . 43
4.3 CRUD(Create, Read, Update, Delete) … … … … … 51
4.4 3+차원의 배열 … … … … … … … … … . . 53

5 dplyr 패키지를 활용한 데이터 가공
5.1 magrittr의 파이프 연산자 … … … … … … … . . 59
5.2 dplyr의 방식: 부분 선택(Subsetting) … … … … … . . 62
5.3 dplyr의 방식 : 수정 … … … … … … … … . . 68
5.4 dplyr의 기타 편의 기능 … … … … … … … … . 74

6 날짜와 시간(Date and Time)
6.1 날짜의 표기 … … … … … … … … … … . 80
6.2 날짜 표기 변환 … … … … … … … … … . . 81
6.3 날짜시간 표기 인식 … … … … … … … … … 82
6.4 날짜, 시간 연산 … … … … … … … … … . . 89
6.5 날짜(시간)의 특정한 정보 참조 … … … … … … … 90
6.6 날짜(시간) 갱신 … … … … … … … … … . 90
6.7 활용예 … … … … … … … … … … … 93

7 팩터형 데이터타입
7.1 팩터형의 중요성 … … … … … … … … … . 96
7.2 데이터 전처리에 있어서 팩터형 … … … … … … … 96
7.3 forcats 패키지 … … … … … … … … … . . 98

8 R로 데이터 읽어오기
8.1 R 내장 데이터 … … … … … … … … … . . 101
8.2 들어가기 : write.table/read.table, save/load … … … . . 102
8.3 텍스트로 저장된 데이터 화일 읽기 … … … … … … . 103
8.4 EXCEL 화일 읽기 … … … … … … … … … 110
8.5 그 밖의 통계 프로그램 데이터 화일 … … … … … … . 111

9 데이터 가공
9.1 집단별로 함수 적용하기 … … … … … … … … . 114
9.2 여러 데이터 프레임 합치기 … … … … … … … . . 119
9.3 세로형/가로형 변환 … … … … … … … … … 125

10 패키지 데이터테이블(data.table)
10.1 package:dplyr과 package:data.table의 비교 … … … … . 127
10.2 data.table의 키(key) 활용하기 … … … … … … . . 143
10.3 data.table을 활용한 병합 … … … … … … … . . 148
10.4 그 밖의 특수한 기호 : .SD, .GRP, .N, .I, .BY, .EACHI … … … . 157
10.5 데이터테이블 종합 … … … … … … … … … 165

11 문자열(character)
11.1 인코딩 … … … … … … … … … … … 167
11.2 대표적인 인코딩 방법 … … … … … … … … . . 168
11.3 그 밖의 인코딩 방법 … … … … … … … … … 168
11.4 R에서 인코딩 다루기 … … … … … … … … . . 169
11.5 R에서 문자열 입력 … … … … … … … … … 171
11.6 유니코드 정규화(Normalization) … … … … … … . 173
11.7 문자열의 정렬 … … … … … … … … … … 174
11.8 문자열을 다루는 함수들 … … … … … … … … . 176
11.9 패키지 stringr을 활용한 문자열 관리 … … … … … . . 182

12 정규표현식
12.1 R과 정규표현식 … … … … … … … … … . . 185
12.2 확장정규표현식(ERE; Extended Regular Expressions) … … . 186

13 흐름 제어와 함수
13.1 제어문: 조건과 반복 … … … … … … … … . . 201
13.2 함수 … … … … … … … … … … … . 209

14 기술 통계량
14.1 1변수 기술 통계량
14.2 데이터 프레임의 모든 변수(컬럼)에 대해 요약통계치 구하기

15 간편 시각화
15.1 간편 시각화의 예 … … … … … … … … … . 222

16 ggplot2
16.1 들어가기 … … … … … … … … … … . . 227
16.2 시각적 맵핑(Aesthetic mapping) … … … … … … . 229
16.3 기하학적 대상(geom) … … … … … … … … . . 248
16.4 보조선(Auxillary lines) … … … … … … … … 257
16.5 좌표계(Coordinate system) … … … … … … … . 259
16.6 범례(Legends) … … … … … … … … … . . 265
16.7 제목과 테마(Title and Theme) … … … … … … . . 267
16.8 결과 정리 및 저장 … … … … … … … … … . 273
16.9 ggplot2(gg = Grammar of Graphics) 총정리 … … … … 275

17 연습문제 해답
데이터 불러들이기 … … … … … … … … … … 279
제어와 함수 I… … … … … … … … … … … 282

부록 1. R에서 하는 벡터/행렬 연산
벡터연산 … … … … … … … … … … … . . 283
한 행렬 연산 … … … … … … … … … … … 283
두 행렬의 연산 … … … … … … … … … … . . 284
선형(행렬) 대수 … … … … … … … … … … . 285

부록 2. R의 색, 세계 타임존

부록 3. 치트시트

출판사 서평

이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 전처리 과정에서도 논리적 오류를 범하지 않도록 한다. 분산처리 없이 빅데이터 처리를 할 수 있는 마지막 보류인... 더보기

Klover 리뷰 (0)

북로그 리뷰 (4) 전체보기 쓰러가기

북로그 리뷰는 본인 인증 후 작성 가능합니다.
책이나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 내용은 비공개 처리 될 수 있습니다.
※ 북로그 리뷰 리워드 제공 2021. 4. 1 종료
  • R로 하는 빅데이터 분석 sk**3i | 2019-03-09 | 추천: 0 | 5점 만점에 5점
    IT 기술이 발달하면서 수집할 수 있는 데이터의 양이 많아지고, 빅데이터의 중요성이 날로 커져왔다. 회사에서 웹 관련 업무를 수행하면서 얻게 되는 데이터들을 어떻게 하면 유의미하게 활용할 수 있을까 고민하면서 빅데이터를 공부하고 있다. 예전에는 통계 패키지라하면 SPSS와 SAS 등이 주로 언급되었는데 이제는 R과 파이썬이 많이 쓰이는 것 같다. 특히 R은 무료로 제공되기에 실제 연구자들이 많이 사용하는 것으로 알고 있다.   기존에 R관련된 프로그래밍 서적을 보았는데, 주어진 튜토리얼을 진행하는... 더보기
  • 4차 산업 시대에서 '빅 데이터'는 매우 핫한 화두이다. 그래서 우리는 빅 데이터가 정확히 무엇인지 잘 알지는 못하지만 그것이 중요하다는 것을 잘 알고 있다. 사실 빅 데이터는 그 단어의 뜻대로 엄청난 양의 방대한 데이터를 의미할 것이다. 그렇다면 그 방대한 데이터가 왜 중요하다는 것일까. 그 데이터를 잘 가공하여 원하는 정보를 얻어냈을 때의 파급력이 매우 크기 때문이다. 어찌 보면 우리가 살고 있는 환경 자체가 데이터 그 자체일 것이다. 어제 킨텍스에 있었던 박람회에 갔었는데 근 시일 내에 자율주행차가 센서나 레이더 혹은 라이더... 더보기
  • IT계열이지만 빅데이터 분야와는 다른 쪽으로 일을 하고 있습니다. 그러나 향후 신기술 중 가장 관심있는 분야가 빅데이터 분야라서 개인적으로 공부해보겠다는 결심을 했습니다. 이것저것 검색을 통해 빅데이터 분석을 위해 최근 가장 각광받고 있는 것이 R이라는 것을 알게 되었습니다. 그리고 R에 대해 공부할 수 있는 책을 찾아보다 이 책을 발견했죠. 저자는 '전체적인 맥락을 알고 큰 그림을 그릴 수 있다면 훨씬 수월하다'는 말처럼 R에 대해 좀 더 쉽게 이해할 수 있도록 책을 썼습니다. 1장에서는 R의 간단한 특성을 소개... 더보기
  • 충실한 R학습서 xn**is | 2019-03-06 | 추천: 0 | 5점 만점에 5점
    R은 통계학에서 발전한 통계분석 도구라고 합니다. 4차산업혁명의 한 중추인 빅데이터를 놓고 보면 빅데이터의 중요핵심인 데이터분석을 R이 맡고 있습니다. 결국 R을 익숙하게 익혀야 가능할겁니다. 물론 데이터분석은 R만 하는건 아닐겁니다. 파이썬도 가능하고, SQL로만으로도 가능하다고 합니다. 하지만 데이터분석도구로 칼날처럼 시퍼렇게 방법론을 가다듬어온 R은 무조건 익혀야할 기본 도구일겁니다. 로 하는 빅데이터 분석은 빅데이터분석을 하는데 있어서 데이터를 전처리를 하고 결과가 나오면 이해하기쉽게 시각화하는 방법까지 소개하는... 더보기

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매 후 문장수집 작성 시, 리워드를 제공합니다. 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함
바로가기
  • 우측 확장형 배너 2
  • 우측 확장형 배너 2
최근 본 상품