본문내용 바로가기
MD의선택 무료배송 이벤트 사은품 한정판매 소득공제

R로 하는 빅데이터 분석: 데이터 전처리와 시각화 개념적 기초에서 심층 활용까지

개정판
김권현 지음 | 숨은원리 | 2020년 01월 14일 출간
클로버 리뷰쓰기
  • 정가 : 25,000원
    판매가 : 22,500 [10%↓ 2,500원 할인]
  • 혜택 :
    [기본적립] 1250원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2,000원 추가적립 안내 [회원혜택] 회원 등급 별, 3만원 이상 구매 시 2~4% 추가적립 안내 [리뷰적립] 리뷰 작성 시 e교환권 최대 300원 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 개정정보 : 이 도서는 가장 최근에 출간된 개정판입니다. 2019년 03월 출간된 구판이 있습니다. 구판 보기
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    09월 24일 출고 예정 배송일정 안내

알립니다.

  • 출판사 품절로 한정 수량 판매, 조기 품절 될 수 있습니다.

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
  • IT 행사도서 포함 3만원 이상 구매시 개발자 책꽂이 사은품 선..
    2021.07.16 ~ 2021.09.30
  • 데이터 시각화는 예술이자 과학이다.
    2020.07.22 ~ 2021.12.31
  • 책을 통해 성장해나가는 개발자를 응원합니다.
    2017.06.22 ~ 2025.07.31
상품상세정보
ISBN 9791196014490(1196014493)
쪽수 344쪽
크기 176 * 251 * 22 mm /625g 판형알림

책소개

이 책이 속한 분야

1. 2019년 3월, 1판. 2020년 1월, 개정판 발간!

제 1판에 있었던 실수와 오류를 수정하고, ‘날짜와 시간’, ‘수 표기 방법’ 등 새로운 자료를 추가 보완하였습니다. 개정판에서 추가된 내용은 다음과 같습니다.

● 집단별 적용 함수 mapply, sweep, rapply 추가
● 배열 관련 함수 총정리
● dplyr 최신 버전 반영
● SQL 관련 함수 소개
● 파일과 디렉토리 관련 함수 총정리

목차

서문 1

1 들어가기 3
1.1 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 R의 패키지(Packages) 5
2.1 패키지 설치 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 패키지 관련 정보 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 패키지 불러오기/확인하기/제거하기 . . . . . . . . . . . . . . . . . . 7
2.4 패키지 관리하기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5 중복되는 함수와 변수 . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3 R의 변수, 자료형, 연산/함수 9
3.1 R의 변수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.2 R의 데이터 타입(자료형) . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3 연산(Operations)과 함수(Functions) . . . . . . . . . . . . . . . . . 16
3.4 특별한 값 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4 데이터 구조 25
4.1 벡터(Vector) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 행렬(matrix), 배열(array), 데이터프레임(data.frame), 리스트(list) 37
4.3 행렬, 배열, 데이터프레임, 리스트의 부분선택하기 . . . . . . . . . . . . 42
4.4 행렬, 배열, 데이터프레임, 리스트 수정하기 . . . . . . . . . . . . . . . 46
4.5 CRUD(Create, Read, Update, Delete) . . . . . . . . . . . . . . . 47
4.6 3차 이상의 다차원 배열 . . . . . . . . . . . . . . . . . . . . . . . . . 49

5 dplyr 패키지를 활용한 데이터 가공 57

5.1 magrittr의 파이프 연산자 . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 dplyr의 방식: 부분 선택(Subsetting) . . . . . . . . . . . . . . . . . 60
5.3 dplyr의 방식 : 수정 . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4 dplyr의 기타 편의 기능 . . . . . . . . . . . . . . . . . . . . . . . . . 73

6 날짜와 시간(Date and Time) 77
6.1 R의 날짜와 시간 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.2 날짜의 표기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.3 날짜 표기 변환 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.4 날짜시간 표기 인식 . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.5 날짜, 시간 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.6 날짜(시간)의 특정한 정보 참조 . . . . . . . . . . . . . . . . . . . . . 86
6.7 날짜(시간) 갱신 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.8 활용 예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

7 팩터 자료형 91
7.1 팩터형의 중요성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.2 데이터 전처리에 있어서 팩터형 . . . . . . . . . . . . . . . . . . . . . 92
7.3 forcats 패키지 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

8 R로 데이터 읽어오기 97
8.1 R 내장 데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.2 들어가기 : write.table/read.table, save/load . . . . . . . . . . . 98
8.3 텍스트로 저장된 데이터 화일 읽기 . . . . . . . . . . . . . . . . . . . 99
8.4 EXCEL 화일 읽기 . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.5 그 밖의 통계 프로그램 데이터 화일 . . . . . . . . . . . . . . . . . . . 107

9 데이터 가공 109
9.1 집단별로 함수 적용하기 . . . . . . . . . . . . . . . . . . . . . . . . . 110
9.2 여러 데이터 프레임 합치기 . . . . . . . . . . . . . . . . . . . . . . . 118
9.3 세로형/가로형 변환 . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

10 패키지 데이터테이블(data.table) 129
10.1 package:dplyr과 package:data.table의 비교 . . . . . . . . . . . . . 129
10.2 data.table의 키(key) 활용하기 . . . . . . . . . . . . . . . . . . . . 145
10.3 data.table을 활용한 병합 . . . . . . . . . . . . . . . . . . . . . . . 149
10.4 그 밖의 특수한 기호 : .SD, .GRP, .N, .I, .BY, .EACHI, .. . . . . . . . . 158

10.5 데이터테이블 종합 . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

11 문자열(character) 167
11.1 인코딩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.2 대표적인 인코딩 방법 . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.3 인코딩 방법의 종류 . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.4 R에서 인코딩 다루기 . . . . . . . . . . . . . . . . . . . . . . . . . . 169
11.5 R에서 문자열 입력 . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
11.6 유니코드 정규화(Normalization) . . . . . . . . . . . . . . . . . . . 173
11.7 문자열의 정렬 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
11.8 문자열을 다루는 함수들 . . . . . . . . . . . . . . . . . . . . . . . . . 175
11.9 패키지 stringr을 활용한 문자열 관리 . . . . . . . . . . . . . . . . . 183

12 정규표현식 185
12.1 R과 정규표현식 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
12.2 확장정규표현식(ERE; Extended Regular Expressions) . . . . . . . 186
12.3 Perl 호환 정규표현식 . . . . . . . . . . . . . . . . . . . . . . . . . . 196
12.4 패키지 stringr, stringi . . . . . . . . . . . . . . . . . . . . . . . . 198
12.5 stringi 패키지와 정규표현식을 활용한 문자열 데이터 가공 . . . . . . . 199

13 흐름 제어와 함수 201
13.1 제어문: 조건과 반복 . . . . . . . . . . . . . . . . . . . . . . . . . . 201
13.2 함수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

14 기술 통계량 215
14.1 1변수 기술 통계량 . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
14.2 데이터 프레임의 모든 변수(컬럼)에 대해 요약통계치 구하기 . . . . . . 218

15 간편 시각화 221
15.1 간편 시각화의 예 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

16 ggplot2 227
16.1 들어가기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
16.2 시각적 맵핑(Aesthetic mapping) . . . . . . . . . . . . . . . . . . . 229
16.3 기하학적 대상(geom) . . . . . . . . . . . . . . . . . . . . . . . . . . 248
16.4 보조선(Auxillary lines) . . . . . . . . . . . . . . . . . . . . . . . . 257
16.5 좌표계(Coordinate system) . . . . . . . . . . . . . . . . . . . . . . 259

16.6 Coordinate system . . . . . . . . . . . . . . . . . . . . . . . . . . 259
16.7 범례(Legends) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
16.8 제목과 테마(Title and Theme) . . . . . . . . . . . . . . . . . . . . 267
16.9 결과 정리 및 저장 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273
16.10ggplot2(gg = Grammar of Graphics) 총정리 . . . . . . . . . . . . 275

17 연습문제 해답 279
데이터 구조 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
데이터 불러들이기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
제어와 함수 I. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

R에서 하는 벡터/행렬 연산 283
벡터연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
한 행렬 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
두 행렬의 연산 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
선형(행렬) 대수 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

A 수 표기 방법 287
A.1 국제표준 ISO 80000-1 . . . . . . . . . . . . . . . . . . . . . . . . . 287
A.2 한글 맞춤법 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
A.3 다른 나라의 수 표기 . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
A.4 R에서 수 읽기 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

B dplyr을 SQL로 번역하기 289
B.1 수기 번역 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
B.2 dbplyr 패키지를 사용한 자동 번역 . . . . . . . . . . . . . . . . . . . 292

C 화일과 디렉토리 관련 함수들 293
C.1 디렉토리 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
C.2 스크립트 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
C.3 화일 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

D R의 색, 세계 타임존 299

E 치트시트 305

출판사 서평

1. 작품소개(제1판)
이 책은 쿡북(Cookbook)이 아니다!

물론 프로그래밍 언어으로 원하는 목적을 달성하는 가장 빠른 방법은 이미 작동하는 소스 코드를 실행하는 것이다. 하지만 소스 코드를 고쳐야 한다면!?!

그 때부터는 수많은 문법오류, 논리오류(버그)에 잘 돌아가던 프로그램도 안 돌아가는 신비한 경험을 하게 된다. 그 버그란 무엇 때문에 생기는가? 실수, 수면부족, 주의 산만 등 다양한 원인이 있겠지만, 또 다른 주요 원인은 튼튼하지 못한 기초에 있다!

● NA 〉 3은 왜 NA이고, NA | TRUE... 더보기

Klover 리뷰 (0)

북로그 리뷰 (3) 전체보기 쓰러가기

북로그 리뷰는 본인 인증 후 작성 가능합니다.
책이나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 내용은 비공개 처리 될 수 있습니다.
※ 북로그 리뷰 리워드 제공 2021. 4. 1 종료
  • R로 하는 빅 데이터 분석 mi**knim | 2020-01-08 | 추천: 0 | 5점 만점에 5점
           숨은 원리에서 개정되어 나온 <r>로 하는 빅 데이터 분석>을 서평하기 전에 R 프로그램에 대해서 먼저 알아보겠습니다. R 프로그램이 무엇인지 알아야 빅데이터 분석에 왜 R 프로그램을 사용하는지, R 프로그램을 배워야 하는 이유를 알테니까요.</r> ... 더보기
  • R로 하는 데이터분석 xn**is | 2020-01-07 | 추천: 0 | 5점 만점에 5점
    <R>로 하는 빅데이터 분석> 개정판이 나왔네요. 개정판이 1년도 안되어 나온것은 그만큼 빠르게 변하는 상황을 반영한것일수도 있고, 저자가 1판을 내고, 아쉬웠던 부분을 보강한 것일수도 있습니다. 그만큼 저자분이 이 책에 대해 애정을 보이신 상황일겁니다. 그렇다고 1판과 개정판과 사이에 엄청난 차이가 있는 것은 아닙니다. 데이터구조, 날짜와 시간,문자열 등을 보완했고, 부록부분을 충원시켰습니다. 좀더 완벽해지기 위한 조치겠네요. 이 책은 데이터를 한번이라도 처리해보신 분은 알겠지만 전처리가 일의 80%는 되... 더보기
  • R로 하는 빅데이터 분석 ht**sog | 2020-01-05 | 추천: 0 | 5점 만점에 5점
    프로그래밍을 통해서 요즘 할 수 있는 일들이 많은 것 같아서 재미를 많이 붙이고 있었는데, 이번에 R 을 설치해보고 입문해보게 되었습니다. 아래 화면과 같이 간단히 R과 R studio 등을 설치하고 용도에 따라 패키지 등을 설치해서 책에 나오는 예문을 따라 공부하면 되는데, 기존 파이썬에 잘 나와 있는 프로그램들보다 더 콘솔 위주인 느낌이 들지만, 계속해서 공부해나가면 감을 잡을 것이라 생각됩니다. 단순히 보고싶은 데이터를 분석하고 시각화 하는데 유용하다는 사실은 알았는데, 이 분야에 잘 모르다보니 구체적으로 들어가면 어려운 공부... 더보기

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매 후 문장수집 작성 시, 리워드를 제공합니다. 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함
바로가기
  • 우측 확장형 배너 2
  • 우측 확장형 배너 2
최근 본 상품