본문내용 바로가기
무료배송 이벤트 소득공제

R로 배우는 실무 데이터 과학 실용 데이터를 이용한 데이터 분석 실습!

니나 줌멜 , 존 마운트 지음 | 임대경 옮김 | 제이펍 | 2017년 12월 15일 출간
클로버 리뷰쓰기

이 책의 다른 상품 정보

  • 정가 : 30,000원
    판매가 : 27,000 [10%↓ 3,000원 할인]
  • 통합포인트 :
    [기본적립] 1,500원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2천원 추가적립 안내 [회원혜택] 실버등급 이상, 3만원 이상 구매 시 2~4% 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    11월 30일 출고 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내 바로드림 혜택
    휴일에는 바로드림 픽업으로 더 빨리 받아 보세요. 바로드림 혜택받고 이용하기

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 제이펍의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2020.12.31
상품상세정보
ISBN 9791188621002(1188621009)
쪽수 464쪽
크기 190 * 246 * 26 mm /900g 판형알림
원서명/저자명 Practical Data Science with R/Nina Zumel

책소개

이 책이 속한 분야

데이터 탐색에서 모델링, 결과 전달에 이르기까지 데이터 과학의 모든 프로세스를 담았다!

이 책은 실무 비즈니스에 사용할 수 있는 R 프로그래밍 언어와 유용한 통계 기술 적용 방법을 보여준다. 마케팅, 비즈니스 인텔리전스 및 의사 결정 예를 사용하여 A/B 테스트 같은 설계 방법, 예측 모델 작성 방법 및 모든 수준의 잠재 고객에게 결과를 제시하는 방법 등을 제대로 보여준다.

상세이미지

R로 배우는 실무 데이터 과학 도서 상세이미지

목차

PART I 데이터 과학 소개
CHAPTER 1 데이터 과학 프로세스 3
1.1 데이터 과학 프로젝트에서의 역할 3
 1.1.1 프로젝트에서의 역할 4
1.2 데이터 과학 프로젝트의 단계 7
 1.2.1 목표 설정 8
 1.2.2 데이터 수집과 관리 9
 1.2.3 모델링 12
 1.2.4 모델 평가와 비평 14
 1.2.5 프레젠테이션과 문서화 15
 1.2.6 모델 배포와 유지보수 17
1.3 기대치 설정 17
 1.3.1 모델 성능 상하한선 결정 18
1.4 요약 20

CHAPTER 2 R 프로그램에 데이터 적재하기 21
2.1 파일에 있는 데이터 다루기 22
 2.1.1 파일 또는 URL로부터 잘 구조화된 데이터 작업하기 22
 2.1.2 덜 구조화된 데이터에 R 사용하기 25
2.2 관계형 데이터베이스를 이용하여 작업하기 28
 2.2.1 실무 예제 29
 2.2.2 R에 데이터베이스 데이터 입력하기 34
 2.2.3 PUMS data로 작업하기 36
2.3 요약 39

CHAPTER 3 데이터 탐색하기 41
3.1 통계 요약치를 이용하여 문제 파악하기 43
 3.1.1 데이터 요약을 통해 전형적인 데이터 문제 파악하기 44
3.2 그래프와 시각화를 통해 문제 제거하기 48
 3.2.1 단일변수에서 시각적으로 분산 점검하기 51
 3.2.2 두 변수의 관계를 시각적으로 확인하기 60
3.3 요약 71

CHAPTER 4 데이터 관리 72
4.1 데이터 정리하기 72
 4.1.1 결측치 다루기 73
 4.1.2 데이터 변환 78
4.2 모델링과 데이터 유효성 검증을 위한 샘플링 86
 4.2.1 테스트와 트레이닝의 분할 86
 4.2.2 샘플 그룹 열 만들기 87
 4.2.3 레코드 그룹화 88
 4.2.4 데이터 출처 90
4.3 요약 90

PART II 모델링 기법
CHAPTER 5 모델 선택과 평가 93
5.1 머신러닝 과제에 문제 매핑하기 95
 5.1.1 분류 문제 해결하기 95
 5.1.2 스코어링 문제 해결하기 97
 5.1.3 예측 결과 없이 일하기 98
 5.1.4 문제와 방법 매핑하기 101
5.2 모델 평가 103
 5.2.1 분류 모델 평가하기 104
 5.2.2 스코어링 모델 평가하기 110
 5.2.3 확률 모델 평가하기 113
 5.2.4 랭킹 모델 평가하기 118
 5.2.5 클러스터 모델 평가하기 118
5.3 모델 검증하기 121
 5.3.1 일반적인 모델 문제 확인하기 122
 5.3.2 모델 건전성 정량화 123
 5.3.3 모델 품질 보증 124
5.4 요약 127

CHAPTER 6 메모라이제이션 128
6.1 KDD와 KDD 컵 2009 128
 6.1.1 KDD 컵 2009 데이터로 시작하기 129
6.2 단일변수 모델 구축하기 131
 6.2.1 범주형 특성 사용하기 132
 6.2.2 숫자형 특성 사용하기 135
 6.2.3 교차 검증으로 과적합 정도 측정하기 137
6.3 다항변수를 이용하여 모델 구축하기 139
 6.3.1 변수 선택 139
 6.3.2 의사결정나무 사용하기 141
 6.3.3 최근접 이웃 메서드 사용하기 145
 6.3.4 나이브 베이즈 사용하기 149
6.4 요약 153

CHAPTER 7 선형 회귀와 로지스틱 회귀 155
7.1 선형 회귀 사용하기 156
 7.1.1 선형 회귀 이해하기 156
 7.1.2 선형 회귀 모델 만들기 160
 7.1.3 예측하기 161
 7.1.4 선형 회귀에서 관계 찾기와 조언 추출하기 165
 7.1.5 모델 요약값 해석과 계수 품질 규정하기 167
 7.1.6 선형 회귀에서 꼭 기억할 내용 173
7.2 로지스틱 회귀 사용하기 173
 7.2.1 로지스틱 회귀 이해하기 174
 7.2.2 로지스틱 회귀 모델 만들기 176
 7.2.3 예측 모델 만들기 177
 7.2.4 로지스틱 모델에서 관계 찾기와 조언 추출하기 181
 7.2.5 모델 요약값 해석과 계수 품질 규정하기 183
 7.2.6 로지스틱 회귀에서 꼭 기억할 내용 192
7.3 요약 192

CHAPTER 8 비지도 방법론 194
8.1 클러스터 분석 195
 8.1.1 거리 195
 8.1.2 데이터 준비하기 198
 8.1.3 hclust()를 이용한 계층적 클러스터링 199
 8.1.4 k-means 알고리즘 211
 8.1.5 클러스터에 새로운 포인트 추가하기 216
 8.1.6 클러스터링에서 꼭 기억할 내용 219
8.2 연관 규칙 219
 8.2.1 연관 규칙 개요 219
 8.2.2 예제 221
 8.2.3 arules 패키지를 이용한 연관 규칙 마이닝 222
 8.2.4 연관 규칙에서 꼭 기억할 내용 231
8.3 요약 232

CHAPTER 9 고급 탐색법 233
9.1 배깅과 랜덤 포레스트를 이용하여 훈련 분산 감소시키기 234
 9.1.1 배깅을 이용하여 예측 성능 높이기 235
 9.1.2 랜덤 포레스트를 이용하여 예측력 향상시키기 238
 9.1.3 배깅과 랜덤 포레스트에서 꼭 기억할 내용 243
9.2 일반화 가법 모델로 비단조 관계 학습하기 243
 9.2.1 GAM 이해하기 243
 9.2.2 일차원 회귀 예제 245
 9.2.3 비선형 관계 추출 249
 9.2.4 실제 데이터로 GAM 사용하기 251
 9.2.5 로지스틱 회귀에 GAM 사용하기 254
 9.2.6 GAM에서 꼭 기억할 내용 256
9.3 데이터 분리를 증가시키기 위해 커널 메서드 사용하기 256
 9.3.1 커널 함수 이해하기 257
 9.3.2 문제에 명시적 커널 사용하기 261
 9.3.3 커널에서 꼭 기억할 내용 265
9.4 서포트 벡터 머신으로 복잡한 결정 경계 모델링하기 265
 9.4.1 서포트 벡터 머신 이해하기 266
 9.4.2 인위적 예제 데이터에 SVM 적용하기 269
 9.4.3 실데이터 기반에서 SVM 사용하기 273
 9.4.4 서포트 벡터 머신에서 꼭 기억할 내용 276
9.5 요약 276

PART III 산출물 배포
CHAPTER 10 문서화와 배포 281
10.1 버즈 데이터셋 282
10.2 knitr을 사용하여 마일스톤 문서 만들기 283
 10.2.1 knitr이란? 284
 10.2.2 knitr 세부사항 288
 10.2.3 knitr을 이용하여 버즈 데이터 문서화하기 289
10.3 실행 문서를 위한 주석과 버전 관리 사용하기 293
 10.3.1 효율적인 주석 작성하기 293
 10.3.2 레코드 히스토리를 위해 버전 컨트롤 사용하기 294
 10.3.3 프로젝트 탐색을 위한 버전 컨트롤 사용하기 301
 10.3.4 작업 공유를 위해 버전 관리 사용하기 306
10.4 모델 배포하기 309
 10.4.1 R HTTP 서비스로 모델 배포하기 310
 10.4.2 익스포트로 모델 배포하기 313
 10.4.3 모델 배포에서 꼭 기억할 내용 314
10.5 요약 316

CHAPTER 11 효과적인 발표 자료 만들기 317
11.1 프로젝트 스폰서에게 결과 발표하기 318
 11.1.1 프로젝트 목표 요약하기 319
 11.1.2 프로젝트 결과 명시하기 320
 11.1.3 세부사항 채우기 322
 11.1.4 개선 사항과 향후 과제 토론하기 324
 11.1.5 프로젝트 스폰서 프레젠테이션에서 꼭 기억할 내용 325
11.2 최종 사용자에게 프레젠테이션하기 325
 11.2.1 프로젝트 목표 요약하기 326
 11.2.2 모델이 사용자의 워크플로에 어떻게 적용되는지 보여주기 327
 11.2.3 모델 사용법 보여주기 329
 11.2.4 최종 사용자 프레젠테이션에서 꼭 기억할 내용 331
11.3 동료 데이터 과학자에게 작업 결과 프레젠테이션하기 331
 11.3.1 문제 언급하기 332
 11.3.2 관련 작업에 대해 의논하기 333
 11.3.3 우리의 접근 방법에 대해 의논하기 333
 11.3.4 향후 작업 의논하기 334
 11.3.5 동료 프레젠테이션에서 꼭 기억할 내용 335
11.4 요약 337

APPENDIX A R과 기타 도구로 작업하기 339
A.1 도구 설치하기 339
 A.1.1 R 설치하기 339
 A.1.2 R 패키지 시스템 340
 A.1.3 Git 설치하기 340
 A.1.4 RStudio 설치하기 340
 A.1.5 R 관련 자료 341
A.2 R 시작하기 342
 A.2.1 R의 주요 기능 343
 A.2.2 R의 기본 데이터 유형 348
 A.2.3 HTTPS로 데이터 로딩하기 355
A.3 R로 데이터베이스 사용하기 356
 A.3.1 H2 데이터베이스 엔진 획득하기 356
 A.3.2 SQuirreL SQL 사용하기 356
 A.3.3 SQL 스크루드라이버 설치하기 360
 A.3.4 SQL 변환 작업 예제 361
 A.3.5 SQL로 생각하는 법 367

APPENDIX B 중요한 통계적 개념 369
B.1 분산 369
 B.1.1 정규분포 369
 B.1.2 R의 확률분포 명명 규칙 요약 374
 B.1.3 로그 정규분포 375
 B.1.4 이항분포 379
 B.1.5 분산 관련 기타 R 도구 384
B.2 통계 이론 384
 B.2.1 통계 철학 385
 B.2.2 A/B 테스트 388
 B.2.3 검정력 394
 B.2.4 특수 통계 테스트 397
B.3 데이터 통계 보기 399
 B.3.1 표본추출 편향 399
 B.3.2 누락된 변수 편향 402

APPENDIX C 데이터 탐색을 위한 더 많은 도구와 아이디어 408
C.1 더 많은 도구 409
 C.1.1 R 그 자체 409
 C.1.2 다른 언어 409
 C.1.3 빅데이터 도구 410
C.2 기타 아이디어 411
 C.2.1 적응 학습 411
 C.2.2 통계 학습 412
 C.2.3 컴퓨터 과학 머신러닝 412
 C.2.4 베이지안 방법론 413
 C.2.5 통계학 413
 C.2.6 부스팅 413
 C.2.7 시계열 413
 C.2.8 도메인 지식 414

찾아보기 416

추천사

짐 포르작(시니어 데이터 과학자)

당신이 초보 데이터 과학자이거나 데이터 과학자가 되고 싶은 학생이라면 이 책이 그 시작을 위한 좋은 토대가 될 것이다. 이미 업무에서 데이터 과학을 다루고 있는 종사자라면 부족한 지식을 보충해 줄 것이며, 심지어 일상적으로 ... 더보기

책 속으로

데이터 과학 프로젝트에서 스폰서 다음으로 중요한 역할은 데이터 과학자다. 데이터 과학자는 프로젝트 수행을 위한 필수적인 모든 단계에 책임을 지고 있다. 또한 프로젝트의 전략을 설정하고, 고객에게 지속적으로 통지해야 하는 역할도 해야 한다. 데이터 과학자는 프로젝트의 단계를 계획하고, 데이터 원천과 사용할 도구를 선정한다. 따라서 기술 요소를 선정하기 때문에 통계학과 머신러닝에 대해 능통해야 한다. 프로젝트의 진행자로서 프로젝트를 계획하고 추진하는 역할도 해야 한다.
_6쪽

프로젝트에 너무 깊이 들어가기 전에 비즈니스 목표를 ... 더보기

출판사 서평

데이터 탐색에서 모델링, 결과 전달에 이르기까지
데이터 과학의 모든 프로세스를 담았다!

비즈니스 분석가와 개발자는 점점 더 중요한 비즈니스 데이터를 수집하고, 큐레이팅하고, 분석하고 보고한다. R 언어와 관련 도구들은 이런 과중한 업무를 학문적 이론이나 고급 수학을 적용하지 않는 일상적인 데이터 과학 작업으로 처리하는 손쉬운 방법을 제공한다.

이 책은 실무 비즈니스에 사용할 수 있는 R 프로그래밍 언어와 유용한 통계 기술 적용 방법을 보여준다. 마케팅, 비즈니스 인텔리전스 및 의사 결정 예를 사용하여 A/B 테스트 같은... 더보기

Klover 리뷰 (0)

북로그 리뷰 (1) 전체보기 쓰러가기

도서 구매 후 리뷰를 작성하시면
결제 90일 이내 300원, 발송 후 5일 이내 400원, 이 상품의 첫 리뷰 500원의 포인트를 드립니다.

포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
북로그 리뷰는 본인인증을 거친 회원만 작성 가능합니다.
(※ 외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외) 안내
  • R로 배우는 실무 데이터 과학   안타깝게도 R을 한 번도 접해 본 적이 없는 초보에게는 적당하지 않은 책이라고 생각되며, 책을 읽으면서 왜 제목이 실무 데이터 과학이었는지 다시 한 번 실감하게 되었다. 책에 대상독자에 대해 설명해 둔 페이지에 보면 자세히 설명되어 있듯이, 이 책은 단순히 R을 배워보고자 하는 입문자가 아니라 R 통계 시스템에 대한 어느 정도의 지식이 있는 사람들, 또는 기본 통계 개념에 대한 숙지가 선행된 사람들에게 도움이 되는 책이다.   ... 더보기

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매도서의 문장수집을 기록하면 통합포인트 적립 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품