본문내용 바로가기
MD의선택 무료배송 이벤트 경품

R을 활용한 머신 러닝 R로 머신 러닝 알고리즘 작성, 데이터 준비, 데이터 예측 기법 깊이 파기

acorn+PACKT 시리즈 | 2판
브레트 란츠 지음 | 윤성진 옮김 | 에이콘출판 | 2017년 09월 15일 출간 이 책의 개정정보 : 2014년 출간

이 책의 다른 상품 정보

  • 정가 : 36,000원
    판매가 : 32,400 [10%↓ 3,600원 할인]
  • 제휴할인가 : 24,300 교보-롯데카드 최대 25% 청구할인 카드/포인트 안내
  • 통합포인트 :
    [기본적립] 1,800원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 :
    naver네이버페이 결제 시 무조건 1% 추가 적립 payco페이코 결제 시 최대 1만원 적립 okcashbag 실 결제 금액의 0.5% 적립 안내
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    지금 주문하면 내일(24일,금) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 영업점에서 직접 수령 안내
행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
닫기
  • 스무 살 패브릭 포스터 증정 O tvN 어쩌다 어른 X 교보문고 단독혜택
  • 어린이 가을독서 추천도서전
  • 가을입맛 사로잡기
  • 행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
  • 유아/어린이/가정육아 이달의 기대신간
  • 올재 클래식스 100권 완간! 시리즈의 정수만 모은, 올재 셀렉션즈 단독 판매
  • 자기계발 메인이벤트
  • 경제경영 메인이벤트
  • 행사도서 포함, 2만원이상 구매시 택 1 (1500P 차감)
  • 나만의 경쟁력, 동양고전 김원중 명품고전 독서대 증정
  • 비모 벽시계

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 에이콘의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2019.12.31
  • 리드잇 IT칼럼 및 예약판매중인 책을 한 곳에서 보실 수 있습니..
    2017.11.22 ~ 2018.12.31
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791161750538(1161750533)
쪽수 576쪽
크기 189 * 236 * 28 mm /1043g 판형알림
이 책의 원서 Machine Learning with R - Second Edition/Lantz, Brett

책소개

이 책이 속한 분야

『R을 활용한 머신 러닝』을 읽다 보면 ‘머신 러닝이 이렇게 쉬운 거였어?’라는 생각이 들기도 하고, 수학이나 프로그래밍 언어를 잘 몰랐어도 직관적으로 머릿속에 쏙쏙 들어오는 머신 러닝 개념에 흥미를 느끼고 있는 자신을 발견하게 될 것이다. 몇 줄의 R 코드로 머신 러닝이 어떻게 작동되는지 눈으로 직접 확인할 수 있고 최신의 기법까지 내 손으로 직접 짜 볼 수 있는 짜릿한 경험과 자신감을 제공해 주는 것이 이 책의 매력이다.

이 책의 총서

총서 자세히 보기

저자소개

저자 : 브레트 란츠

저자 브레트 란츠(Brett Lantz)는 혁신적인 데이터 방법을 이용해 인간의 행동을 이해하고자 10년 이상을 보냈다. 숙련된 사회학자로서 10대들의 소셜 네트워크 웹사이트 프로파일의 대규모 데이터베이스를 연구하면서 처음으로 머신 러닝에 매료됐다. 그 이후로 휴대폰 통화 의료 청구 데이터 자선 활동 등의 여러 학문에 걸친 연구를 진행해왔다. 가족과 시간을 보내고 대학 스포츠를 하고 닥스훈트와 즐겁게 지낼 때가 아니면 데이터에서 통찰력을 찾는 데 관한 지식을 공유하는 전용 웹사이트인 http://dataspelunking.com을 관리한다.

역자 : 윤성진

역자 윤성진은 KAIST 전산학과에서 석사 학위를 취득하고, 약 22년 동안 LG전자, 보험넷, 엑센츄어, 티맥스소프트, LUXROBO에서 연구개발, 컨설팅, 제품기획, 전략기획 분야에서 일을 해 왔다. 최근 5년 동안, 티맥스소프트에서 연구기획 실장 및 수석 제품기획자로 다양한 데이터 및 미들웨어 관련 소프트웨어 제품기획을 했으며 LUXROBO에서 모듈형 로봇 플랫폼 제품기획과 CSO로서 사업 전략을 수립했다.

작가의 말

★ 지은이의 말 ★
머신 러닝의 핵심은 정보를 실행 가능한 지능으로 변환하는 알고리즘과 관련이 있다. 이러한 사실 때문에 머신 러닝은 요즘과 같은 빅데이터 시대에 잘 맞다. 머신 러닝이 없었다면 정보의 방대한 흐름을 따라 잡기가 거의 불가능하다. (교차 플랫폼, 비용이 들지 않는 통계 프로그래밍 환경인) R의 명성이 높아지고 있어서 머신 러닝을 시작하기에 지금 같은 적기는 없을 것이다. R은 데이터 통찰력을 찾을 수 있게 도와주는 강력하고 배우기 쉬운 툴셋을 제공한다. 이 책에서는 실습 사례와 내부 핵심 엔진의 작동 방식을 이해하는 데 필요한 기초 이론을 결합해서 독자의 프로젝트에 머신 러닝을 적용할 때 필요한 모든 지식을 제공한다.

★ 옮긴이의 말★
평소에 어떤 것이 너무 궁금해서 공부는 하고 싶은데 "과연 할 수 있을까" 걱정만 하다가, 어느 날 아주 우연히 어떤 글이나 책을 보고 "아! 이렇게 쉬운 거였어?"하며 아주 허탈해한 적이 있을 것이다. 아마도 머신 러닝을 시작하고 싶은 많은 분께 이 책이 그런 경험을 선사하지 않을까 생각한다.
머신 러닝이 산업 전반에 빠르게 확산되는 중이고 뛰어난 성과를 보여줄 것이라는 기대감이 급격하게 상승하고 있기 때문에 이제는 머신 러닝을 IT 분야의 소수를 위한 것으로 취급하고 무시할 수는 없다. 그런데 막상 머신 러닝을 배우려면 선형 대수, 확률 통계, 미적분, 프로그래밍 언어와 같은 것들을 알아야 한다고 하니 공부를 시작하기가 영 부담스럽기만 할 것이다.
이 책은 수학이나 프로그래밍 언어에 대한 깊은 지식 없이도 머신 러닝의 개념을 직관적으로 이해하고 어떻게 활용하면 되는지를 아주 쉽게 설명해준다. 간결한 몇 줄의 R 코드로 머신 러닝의 존재감을 입증하면서 말이다. 그렇다고 결코 가볍지만은 않은 것이 이 책의 매력이다. 최신 기법과 기술까지 놓치지 않는 섬세함으로 독자들의 지적 욕구를 충분히 채워줄 것이다.
머신 러닝을 즐겁게 시작하고 싶은 독자분들께 이 책을 추천해본다.

목차

1장. 머신 러닝 소개
__머신 러닝의 기원
__머신 러닝의 사용과 남용
____머신 러닝 성공 사례
____머신 러닝의 한계
____머신 러닝의 윤리
__기계의 학습 방법
____데이터 저장소
____추상화
____일반화
____평가
__실전 머신 러닝
____입력 데이터 타입
____머신 러닝 알고리즘 타입
____입력 데이터와 알고리즘 매칭
__R을 이용한 머신 러닝
____R 패키지 설치
____패키지 로딩과 언로딩
__요약

2장. 데이터의 관리와 이해
__R 데이터 구조
____벡터
____팩터
____리스트
____데이터 프레임
____행렬과 배열
__R을 이용한 데이터 관리
____데이터 구조 저장, 로드, 제거
____CSV 파일에서 데이터 가져오기와 저장하기
__데이터 탐색과 이해
____데이터 구조 탐색
____수치 변수 탐색
______중심 경향 측정: 평균과 중앙값
______분산 측정: 사분위수와 다섯 숫자 요약
______수치 변수의 시각화: 상자그림
______수치 변수 시각화: 히스토그램
______수치 데이터의 이해:균등 분포와 정규 분포
______분산 측정:분산과 표준 편차
__범주 변수 탐색
____중앙화 경향 측정: 모드
__변수 간의 관계 탐색
____관계 시각화: 산포도
____관계 관찰: 이원교차표
__요약

3장. 게으른 학습: 최근접 이웃 분류
__최근접 이웃 분류의 이해
____k-NN 알고리즘
______거리로 유사도 측정
______적절한 k 선택
______k-NN 사용을 위한 데이터 준비
____k-NN 알고리즘이 게으른 이유
__예제: k-NN 알고리즘으로 유방암 진단
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
______변환: 수치 데이터 정규화
______데이터 준비: 훈련 및 테스트 데이터셋 생성
____2단계: 데이터로 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______변환: z-점수 표준화
______k대체 값 테스트
__요약

4장. 확률적 학습: 나이브 베이즈 분류
__나이브 베이즈 이해
____베이즈 방법의 기본 개념
______확률의 이해
______결합 확률의 이해
______베이즈 정리를 이용한 조건부 확률 계산
____나이브 베이즈 알고리즘
______나이브 베이즈를 이용한 분류
______라플라스 추정량
______나이브 베이즈에서 수치 특성 이용
__예제: 나이브 베이즈 알고리즘을 이용한 휴대폰 스팸 필터링
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______데이터 준비: 텍스트 데이터 정리 및 표준화
______데이터 준비: 텍스트 문서를 단어로 나누기
______데이터 준비: 훈련 및 테스트 데이터셋 생성
______텍스트 데이터 가시화: 단어 구름
______데이터 준비: 자주 사용하는 단어의 지시자 특성 생성
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

5장. 분할 정복: 의사결정 트리와 규칙 기반의 분류
__의사결정 트리의 이해
____분할 정복
____C5.0 의사결정 트리 알고리즘
______최고의 분할 선택
______의사결정 트리 가지치기
__예제: C5.0 의사결정 트리를 이용한 위험 은행 대출 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
______데이터 준비: 랜덤한 훈련 및 테스트 데이터셋 생성
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______의사결정 트리의 정확도 향상
______다른 것보다 더 비싼 실수
__분류 규칙 이해
____분리 정복
____1R 알고리즘
____리퍼 알고리즘
____의사결정 트리에서 규칙 구성
____무엇이 트리와 규칙을 탐욕스럽게 만드는가?
__예제: 규칙 학습자를 이용한 독버섯 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색과 준비
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__요약

6장. 수치 데이터 예측: 회귀 방법
__회귀의 이해
____단순 선형 회귀
____보통 최소 제곱 추정
____상관관계
____다중 선형 회귀
__예제: 선형 회귀를 통한 의료비 예측
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______특징 간 관계 탐색: 상관 행렬
______특징 간 관계 시각화: 산포도 행렬
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______모델 명시:비선형 관계 추가
______변환:수치 변수를 이진 지시 변수로 전환
______모델 명시: 상호작용 영향 추가
______모두 합치기: 개선된 회귀 모델
__회귀 트리와 모델 트리의 이해
____트리에 회귀 추가
__예제: 회귀 트리와 모델 트리로 와인 품질 평가
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터에 대한 모델 훈련
______의사결정 트리 시각화
____4단계: 모델 성능 평가
______평균 절대 오차로 성능 측정
____5단계: 모델 성능 개선
__요약

7장. 블랙박스 방법: 신경망과 서포트 벡터 머신
__신경망의 이해
____생물학적 뉴런에서 인공 뉴런으로
____활성 함수
____네트워크 토폴로지
______계층 개수
______정보 이동 방향
______계층별 노드 개수
____역전파로 신경망 훈련
__예제: ANN으로 콘크리트 강도 모델링
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
__서포트 벡터 머신의 이해
____초평면을 이용한 분류
______선형적으로 분리 가능한 데이터의 경우
______비선형적으로 분리 가능한 데이터의 경우
____비선형 공간을 위한 커널의 사용
__예제: SVM으로 OCR 수행
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 향상
__요약

8장. 패턴 찾기: 연관 규칙을 이용한 장바구니 분석
__연관 규칙의 이해
____연관 규칙 학습을 위한 아프리오리 알고리즘
____규칙 흥미 측정:지지도와 신뢰도
____아프리오리 원칙을 이용한 규칙 집합의 구축
__예제: 연관 규칙으로 자주 구매되는 식료품 식별
____1단계: 데이터 수집
____2단계: 데이터 탐색 및 준비
______데이터 준비:거래 데이터를 위한 희소 행렬 생성
______아이템 지지도 시각화:아이템 빈도 그래프
______거래 데이터 시각화:희소 행렬 도표화
____3단계: 데이터에 대한 모델 훈련
____4단계: 모델 성능 평가
____5단계: 모델 성능 개선
______연관 규칙 집합 정렬
______연관 규칙의 부분집합 구하기
______연관 규칙을 파일이나 데이터 프레임에 저장
__요약

9장 데이터 그룹 찾기: k-평균 군집화
군집화의 이해
머신 러닝 작업으로서 군집화
k-평균 군집화 알고리즘
거리 이용해 클러스터 할당 및 수정
적합한 클러스터 개수 선택
예제: k-평균 군집화를 이용한 십대 시장 세분화
1단계: 데이터 수집
2단계: 데이터 탐색 및 준비
데이터 준비: 결측치 더미 코딩
데이터 준비: 결측지 대체
3단계: 데이터에 대한 모델 훈련
4단계: 모델 성능 평가
5단계: 모델 성능 개선
요약

10장 모델 성능 평가
분류성능측정
R의 분류 예측 데이터 작업
혼동 행렬 자세히 보기
혼동 행렬을 사용한 성능 측정
정확도를 넘어: 다른 성능 척도
카파 통계량
민감도와 특이도
정밀도와 재현율
F-척도
성능트레이드오프 시각화
ROC 곡선
미래의 성능 예측
홀드아웃 방법
교차 검증
부트스트랩 샘플링
요약

11장 모델 성능 개선
성능 개선을 위한 신용 모델 튜닝
자동 파라미터 튜닝을 위한 caret 사용
간단한 튜닝 모델 생성
튜닝 절차 커스터마이징
메타 학습으로 모델 성능 개선
앙상블의 이해
배깅
부스팅
랜덤 포레스트
랜덤 포세스트 훈련
랜덤 포세스트 성능 평가
요약

12장 특화된 머신 러닝 주제
독점 파일 및 데이터베이스 작업
마이크로소트 엑셀, SAS, SPSS와 Stata 파일에서 읽고 쓰기
SQL 데이터베이스의 데이터 쿼리
온라인 데이터 및 서비스 작업
웹 페이지의 전체 텍스트 다운로드
웹 페이지레서 데이터 스크래핑
XML 문서 파싱
웹 API에서 JSON 파싱
도메인에 특화된 데이터 작업
생체정보학 데이터 분석
네트워크 데이터 분석과 시각화
R 성능 개성
대용량 데이터셋 관리
dplyr을 이용한 표 형식 데이터 구조의 일반화
data, table을 이용한 데이터 프레임 속도 향상
ff를 이용한 디스크 기반 데이터 프레임 생성
bigmemiry을 이용한 대용량 행렬의 사용
병렬 컴퓨팅으로 더 빠른 학습
실행 시간 측정
멀티코어와 스노우을 이용한 병렬 작업
foreach와 doParallel을 이용한 병렬 활용
맵리듀스와 하둡을 이용한 병렬 클라우드 컴퓨팅
GPU 컴퓨팅
최적화된 학습 알고리즘 배포
biglm을 이용한 더 큰 회귀 모델 구축
bigrf을 이용한 더 크고 빠른 랜덤 포레스트 키우기
caret을 이용한 병렬 모델 훈련과 평가
요약

출판사 서평

★ 이 책에서 다루는 내용 ★
■ R의 힘을 이용해서 실제 데이터 과학 응용으로 일반적인 머신 러닝 알고리즘 구축
■ 분석을 위한 데이터 정제 및 준비와 결과를 시각화하기 위한 R 기술 이해
■ 여러 종류의 머신 러닝 모델을 찾아 데이터 요구사항 충족 및 분석 문제를 해결하기 위한 최고의 모델 파악
■ 베이지안과 최근접 이웃 방법을 이용한 데이터 분류
■ 의사결정 트리, 규칙, 서포트 벡터 머신을 구축한 값 예측
■ 선형 회귀를 이용한 수치 값 예측과 신경망을 이용한 데이터 모델링
■ 머신 러닝 모델의 성능 평가와 개선... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트 적립은 작성 후 다음 날 혹은 해당 도서 출고 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기+

이 분야의 신간

더보기+

바로가기

  • 우측 확장형 배너 2

최근 본 상품