Scikit-learn으로 머신 러닝 마스터
도서+교보Only(교보배송)을 함께 15,000원 이상 구매 시 무료배송
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
특히 잘 정립되고 간결한 설명은 모든 머신 러닝 기법의 기본 개념을 다시 한 번 확고히 이해하는 데 많은 도움을 줄 것이다. 또한 모든 예제를 파이썬 scikit-learn을 사용해 제공하기 때문에 코드를 직접 수행해 가면서 책을 읽을 수 있다.
★ 이 책에서 다루는 내용 ★
■ 편향과 분산 등의 기본 개념
■ 범주형 변수, 텍스트, 이미지 등에서 특징 추출
■ 선형 회귀와 k-최근접 이웃을 사용한 연속 변수 예측
■ 로지스틱 회귀와 서포트 벡터 머신을 이용한 문서와 이미지 분류
■ 배깅과 부스팅 기법을 활용한 예측기의 앙상블 구축
■ K-평균 군집화를 사용한 데이터 내 숨겨진 구조의 발견
■ 보편적으로 사용되는 머신 러닝 시스템의 성능 평가
★ 이 책의 대상 독자 ★
보편적인 머신 러닝 알고리즘의 작동법을 이해하고 어떻게 활용할 것인지에 대한 직관을 얻는 데 도움을 주기 위한 책이다. 또한 이 책은 scikit-learn API를 배우고자 하는 데이터 과학자에게도 유용하다. 책을 읽을 때 머신 러닝의 기초 지식이나 파이썬 지식이 있으면 도움이 되겠지만 반드시 있어야만 하는 것은 아니다.
작가정보
저자(글) 개빈 해클링
저자 개빈 해클링 (Gavin Hackeling)
데이터 과학자다. 자동 음성 인식, 문서 분류, 물체 인식, 의미 세분화 등의 다양한 머신 러닝 분야에서 일한다. 노스캐롤라이나 대학과 뉴욕 대학을 졸업했고 부인, 고양이와 함께 브루클린에서 살고 있다.
번역 이병욱
㈜크라스랩 대표이사이자 서울과학종합대학원 디지털금융 MBA 주임교수를 맡고 있다. 한국과학기술원 KAIST 전산학과 계산 이론 연구실에서 학위를 취득했으며 공학을 전공한 금융 전문가로, 세계 최초의 핸드헬드-PC(Handheld-PC) 개발에 참여해 한글 윈도우 CE 1.0과 2.0을 미국 마이크로소프트 본사에서 공동 개발했다. 1999년에는 국내 최초 전 보험사 보험료 실시간 비교 서비스를 제공하는 ㈜보험넷을 창업해 업계에 큰 반향을 불러일으켰다. 이후 삼성생명을 비롯한 생명 보험사 및 손해 보험사에서 CMO(마케팅 총괄 상무), CSMO(영업 및 마케팅 총괄 전무) 등을 역임하면서 혁신적인 상품과 서비스를 개발, 총괄했다. 세계 최초로 파생상품인 ELS를 기초 자산으로 한 변액 보험을 개발해 단일 보험 상품으로 5천억 원 이상 판매되는 돌풍을 일으켰고, 매일 분산 투자하는 일 분산 투자(daily Averaging) 변액 보험을 세계 최초로 개발해 상품 판매 독점권을 획득했다. 최근에는 머신러닝 기반의 금융 분석과 블록체인에 관련된 다양한 활동을 하고 있으며, 과학기술정보통신부 우정사업본부 정보센터의 네트워크 & 블록체인 자문위원을 맡고 있다.
저서로는 『비트코인과 블록체인, 가상자산의 실체 2/e』(에이콘, 2020)과 대한민국학술원이 2019 교육부 우수학술도서로 선정한 『블록체인 해설서』(에이콘, 2019)가 있다.
작가의 말
최근 몇 년 사이에 상상만 하던 것들이 머신 러닝으로 하나씩 실현되고 있다. 이 기법은 실로 다양한 응용 분야를 만들어냈다. 스팸 차단 같은 응용은 너무나 성공적이어서 이제는 어디서나 볼 수 있는 일상처럼 돼 버렸다. 다른 많은 분야도 최근 들어 연구가 활발하며, 머신 러닝의 미래를 보여준다.
이 책에서는 몇 가지 머신 러닝 모델과 학습 알고리즘을 자세히 알아본다. 머신 러닝이 보편적으로 응용되고 있는 분야에 대해 살펴보고 머신 러닝 시스템의 성능을 평가하는 척도를 설명한다. 이를 위해 scikit-learn이라 불리는 유명한 파이썬 언어의 라이브러리를 사용해 과제를 해결한다. scikit-learn은 직관적이고 다양한 API로, 여러 최신 머신 러닝 알고리즘을 구현해 놓은 집합체이다.
목차
- 1장. 머신 러닝 기초
__머신 러닝의 정의
__경험으로부터 학습
__머신 러닝 과제
__훈련 데이터, 테스트 데이터, 검증 데이터
__편향과 분산
__scikit-learn 소개
__scikit-learn 설치
____pip를 사용한 설치
____윈도우에 설치
____우분투 16.04에 설치
____맥 OS에 설치
____아나콘다 설치
____설치 검증
__pandas, Pillow, NLTK, matplotlib 설치
__요약
2장 단순 선형 회귀
__단순 선형 회귀
____비용 함수를 사용한 모델의 적합도 평가
____단순 선형 회귀를 위한 OLS 계산
__모델 평가
__요약
3장. K-최근접 이웃을 이용한 분류와 회귀
__k-최근접 이웃
__게으른 학습과 비매개변수 모델
__KNN을 사용한 분류
__KNN을 사용한 회귀
____특징의 크기 조절
__요약
4장. 특징 추출
__범주형 변수에서 특징 추출
__특징의 표준화
__텍스트에서 특징 추출
____단어 주머니 모델
____불용어 필터링
____형태소 추출과 어휘소 추출
____tf-idf 가중치를 활용한 단어 주머니의 확장
____해싱 기법을 사용한 공간효율적 특징 벡터
____워드 임베딩
__이미지에서 특징 추출
____픽셀 강도에서 특징 추출
____컨벌루션 신경망 활성화를 사용한 특징
__요약
5장. 단순 선형 회귀에서 다중 선형 회귀까지
__다중 선형 회귀
__다항 회귀
__정규화
__선형 회귀의 적용
____데이터 탐색
____적합화와 모델 평가
__기울기 하강법
__요약
6장. 선형 회귀에서 로지스틱 회귀까지
__로지스틱 회귀를 이용한 이진 분류
__스팸 필터링
____이진 분류기 평가 척도
____정확도
____정밀도와 재현율
____F1 척도 계산
____ROC AUC
__그리드 탐색을 활용한 모델 튜닝
__다중 부류 분류
__다중 부류 분류 성능 척도
__다중 부류 분류와 문제 변환
__다중 부류 분류 성능 척도
__요약
7장. 나이브 베이즈
__베이즈 정리
__생성 모델과 판별 모델
__나이브 베이즈
__나이브 베이즈에서의 가정
__scikit-learn으로 구현한 나이브 베이즈
__요약
8장. 의사결정 트리를 이용한 비선형 분류와 회귀
__의사결정 트리
__의사결정 트리 훈련
____문제 선택
______정보 이득
____지니 불순도
__scikit-learn을 사용한 의사결정 트리
____의사결정 트리의 장단점
__요약
9장. 의사결정 트리에서 랜덤 포레스트와 앙상블 기법까지
__배깅
__부스팅
__스태킹
__요약
10장. 퍼셉트론
__퍼셉트론
____활성화 함수
____퍼셉트론 학습 알고리즘
____퍼셉트론을 이용한 이진 분류
____퍼셉트론을 이용한 문서 분류
__퍼셉트론의 한계
__요약
11장. 퍼셉트론에서 서포트 벡터 머신까지
__커널과 커널 트릭
__최대 마진 분류기와 서포트 벡터
__scikit-learn에서 문자 분류
____필기체 숫자 분류
____컬러 이미지에서 문자 분류
__요약
12장. 퍼셉트론에서 인공지능까지
__비선형 결정 경계
__피드포워드와 피드백 ANN
__다층 퍼셉트론
__다층 퍼셉트론 훈련
____역전파
____XOR 근사를 위한 계층 퍼셉트론의 훈련
____필기체 숫자를 분류하기 위한 다층 퍼셉트론 훈련
__요약
13장. K-평균
__군집화
__K-평균
____지역 최적 값
____엘보 기법을 사용한 k 값의 선택
__클러스터의 평가
__이미지 퀀터제이션
__특징 학습을 위한 군집화
__요약
14장. 주성분 분석을 이용한 차원 축소
__주성분 분석
____분산, 공분산, 공분산 행렬
____고유 벡터와 고윳값
__PCA 실행
__PCA를 사용한 고차원 데이터의 시각화
__PCA를 사용한 얼굴 인식
__요약
책 속으로
1장, '머신 러닝 기초'에서는 머신 러닝을 경험으로부터 학습해 성능을 개선하는 프로그램을 연구하고 디자인하는 것이라 정의한다. 이는 책 전반에 걸쳐 가이드 역할을 한다. 각 장에서 머신 러닝 모델을 살펴보고 과제에 직접 응용하며, 그 성능을 평가해본다.
2장, '단순 선형 회귀'에서는 단일 특징과 연속 반응 변수 사이의 관계를 설정하는 모델을 알아본다. 비용 함수에 대해 배우며 모델을 최적화하기 위해 정규 방정식을 사용한다.
3장, 'K-최근접 이웃을 이용한 분류와 회귀'에서는 분류와 회귀 과제를 위한 간단한 비선형 모델을 소개한다.
4장, '특징 추출'에서는 텍스트, 이미지, 범주형 변수를 머신 러닝에서 사용할 수 있는 특징으로 표현하는 방법을 알아본다.
5장, '단순 선형 회귀'에서 다중 선형 회귀까지'에서는 연속 반응 변수에 회귀하는 단순 선형 회귀를 확장해 여러 개의 특징을 처리할 수 있게 일반화하는 방법을 알려준다.
6장, '선형 회귀부터 로지스틱 회귀까지'에서는 다중 선형 회귀를 더 일반화하고 이진 분류 과제를 위한 모델을 소개한다.
7장. '나이브 베이즈'에서는 베이즈 정리와 나이브 베이즈 계열의 분류기를 소개하고 생성 모델과 판별 모델을 서로 비교해본다.
8장, '의사결정 트리를 이용한 비선형 분류와 회귀'에서는 분류와 회귀 과제에 사용할 수 있는 간단한 비선형 모델인 의사결정 트리를 소개한다.
9장, '의사결정 트리에서 랜덤 포레스트와 앙상블 기법까지'에서는 모델을 병합하는 세 가지 방법인 배깅, 부스팅, 스태킹에 대해 알아본다.
10장, '퍼셉트론'에서는 이진 분류를 위한 간단한 온라인 모델을 소개한다.
11장, '퍼셉트론에서 서포트 벡터 머신까지'에서는 분류와 회귀를 위한 강력한 판별 모델인 서포트 벡터 머신을 소개하고, 특징을 고차원 공간으로 효과적으로 사상할 수 있는 기법을 설명한다.
12장, '퍼셉트론에서 인공 신경망까지'에서는 인공 신경망으로 구축된 분류와 회귀를 위한 강력한 비선형 모델을 소개한다.
13장, 'K-평균'에서는 레이블이 붙어있지 않은 데이터 내의 구조를 발견하는 데 사용되는 알고리즘을 알아본다.
14장, '주성분 분석을 이용한 차원 축소'에서는 차원의 저주(curse of dimensionality)를 완화할 수 있는 차원 축소 기법을 설명한다.
출판사 서평
★ 옮긴이의 말 ★
이 책은 머신 러닝의 광범위한 기법을 대부분 소개하면서도 세련되고 효과적인 설명을 통해 손쉽게 개념을 정립할 수 있도록 해준다. 여러 기법을 나열 위주로 열거만 하고 상호 간의 연관성이나 기법 자체의 핵심 개념을 제대로 설명하지 못하고 있는 시중의 여러 서적과 달리, 이 책에서는 아주 잘 짜인 구성과 잘 정리된 개념 설명을 볼 수 있다.
특히 개념 설명을 위해 파이썬의 Scikit-learn을 사용하고 있어, 개념을 이해하기에도 용이할 뿐더러 활용 측면에서도 유연한 측면이 있다. 머신 러닝을 이제 막 공부하는 사람들은 물론, 여러 개념을 간단명료하게 정리하고 싶은 중급 이상의 개발자들에게도 좋은 가이드라인을 줄 수 있다.
기본정보
ISBN | 9791161751603 | ||
---|---|---|---|
발행(출시)일자 | 2018년 05월 30일 | ||
쪽수 | 308쪽 | ||
크기 |
190 * 236
* 22
mm
/ 723 g
|
||
총권수 | 1권 | ||
원서명/저자명 | Mastering Machine Learning with Scikit-Learn/Hackeling, Gavin |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립