본문내용 바로가기
MD의선택 무료배송 이벤트 사은품

파이썬으로 배우는 대규모 머신 러닝 대규모 데이터 분석과 처리를 위한 다양한 머신 러닝 기법 활용

acorn+PACKT 시리즈 | 페이퍼백
바스티앙 스야딘 , 루카 마싸론, 알베르토 보스체티 지음 | 이미정 옮김 | 에이콘출판 | 2017년 07월 10일 출간
  • 정가 : 35,000원
    판매가 : 31,500 [10%↓ 3,500원 할인]
  • 제휴할인가 : 23,620 교보-롯데카드 최대 25% 청구할인 카드/포인트 안내
  • 통합포인트 :
    [기본적립] 1,750원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 :
    naver네이버페이 결제 시 무조건 1% 추가 적립 payco페이코 결제 시 최대 1만원 적립 okcashbag 실 결제 금액의 0.5% 적립 안내
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    지금 주문하면 내일(22일,수) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 영업점에서 직접 수령 안내
행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
닫기
  • 스무 살 패브릭 포스터 증정 O tvN 어쩌다 어른 X 교보문고 단독혜택
  • 어린이 가을독서 추천도서전
  • 가을입맛 사로잡기
  • 행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
  • 유아/어린이/가정육아 이달의 기대신간
  • 올재 클래식스 100권 완간! 시리즈의 정수만 모은, 올재 셀렉션즈 단독 판매
  • 자기계발 메인이벤트
  • 경제경영 메인이벤트
  • 행사도서 포함, 2만원이상 구매시 택 1 (1500P 차감)
  • 나만의 경쟁력, 동양고전 김원중 명품고전 독서대 증정
  • 비모 벽시계

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 동료 개발자들의 책장을 살펴보세요 :)
    2017.08.31 ~ 2018.12.31
  • 웹개발 입문자를 위한 아주 약간의 가이드
    2017.07.11 ~ 2020.12.31
  • 파이썬 도서 다 모였다!
    2016.08.11 ~ 2018.12.31
  • MANNING, O'REILLY, PACKT, WILEY 등 해..
    03. 07 ~ 04. 30
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791161750224(1161750223)
쪽수 528쪽
크기 189 * 235 * 29 mm /996g 판형알림
이 책의 원서 Large Scale Machine Learning with Python/Bastiaan Sjardin

책소개

이 책이 속한 분야

『파이썬으로 배우는 대규모 머신 러닝』은 파이썬을 활용해 대규모 데이터 세트에 머신 러닝을 적용하는 방법을 안내한다. 실제 파이썬 코드를 이용해 현재 가장 많이 사용되는 머신 러닝 기법들과 프레임워크로 대규모 데이터 세트를 처리하는 방법을 설명하고 있다. 기본적으로 파이썬 문법과 머신 러닝 개념을 어느 정도 숙지한 중급 독자를 위한 책으로, 통계와 수학에 대한 실무 지식이 있다면 더욱 이해하기 쉬울 것이다. 머신 러닝 분야에서 언급되는 주요 개념, 프레임워크, 알고리즘, 툴 등을 적절하게 사용하는 예를 제시한다.

이 책의 총서

총서 자세히 보기

저자소개

저자 : 바스티앙 스야딘

저자 바스티앙 스야딘(Bastiaan Sjardin)은 인공지능 및 수학을 전공한 데이터 과학자이자 스타트업 창업자다. 레이던 대학(University of Leiden)에서 매사추세츠 공과대학(MIT) 캠퍼스 과정을 이수하고 인지 과학(cognitive science) 분야에서 석사학위를 취득했다. 지난 5년 동안 광범위한 데이터 과학 및 인공지능 프로젝트를 수행했다. 코세라(Coursera)에서 진행되는 미시간대학(University of Michigan) 소셜 네트워크 분석 과정과 존스홉킨스 대학교(Johns Hopkins University) 머신 러닝 과정의 TA를 담당하고 있다. 선호하는 프로그래밍 언어는 파이썬과 R이다. 현재 머신 러닝 및 인공지능 애플리케이션을 대규모로 제공하는 Quandbee(http://www.quandbee.com/)의 공동 창업자로 회사를 이끌고 있다.

저자 : 루카 마싸론

저자 루카 마싸론(Luca Massaron)은 다변수 통계 분석, 머신 러닝, 고객 분석을 전문으로 하는 데이터 과학자이자 마케팅 리서치 디렉터다. 지난 10년간 추론, 통계, 데이터 마이닝, 알고리즘을 활용해 실제적인 문제를 해결하고, 데이터에서 가치를 창출하는 일에 몸담았다. 이탈리아에서 웹 잠재 고객 분석 분야의 개척자로 활동한 이후 캐글(Kaggle) 상위 10위에 오르기까지 데이터 및 데이터 분석과 관련된 모든 일은 물론, 전문가 및 비전문가를 대상으로 데이터 기반 지식 검색의 잠재력을 입증하는 일에 열정적이었다. 불필요한 정교함보다 단순함을 선호하는 그답게, 기본적인 작업만으로도 데이터 과학 분야에서 많은 업적을 이뤄낼 것으로 믿고 있다.

저자 : 알베르토 보스체티

저자 알베르토 보스체티(Alberto Boschetti)는 신호 처리 및 통계 분야의 전문성을 갖춘 데이터 과학자다. 정보 통신 공학 박사학위를 소지했으며, 현재 런던에서 생활하고 있다. 업무상 진행되는 프로젝트에서 자연어 처리 NLP와 머신 러닝, 분산 처리에 이르기까지 다양한 문제들을 다루고 있다. 자신의 일에 매우 열정적이며 모임, 회의 및 기타 행사에 활발히 참여해 데이터 과학 기술 분야의 최신 개발 동향을 지속적으로 파악하고 있다.

역자 : 이미정

역자 이미정은 성균관대 전자전기 컴퓨터공학부를 졸업하고, 한동대학교 정보통신공학 석사학위를 이수했다. 삼성전자 LSI 사업부 기술개발실에 근무했으며, 오라클 미들웨어 사업부에서 컨설턴트로 활동했다. 현재는 MDS 테크놀로지에서 세일즈 엔지니어로 재직 중이다. 에이콘출판사에서 출간한 『Pig를 이용한 빅데이터 처리 패턴』(2014), 『Splunk 6 핵심 기술』(2015), 『빅데이터 마이닝(2017)』을 번역했다.

작가의 말

지은이의 말

머신 러닝은 보통 실제로 활용 가능한 인공지능의 한 부분으로 알려져 있다. 머신 러닝의 목표는 이전에 사용된 적이 없는 데이터 세트의 결과를 최대한 정확하게 예측하기 위해 기존 데이터 세트를 기반으로 하나의 함수를 찾는 것이다. 이는 레이블과 클래스의 형태(분류 문제) 또는 지속적인 값(회귀 문제)의 형태로 정의된다. 실생활에서 볼 수 있는 머신 러닝의 예는 미래 주가 예측부터 일련의 문서에서 저자의 성별을 분류하는 문제에 이르기까지 다양하다. 이 책 전체에서 파이썬으로 구현된 실제 예제를 보게 될 텐데, 이를 통해 가장 중요한 머신 러닝의 개념과 대규모 데이터 세트에 적합한 방법을 명확히 이해하게 될 것이다. 대규모 데이터 세트에 적용할 수 있는 지도 학습(분류 & 회귀)은 물론, (주성분 분석(Principal Component Analysis, PCA), 클러스터링, 주제 모델링 같은) 비지도 학습에 대해서도 살펴볼 것이다.

옮긴이의 말

머신러닝의 시대다. 빅데이터, 클라우드, IoT와 운명을 같이하여 AI와 더불어 현재 전세계 사람들의 기대와 우려, 관심이 집중되고 있는 기술이다. 이런 상황을 반영하는 듯 조직의 규모, 산업 분야, 사업 영역에 관계없이 경영자 입장에서는 머신러닝을 적용하여 엄청난 가치를 찾아낼 것을 기대하고 실무진에서는 그 "가치"의 구체적인 그림을 그리려고 고심하는 것을 많이 본다. 꼭 필요한 영역에 머신러닝을 도입한다기 보다 소위 요즘 뜬다는 이 기술을 어디에 적용해야 할지 애써 찾는 모습도 보인다. 기술에 대한 오해는 잘못된 기대와 의미 없는 결실로 이어지기도 하므로 무엇보다 기술에 대한 정확한 이해가 선행되어야 할 것이다.
이 책은 머신러닝이라는 분야에서 언급되는 중요한 개념들을 총망라한다. 각 장에서 다루는 주제는 책 한 권으로 다뤄야 할 정도로 그 범위가 방대하다 보니 머신러닝 입문자에게는 다소 난해한 반면 중급자 이상에게는 깊이가 얕게 느껴질 수 있다. 우선 입문자에게는 이 책을 주교재로 공부하되, 모르는 개념이 있을 경우 다른 책들을 참조하는 방법을 권한다. 중급자 이상이라면 이 책에서 중점적으로 다루고 있는 "대규모" 데이터 처리 방법에 무게를 두는 것이 좋겠다. 머신러닝이라는 범주 안에 포함되는 개념, 알고리즘, 툴, 라이브러리, 소프트웨어, 프레임워크의 역할을 파악하는 소득을 얻을 수 있을 것이다.
용어 선택에 고심이 많았다. 머신러닝 관련 서적들이 출판되기 시작한지 얼마 되지 않았고, 근래에 출판된 책들에서 초자 용어가 통일되지 않은 이유다. 수학, 통계에서 이미 번역되어 통용되는 용어는 그대로 사용했으나, 그렇지 않다면 번역으로 의미전달이 분명해지는 경우에만 번역을 했다. 하이퍼파라미터, 모멘텀, 앙상블 등 번역이 오히려 의미전달을 방해하는 경우에는 굳이 억지로 번역하지 않고 음독했다. 파이썬, 하둡 등 소프트웨어, 라이브러리, 프레임워크 이름 역시 음독했다.
여러 가지 다양한 목적으로 이 책을 펼쳤을 개발자, 실무자, 학생, 엔지니어분들께 이 책이 대규모 데이터에 머신러닝을 적용하기 위한 가이드 역할을 충실히 해내길 바란다. 무엇보다 머신러닝이 단지 기술을 위한 기술이 되지 않기를 바라는 마음으로 이 책을 번역했다.

목차

1장. 확장성을 향한 첫걸음

__확장성에 대한 자세한 설명
____대규모 객체 생성하기
____파이썬 소개
____파이썬을 통한 스케일 업
____파이썬을 통한 스케일 아웃
__대규모 머신 러닝을 위한 파이썬
____파이썬 2와 파이썬 3 중 어느 것을 선택할 것인가?
____파이썬 설치
____단계적 설치
____패키지 설치
____패키지 업그레이드
____과학용 배포판
____주피터 / IPython 소개
__파이썬 패키지
____NumPy
____SciPy
____Pandas
____Scikit-learn
__요약


2장. Scikit-learn으로 확장 가능한 학습
__코어에 구애 받지 않는 학습(Out-of-core learning)
____실행 가능한 방법으로서 재표본추출
____한 번에 하나의 객체만으로 최적화를 하는 방법
____코어에 구애 받지 않는(out-of-core) 학습 시스템 구축
__소스로부터 데이터를 스트리밍하기
____현실을 반영하는 데이터 세트
____첫 번째 예제 - 자전거 대여 데이터 세트 스트리밍하기
__확률적 학습(Stochastic learning)
____배치 경사 하강법(Batch gradient descent)
____확률적 경사 하강법
____Scikit-learn의 SGD 구현체
____SGD 학습 파라미터 정의하기
__데이터 스트림을 통한 특징 관리
____목표 설명
____해싱 기법
____그 외 기본적인 변환들
____스트림에서 테스트와 검증
____SGD의 실제 동작
__요약


3장. 빠른 SVM 구현체

__실험용 데이터 세트
____자전거 대여 데이터 세트
____산림 유형 데이터 세트
__서포트 벡터 머신
____경첩 손실 및 변형
____Scikit-learn SVM 구현체에 대한 이해
____재표본추출에 의한 비선형 SVM
____SGD로 SVM 확장하기
__정규화를 통한 특징 선택
__SGD에 비선형성 포함시키기
____명시적 고차원 매핑 시도하기
__하이퍼파라미터튜닝
____빠른 SVM 학습을 위한 방법들
__요약


4장. 신경망과 딥러닝

__신경망 아키텍처
____신경망이 학습하는 내용과 방법
____적합한 아키텍처 선택하기
__실제로 동작하는 신경망
____sknn 병렬 처리
__신경망과 정규화
__신경망과 하이퍼파리미터 최적화
__신경망과 결정 경계
__H2O를 통한 딥러닝의 확장
____H2O를 활용한 대규모 딥러닝
____H2O에서의 그리드 검색
__딥러닝과 비지도 사전 학습
__theanets를 활용한 딥러닝
__오토인코더와 비지도 학습
____오토인코더
__요약


5장. 텐서플로를 활용한 딥러닝

__텐서플로 설치
__SkFlow를 활용한 텐서플로에서의 머신 러닝
____대형 파일을 활용하는 딥러닝-점진적 학습
__Keras와 텐서플로 설치
____Keras를 통한 텐서플로에서의 합성곱 신경망
__합성곱층
____풀링층
____완전 연결층
__점진적 방식을 사용하는 CNNs
__GPU 컴퓨팅
__요약


6장. 분류와 회귀 트리 확장

__부트스트랩 모음
__랜덤 포레스트 및 극단적인 랜덤 포레스트
__무작위 검색을 통한 빠른 파라미터 최적화
____극단적인 랜덤 트리와 대형 데이터 세트
__CART와 부스팅
____경사 부스팅 머신
__XGBoost
____XGBoost 회귀
____대형 데이터 세트를 스트리밍하는 XGBoost
____XGBoost model persistence
__H2O를 통한 코어에 구애 받지 않는 방식의 CART
____H2O에서의 랜덤 포레스트와 그리드 검색
____H2O에서의 확률적 경사 부스팅과 그리드 검색
__요약


7장. 대규모 데이터에 대한 비지도 학습

__비지도 방식
__특징 분해(Feature decomposition) - PCA
____무작위 PCA
____증분 PCA
____희소 PCA
__H2O를 활용한 PCA
__클러스터링? K-평균
____초기화 방식
____K-평균의 가정
____최적의 K 선택하기
____K-평균의 확장-미니 배치
__H2O를 활용한 K-평균
__LDA
____LDA 확장 ? 메모리, CPUs, 머신
__요약


8장. 분산환경-하둡(Haddop)과 스파크(Spark)

__독립형 머신에서 다수의 노드들로
____분산 프레임워크가 필요한 이유
__VM 환경 설정
____버추얼박스
____베이그런트
____VM 사용하기
__하둡 생태계
____아키텍처
____HDFS
____맵리듀스
____얀
__스파크
____pySpark
__요약


9장. 스파크를 활용한 실무에서의 머신 러닝

__9장을 위한 VM 환경 설정
__클러스터 노드들에서 변수 공유하기
____읽기 전용 브로드캐스트 변수
____읽기 전용 누산기 변수
____브로드캐스트와 누산기를 함께 사용하기-예제
__스파크에서의 데이터 전처리
____JSON 파일과 스파크 데이터 프레임
____유실 데이터 처리하기
____메모리에서 테이블을 그룹짓고 생성하기
____전처리된 데이터 프레임 혹은 RDD를 디스크에 쓰기
____스파크 데이터 프레임으로 작업하기
__스파크를 활용한 머신 러닝
____KDD99 데이터 세트를 다루는 스파크
____데이터 세트 읽기
____특징 엔지니어링
____학습기 훈련시키기
____학습기 성능 평가하기
____강력한 ML 파이프라인
____수작업 튜닝
____교차 검증
__요약


부록. GPU 및 Theano 소개
__GPU 컴퓨팅
__Theano - GPU에서의 병렬 컴퓨팅
__Theano 설치하기

출판사 서평

★ 이 책에서 다루는 내용 ★

■ 확장성이 뛰어난 머신 러닝 알고리즘 적용 방법
■ 최신 머신 러닝 기법 활용
■ 딥러닝과 확장 가능한 데이터 처리 기법을 활용한 예측 정확도 향상
■ 스파크에서 맵리듀스 프레임워크 활용
■ 스파크 및 하둡을 활용한 효과적인 머신 러닝 알고리즘 적용 방법
■ 강력한 대규모 앙상블 생성
■ 데이터 스트림을 사용해 대규모 데이터 세트에서 선형 및 비선형 예측 모델 학습

★ 이 책의 대상 독자 ★

데이터 과학 분야의 실무자, 개발자, 그리고 크고 복잡한 데이터 세트를 다루려는 모... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트 적립은 작성 후 다음 날 혹은 해당 도서 출고 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서번역서

안내

이 분야의 베스트

더보기+

이 분야의 신간

더보기+

이 책의 연관도서

  • 이강성
    31,500원
  • 데이비드 M. 비즐리
    34,200원
  • 신호철
    25,200원
  • 제이슨 R. 브리그스
    24,300원
  • 웨스 맥키니
    29,700원
더보기+

바로가기

  • 우측 확장형 배너 2

최근 본 상품