본문내용 바로가기
MD의선택 무료배송 이벤트 경품 소득공제

스칼라와 머신 러닝 풍부한 설명으로 배우는 스칼라 머신 러닝 구현

2판
  • 정가 : 45,000원
    판매가 : 40,500 [10%↓ 4,500원 할인]
  • 통합포인트 :
    [기본적립] 2,250원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 3만원 이상 구매 시 2~4% 추가적립
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    당일배송 지금 주문하면 오늘(22일,화) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • MANNING, O'REILLY, PACKT, WILE..
    2016.03.07 ~ 2020.12.31
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791161752327(1161752323)
쪽수 864쪽
크기 188 * 234 * 48 mm /1574g 판형알림
이 책의 원서/번역서 Scala for Machine Learning-Second Edition: Data processing, ML algorithms, smart analytics, and more/Patrick R. Nicolas

책소개

이 책이 속한 분야

2019년 대한민국학술원 우수학술도서 선정도서

머신 러닝에 스칼라를 적용하고자 하는 개발자를 위한 책이다. 멀티 패러다임 언어인 스칼라의 특성과 관련 디자인 패턴 등 개발자에게 필요한 스칼라의 기본적인 특성부터 데이터 파이프라인과 처리, 주요 머신 러닝 알고리즘의 구현에 대해 자세히 설명한다. 대부분의 예제는 금융 데이터를 기반으로 구현돼 있으며, 직접 스칼라로 작성한 모든 코드와 알고리즘을 상세하게 설명한다. 부록에서는 주요 머신 러닝 알고리즘에서 쓰이는 수학적 개념과 관련 논문이 정리돼 있어서 필요한 내용을 쉽게 참조할 수 있다. 이 책은 수준 높은 스칼라 코드를 작성하는 데 활용할 수 있는 참고 서적으로도 가치가 크다.

저자소개

저자 : 패트릭 니콜라스

캘리포니아 애자일 SDE(Agile SDE)의 공학 이사다. 소프트웨어공학, C++, 자바와 최근의 스칼라/스파크 애플리케이션 구축에 이르기까지 25년 이상의 경력을 보유했으며, 여러 개의 관리 직위를 맡아왔다. 실시간 분석, 모델링, 비선형 모형 개발 등에 관심이 많다.

역자 : 이판호

성균관대학교에서 통계학을 전공했으며 금융 업계에서 주로 데이터 분석 관련 업무를 맡아왔다. 프로그래밍 세계에 본격적으로 입문한 이후로는 데이터를 기반으로 하는 금융 투자 및 이를 위한 프로그램 개발에 관심을 두고 있다. 에이콘출판사에서 펴낸 『R 병렬 프로그래밍』(2017), 『파이썬으로 배우는 데이터 과학 2/e』(2017), 『Akka 쿡북』(2018)을 번역했다.

작가의 말

뉴스 미디어나 기술 콘퍼런스, 심지어는 커피숍에서조차 빅데이터에 대해 듣지 않는 날이 이제 거의 없다. 처리 모니터링, 리서치 또는 간단한 인간 행동으로부터 수집된 데이터의 양은 점점 증가하고 있으며, 이것으로부터 지식을 뽑아낼 수 있어야만 가치가 있을 것이다.
이 책은 머신 러닝이 무엇인지, 왜 해야 하는지, 어떻게 하는지를 다룬다.

● 머신 러닝의 목적과 수학적 기초는 무엇인가?
● 머신 러닝 알고리즘을 구현하는 데 스칼라가 이상적인 언어인 이유는 무엇인가?
● 실제 세계의 문제를 해결하는 데 머신 러닝을 어떻게 적용할 것인가?

이 책 전반에 걸쳐 머신 러닝 알고리즘을 다이어그램, 수학 공식, 문서화된 스칼라 코드 조각으로 설명하며, 여러분만의 방식으로 핵심 개념을 이해하도록 해줄 것이다.

[옮긴이의 말]
최근 머신 러닝이나 딥러닝에 대한 관심이 조금 사그라든 것 같지만, 적어도 데이터 분석이나 데이터 처리 분야에서 일하는 개발자에게 요구되는 머신 러닝 관련 지식이나 기술 수준은 점차 높아지고 있는 것이 현실이다. 실제 관련 업무에 머신 러닝 알고리즘이 적용되는 사례가 늘어나고 있을 뿐만 아니라, 머신 러닝을 실험하거나 실무에 적용할 수 있게 해주는 라이브러리나 프레임워크 또한 양적 측면과 질적 측면 모두에서 빠르게 개선되고 있다.
일반적으로 실무에서 머신 러닝이나 고도화된 알고리즘을 적용하려 하면, 먼저 쉽게 접할 수 있는 파이썬이나 R 등과 같은 언어에 기반을 둔 도구로 실험해본다. 실험해보고 나서 유용하다고 판단되면, 기존에 운용하고 있는 서버 및 데이터에 부응하도록 적절히 설계하는 동시에 엔터프라이즈급에 걸맞은 프레임워크를 사용하게 된다. 이러한 측면에서 자바 중심의 JVM 진영에서는 아파치 스파크(Apache Spark)가 크게 각광받고 있다.
회사에서 몇 가지 검토를 마친 후 프로젝트에 스파크를 적용하기로 했다고 가정해보자. 그리고 이를 수행해야 하는 책임이 여러분에게 주어졌다. 스파크는 스칼라로 돼 있기 때문에 여러분이 스칼라에 대한 지식을 어느 정도 갖고 있지 않았다면 회사는 여러분에게 이 일을 맡기지 않았을 것이다. 혹 자바 분야에서 잔뼈가 굵은 개발자라면, 스칼라는 물론 머신 러닝 알고리즘도 처음부터 배워야만 할 수 있다. 어찌 됐든 여러분은 스칼라를 피할 수 없게 됐다.
이제 여러분은 멀티 패러다임 언어로서 스칼라가 지닌 특성과 관련 디자인 패턴 등을 심도 있게 학습해야 한다. 또한 주요 머신 러닝 알고리즘에 대해서도 공부해야 한다. 이 책이야말로 바로 그러한 상황에 놓인 개발자에게 최적의 가이드라 할 수 있다. 이 책은 머신 러닝에 스칼라를 적용하고자 하는 개발자에게 필요한 스칼라의 기본적인 특성부터 데이터 파이프라인과 처리, 주요 머신 러닝 알고리즘의 구현까지 모두 망라해 자세히 설명한다. 대부분의 예제는 금융 데이터를 기반으로 구현돼 있으며, 특히 저자가 직접 스칼라로 작성한 모든 코드와 알고리즘을 상세히 설명한 점이 특징이다. 소스 코드를 살펴보며 저자의 설명을 따라가는 일이 다소 지루하고 힘들 수도 있지만, 한 단계 발전된 개발자가 되려면 피할 수 없는 일이다.
또한 주요 머신 러닝 알고리즘에서 사용되는 수학적 개념과 관련 논문이 부록으로 정리돼 있으므로 필요한 내용을 쉽게 참조할 수 있다. 이 책은 수준 높은 스칼라 코드를 작성하는 데 활용할 수 있는 참고 서적으로도 큰 가치를 지닌다.

목차

1장. 시작하기
__호기심 있는 독자를 위한 수학적 표기법
__왜 머신 러닝인가?
____분류
____예측
____최적화
____회귀
__왜 스칼라인가?
____함수형 언어로서의 스칼라
____객체 지향 언어로서의 스칼라
____확장성 있는 언어로서의 스칼라
__모형 범주화
__머신 러닝 알고리즘의 분류
____비지도 학습
____지도 학습
____준지도 학습
____강화 학습
__자바 라이브러리 활용하기
__도구와 프레임워크
____자바
____스칼라
____SBT
____아파치 커먼즈 매스
____JFreeChart
____그 외 라이브러리와 프레임워크
__소스 코드
____관례
__맛보기
____간단한 작업 흐름 작성하기
__요약


2장. 데이터 파이프라인
__모형화
____모형이란 무엇인가?
____모형 대 디자인
____특성 선택하기
____특성 추출하기
__방법론 정의하기
__모나드적 데이터 변환
____오류 처리
____모나드의 구출
__작업 흐름 연산 모형
____수학적 추상화 지원
____작업 흐름 구축을 위해 믹스인 구성하기
____모듈화하기
__데이터 프로파일링
____불변 통계량
____Z-점수와 가우스 분포
__모형 평가하기
____검증
____곡선하 면적
____교차 검증
____분산-편향 분해
____과적합
__요약


3장. 데이터 전처리
__스칼라에서의 시계열
____컨텍스트 바운드
____타입과 연산
____레이지 뷰
__이동 평균
____단순 이동 평균
____가중 이동 평균
____지수 이동 평균
__푸리에 분석
____이산 푸리에 변환
____DFT 기반 필터링
____시장 순환 감지
__이산 칼만 필터
____상태 공간 추정
____전이 방정식
____측정 방정식
____재귀적 알고리즘
__다른 전처리 기술
__요약


4장. 비지도 학습
__K-평균 군집화
____K-평균
__기댓값-최대화
____가우스 조합 모형
____EM의 개요
____구현
____분류
____테스트
____온라인 EM
____요약


5장. 차원 축소
__모형 복잡도 문제
__발산
____쿨백-라이블러 발산
____상호 정보
__주성분 분석
____알고리즘
____구현
____테스트 사례
____평가
____PCA 확장하기
__비선형 모형
____커널 PCA
____다양체
__요약


6장. 단순 베이즈 분류기
__확률적 그래프 모형
__단순 베이즈 분류기
____다항 단순 베이즈 소개
____구현
__다변량 베르누이 분류
____모형
____구현
__단순 베이즈와 텍스트 마이닝
____기본적인 정보 검색
____구현
____테스트
__장점과 단점
__요약


7장. 순차적 데이터 모형
__마코프 결정 과정
____마코프 성질
____1차 이산 마코프 체인
__은닉 마코프 모형
____표기법
____람다 모형
____디자인
____평가(CF-1)
____훈련(CF-2)
____디코딩
____모두 합치기
____테스트 사례 1: 훈련
____테스트 사례 2: 평가
____필터링 기술로서의 HMM
__조건부 무작위장
____CRF 소개
____선형 연쇄 CRF
__정칙화 CRF와 텍스트 분석
____특성 함수 모형
____디자인
____구현
____테스트
__CRF와 HMM 비교하기
__성능 고려 사항
__요약


8장. 몬테카를로 추론
__샘플링의 목적
__가우스 샘플링
____박스-뮬러 변환
__몬테카를로 근사
____개론
____구현
__교체를 통한 부트스트래핑
____개요
____리샘플링
____구현
____부트스트랩의 장단점
__마코프 연쇄 몬테카를로
____개요
____메트로폴리스-헤이스팅스
____구현
____테스트
__요약


9장. 회귀와 정칙화
__선형 회귀
____일변량 선형 회귀
____통상적인 최소제곱 회귀
__정칙화
____Ln 조도 불이익
____능형 회귀
____디자인
____구현
____테스트 사례
__수치적 최적화
__로지스틱 회귀
____로지스틱 함수
____디자인
____훈련 작업 흐름
____분류
__요약


10장. 다층 퍼셉트론
__전방 전달 신경망
____생물학적 배경
____수학적 배경
__다층 퍼셉트론
____활성화 함수
____네트워크 토폴로지
____디자인
____설정
____네트워크 구성 요소
____모형
____문제의 타입(방식)
____온라인 훈련 대 배치 훈련
____훈련 회차
____훈련과 분류
__평가
____실행 프로파일
____학습률의 영향
____가속도 인자의 영향
____은닉층 개수의 영향
____테스트 사례
__이점과 한계
__요약


11장. 딥러닝
__희소 오토인코더
____저완성 오토인코더
____결정적 오토인코더
____범주화
____전방 전달 희소, 저완성 오토인코더
____희소성 갱신 방정식
____구현
__제한된 볼츠만 머신
____볼츠만 머신
____이항 제한된 볼츠만 머신
__합성곱 신경망
____국소 수용 영역
____가중치 공유하기
____합성곱층
____부표본층
____한데 모으기
__요약


12장. 커널 모형과 서포트 벡터 머신
__커널 함수
____개요
____일반적인 판별 커널
____모나드적 커널 합성
__서포트 벡터 머신
____선형 SVM
____비선형 SVM
____서포트 벡터 분류기
____1계층 SVC로 이상치 찾기
____서포트 벡터 회귀
__성능 고려 사항
__요약


13장. 진화적 연산
__진화
____기원
____NP 문제
____진화적 연산
__유전 알고리즘과 머신 러닝
__유전 알고리즘 구성 요소
____인코딩
____유전 연산자
____적합도 점수
__구현
____소프트웨어 디자인
____핵심 구성 요소
____선택
____개체군 증가율 통제하기
____GA 설정
____교배
____변이
____생식
____풀이기
__거래 전략을 위한 GA
____거래 전략의 정의
____테스트 사례: 2008년 가을 시장 붕괴
__유전 알고리즘의 장점과 위험
__요약


14장. 멀티암드 밴딧
__K-암드 밴딧
____탐색-활용 상반 관계
____기대 누적 후회
____베이즈 베르누이 밴딧
____엡실론-탐욕 알고리즘
__톰슨 샘플링
____밴딧 컨텍스트
____사전/사후 베타 분포
____구현
____시뮬레이션된 탐색과 활용
__신뢰 상단
____신뢰 구간
____구현
__요약


15장. 강화 학습
__강화 학습
____문제 이해하기
____해법: Q-학습
____구현
____Q-학습을 사용한 옵션 거래
____한데 합하기
____평가
____강화 학습의 장점과 단점
__학습 분류기 시스템
____LCS 소개
____학습과 평가 조합하기
____전문 용어
__요약


16장. 스칼라와 아카에서의 병렬화
__개요
__스칼라
____객체 생성
____스트림
____병렬 컬렉션
__액터를 통한 확장성
____액터 모형
____분할
____액터를 넘어: 반응적 프로그래밍
__아카
____마스터-워커
____퓨처
__요약


17장. 아파치 스파크 MLlib
__개요
__아파치 스파크 코어
____왜 스파크인가?
____디자인 원칙
____스파크로 실험하기
__MLlib 라이브러리
____개요
____RDD 만들기
____MLlib을 사용한 K-평균
____테스트
__재사용 가능한 ML 파이프라인
____재사용 가능한 ML 변환
____아파치 스파크와 ScalaTest
__스파크 확장하기
____쿨백-라이블러 발산
____구현
____쿨백-라이블러 평가기
__스트리밍 엔진
____왜 스트리밍인가?
____배치와 실시간 처리
____아키텍처 개요
____이산화 스트림
____사용 사례: 연속적인 파싱
____체크포인팅
__성능 평가
____개변수 조정하기
____성능 고려 사항
__장점과 단점
__요약


부록 A. 기본 개념
__스칼라 프로그래밍
__수학
__금융 101

출판사 서평

★ 이 책에서 다루는 내용 ★

■ 과학적 연산을 위한 동적 작업 흐름 구축
■ 시계열로부터 패턴을 추출하기 위한 오픈소스 라이브러리의 활용
■ 자신만의 분류, 군집화, 진화 알고리즘 작성
■ 스파크의 상대적 성능 조정과 평가 수행
■ 순차적 데이터를 위한 확률적 모형 터득
■ 정칙화와 커널화 같은 고급 기술을 이용한 실험
■ 신경망과 몇몇 딥러닝 아키텍처 파고들기
■ 기본적인 몇 가지 멀티암드 밴딧 알고리즘의 적용
■ 스칼라 병렬 컬렉션, 아카 액터, 아파치 스파크 클러스터를 이용한 빅데이터 문제 해결
■ 금융... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매도서의 문장수집을 기록하면 통합포인트 적립 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서번역서

안내

이 분야의 베스트

  • 윤인성
    16,200원
  • 이남호
    23,310원
  • 한국데이터진흥원
    16,200원
  • 이남호
    23,310원
  • 홍태성
    12,600원
더보기+

이 분야의 신간

  • 블레이크 J. 해리스
    25,200원
  • 길벗R&D
    18,900원
  • 이기창
    31,500원
  • 박해선
    17,820원
  • 길벗R&D
    17,100원
더보기+

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품