본문내용 바로가기
MD의선택 무료배송 이벤트 경품 소득공제

자바 데이터 사이언스 쿡북 Weka, MLlib, DL4j로 즐기는 머신 러닝 & 딥러닝

acorn+Packt
루시디 샴스 지음 | 김우현 옮김 | 에이콘출판 | 2018년 02월 14일 출간
  • 정가 : 30,000원
    판매가 : 27,000 [10%↓ 3,000원 할인]
  • 통합포인트 :
    [기본적립] 1,500원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 : 카드/포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    당일배송 지금 주문하면 오늘(17일,금) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내
장바구니 담기 바로구매

책 그리고 꽃 서비스
책 그리고 꽃 | 책과 꽃을 함께 선물하세요 자세히보기

닫기

바로드림 주문 선물하기 보관함 담기
이벤트도서포함, 5만원이상 구매시 택1 (벚꽃/자동차/나뭇잎/번짐4종, 포인트 차감)
닫기
  • 월간 그림책 갤러리 vol.14
  • 2018 여름방학 유아/어린이/좋은부모 추천도서
  • Toy Book Festival_핑크퐁 썸머패치
  • 심리학 도서 x 피크닉 매트 마인드 바캉스
  • 7월 어린이 손수건
  • 더나은 해답은 반드시 있다
  • 과장K의 비즈니스 리포트
  • 지식인 추천도서 X 아이스 텀블러 2018 인문교양 마스터스 오픈 섬머
  • 이벤트도서포함, 5만원이상 구매시 택1 (블랙/네이비/웜그레이/그레이블루 4종, 포인트 차감)
  • 비치타월 증정 월간 생활책방 8월호
  • 취업콘서트
  • 역사는 여행이다 (유시민 여권케이스)
  • 역사에 부는 바람 (조선왕조실록 출간기념 역사도서전)
  • 교보문고  X 제주관광공사
  • 이기주 작가 사인 북케이스 증정 리-커버:K #19 이기주, 말의 품격
  • 이벤트도서포함, 2만원이상 구매시 택1 (마을/호텔/꽃잎/퍼플 4종, 포인트 차감)

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 에이콘의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2019.12.31
  • 웹개발 입문자를 위한 아주 약간의 가이드
    2017.07.11 ~ 2020.12.31
  • #리드잇 페이스북 페이지 팔로우 하시고, 신간소식 빠르게 받아보..
    2017.06.22 ~ 2025.07.31
  • MANNING, O'REILLY, PACKT, WILE..
    2016.03.07 ~ 2020.12.31
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791161751177(1161751173)
쪽수 428쪽
크기 189 * 238 * 23 mm /818g 판형알림
이 책의 원서/번역서 Java Data Science Cookbook: Explore the power of MLlib, DL4j, Weka, and more/Rushdi Shams

책소개

이 책이 속한 분야

실무에 적합한 데이터 분석 모델을 구축할 때, 자바(Java)가 도움이 될 수 있다. MLlib, Weka, DL4j 등과 같은 강력한 라이브러리를 사용하면 필요한 모든 데이터 과학 작업을 효율적으로 수행할 수 있다. 이 책은 다양한 데이터 과학 관련 문제를 해결하기 위한 방법을 제공한다. 먼저, 데이터를 수집하고 정리하고 인덱스를 생성해 검색하는 데 도움이 되는 방법부터 시작한다. 그리고 데이터에서 정보를 분석 및 학습하는 다양한 기술을 배우게 된다. 또한 대용량 데이터를 처리하고, 머신 러닝과 딥러닝을 적용하고, 데이터를 시각화하는 방법을 배울 수 있다.

저자소개

저자 : 루시디 샴스

캐나다 웨스턴대학교에서 머신 러닝으로 자연어 처리(NLP) 분야의 박사 학위를 받았다. 머신 러닝과 NLP 전문가로 일하기 전에는 학부와 대학원에서 강의했다. 컴퓨터 기술을 학습할 수 있는 유튜브 채널 을 운영하고 있다.

역자 : 김우현

대학생 시절 선배와 함께 창업한 후, 20년 가까이 소프트웨어 개발자로 살아오다가 데이터 분석 분야에서 인생 후반기를 위한 새로운 길을 만들어 가고 있다. 국민대학교 경영대학원에서 빅데이터 MBA 과정을 졸업하고, 현재 숙명여자대학교 나노/바이오 전산화학 연구센터에서 머신 러닝 연구원으로 일하고 있다. 옮긴 책으로는 『R 데이터 구조와 알고리즘』(에이콘, 2017)이 있다.

작가의 말

요즘 데이터 과학은 매우 인기가 많은 전문 분야며 데이터 처리, 정보 검색, 머신 러닝, 자연어 처리, 빅데이터, 심층 신경망(deep neural networks), 데이터 시각화와 같이 인공 지능의 넓은 범위를 다루고 있다. 이 책은 현대적이고 스마트한 기술을 이해할 수 있도록 쉽게 따라 할 수 있는 70개 이상의 레시피를 제시한다.
양질의 데이터 과학자에 대한 높은 요구를 고려해, 코어(core) 자바뿐만 아니라 자바로 작성된 고전적인 라이브러리와 함께 최신 데이터 과학용 라이브러리를 사용해 레시피를 작성했다. 우선 데이터 수집과 정제 프로세스부터 시작해 확보된 데이터에 인덱스를 설정하고 검색하는 방법을 알아본다. 그리고 기술 통계(descriptive statistics)와 추론 통계(inferential statistics)를 모두 다루면서 이를 데이터에 적용해볼 것이다. 그 후, 두 장에 걸쳐 스마트 시스템 구축의 기반이 되는 머신 러닝을 다룬다. 현대적인 정보 처리와 자연어 처리 기법도 다룰 것이다. 떠오르는 분야인 빅데이터의 몇 가지 측면을 함께 다루며, 심층 신경망을 이용한 딥러닝의 기초도 다룬다. 마지막으로 시각적 도구 또는 그래프를 사용해 데이터를 표현하고 데이터로부터 정보를 얻는 방법도 학습할 것이다.
이 책은 데이터 과학에 관심을 가진 모두를 대상으로 하며, 데이터를 더 잘 이해하기 위해 자바를 이용해 데이터 과학을 응용해보는 것을 목적으로 한다.

목차

1장. 데이터 수집과 정제
__서론
__자바를 사용해 하위 디렉터리의 모든 파일명 가져오기
__Apache Commons IO를 사용해 하위 디렉터리의 모든 파일명 가져오기
__자바8을 사용해 텍스트 파일 내용 한 번에 읽기
__Apache Commons IO를 사용해 텍스트 파일 내용 한 번에 읽기
__Apache Tika로 PDF에서 텍스트 추출
__정규 표현식으로 ASCII 텍스트 파일 정제
__Univocity를 사용해 CSV 파일 파싱
__Univocity를 사용해 TSV 파일 파싱
__JDOM으로 XML 파일 파싱
__JSONsimple을 사용해 JSON 파일 쓰기
__JSONsimple을 사용해 JSON 파일 읽기
__JSoup을 사용해 URL로부터 웹 데이터 추출
__셀레늄 웹드라이버를 사용해 웹사이트에서 웹 데이터 추출
__MySQL 데이터베이스에서 테이블 데이터 읽기

2장. 데이터 인덱싱과 검색
__서론
__아파치 루씬으로 데이터 인덱싱
__아파치 루씬으로 인덱싱된 데이터 검색

3장. 데이터의 통계적 분석
__서론
__기술 통계량 생성
__요약 통계량 생성
__여러 개의 분포로부터 요약 통계량 생성하기
__빈도 분포 계산
__문자열에서 단어 빈도 계산
__자바8을 사용해 문자열의 단어 빈도 계산
__단순 회귀
__최소 자승 회귀
__일반화 최소 자승 회귀
__두 데이터셋의 공분산 계산
__두 데이터셋의 피어슨 상관계수 계산
__쌍체 표본 t-테스트
__카이 제곱 테스트
__일원 분산 분석
__콜모고로프-스미르노프 테스트

4장. 데이터로부터 학습하기 - 1부
__서론
__ARFF 파일 생성 및 저장
__머신 러닝 모델의 교차 검증
__테스트 데이터 분류
__필터링된 속성으로 테스트 데이터 분류
__선형 회귀 모델
__로지스틱 회귀 모델
__KMeans 알고리즘으로 데이터 군집화
__클래스를 가진 데이터 군집화
__데이터로부터 연관 규칙 학습
__저수준 방법, 필터링 방법, 메타 분류기를 이용한 피쳐/속성 선택

5장. 데이터로부터 학습하기 - 2부
__서론
__Java-ML 라이브러리를 사용해 데이터에 대한 머신 러닝 수행
__스탠포드 분류기를 이용한 데이터 분류
__MOA를 이용한 데이터 분류
__뮬란을 이용한 데이터 분류

__6장. 텍스트 데이터에서 정보 추출하기
__서론
__자바를 이용한 토큰 추출
__자바를 이용한 문장 추출
__OpenNLP를 이용한 토큰과 문장 추출
__스탠포드 CoreNLP를 이용한 단어의 기본형과 품사 추출, 개체명 인식
__자바를 사용해 코사인 유사도 기준으로 텍스트 유사도 측정
__맬릿을 이용해 텍스트 문서에서 토픽 추출
__맬릿을 이용한 텍스트 문서 분류
__웨카를 이용한 텍스트 문서 분류

7장. 빅데이터 다루기
__서론
__아파치 머하웃을 이용한 온라인 로지스틱 회귀 모델 학습
__아파치 머하웃을 이용한 온라인 로지스틱 회귀 모델 적용
__아파치 스파크를 이용한 단순 텍스트 마이닝 문제 해결
__MLib으로 KMeans 군집화 수행
__MLib으로 선형 회귀 모델 생성
__MLib에서 랜덤 포레스트 모델로 데이터 포인트 분류

8장. 데이터를 깊이 있게 학습하기(딥러닝)
__서론
__DL4j를 이용한 word2vec 신경망 구현
__DL4j를 이용한 DBN 신경망 구현
__DL4j를 이용한 오토인코더 구현

9장. 데이터 시각화
__서론
__2D 사인 그래프 그리기
__히스토그램 그리기
__막대 차트 그리기
__상자 수염 플롯 그리기
__산점도 그리기
__도넛 플롯 그리기
__영역 그래프 그리기

출판사 서평

★ 이 책에서 다루는 내용 ★

■ 데이터 정제 및 전처리 방법
■ 정보 추출과 데이터 변환에 필요한 최신 머신 러닝 기법
■ 대용량의 데이터 저장 및 검색 방법
■ 텍스트 형식인 빅데이터에서의 정보 추출 기술
■ 빅데이터와 딥러닝에 필요한 기본 기술 향상
■ 데이터 시각화 기술을 통해 얻는 가치 있는 인사이트
■ 단계적 학습을 통해 업계 표준적인 실제 데이터 프로덕션 환경에 대한 실력 향상

★ 이 책의 대상 독자 ★

자바로 데이터 과학과 관련된 실제 문제를 해결하고자 하는 모든 독자를 대상으로 한다. 매... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서번역서

안내

이 분야의 베스트

더보기+

이 분야의 신간

  • 세스 스티븐스 다비도위츠
    16,200원
  • 김계철
    23,000원
  • 조현영
    28,800원
  • 김민준
    32,400원
  • 손민규
    22,500원
더보기+

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품