본문내용 바로가기
MD의선택 무료배송 이벤트 사은품 경품

시작하세요! 하둡 프로그래밍 빅데이터 분석을 위한 하둡 기초부터 YARN까지

데이터베이스 & 빅데이터 시리즈 13 | 개정판 2판
정재화 지음 | 위키북스 | 2016년 05월 12일 출간 (1쇄 2012년 10월 26일)
  • 정가 : 42,000원
    판매가 : 37,800 [10%↓ 4,200원 할인]
  • 제휴할인가 : 28,350 교보-롯데카드 최대 25% 청구할인 카드/포인트 안내
  • 통합포인트 :
    [기본적립] 2,100원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 :
    naver네이버페이 결제 시 무조건 1% 추가 적립 payco페이코 결제 시 최대 1만원 적립 okcashbag 실 결제 금액의 0.5% 적립 안내
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    12월 18일 출고 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 영업점에서 직접 수령 안내
행사도서 포함, 5만원이상 구매시 2018년 캘린더 증정
닫기
  • 나만의 경쟁력, 동양고전 김원중 명품고전 독서대 증정
  • 비모 벽시계
  • 자기계발:버리거나 혹은 얻거나
  • 경제경영 메인이벤트
  • 예비초등학생 추천도서전

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 올해의 IT도서 트렌드, 영예의 주인공은 어떤 책일까요?
    2017.11.28 ~ 2017.12.31
  • 위키북스의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2019.12.31
  • 동료 개발자들의 책장을 살펴보세요 :)
    2017.08.31 ~ 2018.12.31
  • #리드잇 페이스북 페이지 팔로우 하시고, 신간소식 빠르게 받아보..
    2017.06.22 ~ 2025.07.31
  • 대표 IT 컴퍼니 지원자격에 맞춰 준비하자
    06. 21 ~ 12. 31
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791158390389(1158390386)
쪽수 760쪽
크기 188 * 240 * 34 mm /1421g 판형알림

책소개

이 책이 속한 분야

하둡으로 대용량 데이터를 처리하려는 자바 개발자를 위한 실무형 입문서!

빅 데이터의 핵심 플랫폼인 하둡은 대규모 데이터의 분산 처리를 위한 오픈소스 프레임워크다. 더그 커팅이 구글의 논문을 바탕으로 만든 하둡은 초기에는 검색 엔진에서 사용하기 위한 기술로 개발됐지만 지금은 전자 상거래, 포털, 게임, 학술 자료, 의료 정보 등 다양한 분야에서 사용되고 있다. 이 책은 하둡을 처음 시작하거나 이미 하둡을 사용해본 적이 있는 개발자를 대상으로 하며, 하둡의 기본 원리부터 실무 응용까지 초보자의 입장을 배려해서 친절하고 상세하게 설명한다.

저자소개

저자 : 정재화

저자 정재화는 지난 10여년 동안 SI, 대용량 분석 인프라, 웹 퍼블리싱 등 다양한 프로젝트를 경험해왔다. 현재 그루터에서 아파치 오픈 소스 프로젝트인 Tajo 개발 및 빅데이터 시스템 구축 업무를 담당하고 있다. 오픈소스 컨트리뷰션을 좋아하며, 개인 블로그(http://blrunner.com)를 통해 빅데이터 플랫폼에 관한 지식들을 공유하고 있다.

목차

[1부] 하둡 기초

▣ 01. 하둡 살펴보기
1.1 빅데이터의 시대
1.2 하둡이란?
1.3 하둡 에코시스템
1.4 하둡에 대한 오해
1.5 하둡의 과제
1.6 하둡 배포판

▣ 02. 하둡 개발 준비
2.1 실행 모드 결정
2.2 리눅스 서버 준비
2.3 하둡 다운로드
2.4 하둡 실행 계정 생성
2.5 호스트 파일 수정
2.6 인코딩 방식 설정
2.7 자바 설치
2.8 SSH 설정
2.9 하둡 압축 파일 풀기
2.10 하둡 환경설정 파일 수정
2.11 하둡 실행
2.12 예제 실행

▣ 03. 하둡 분산 파일 시스템
3.1 HDFS 기초
3.2 HDFS 아키텍처
3.3 HDFS 명령어
3.4 클러스터 웹 인터페이스
3.5 HDFS 입출력 예제

▣ 04. 맵리듀스 시작하기
4.1 맵리듀스의 개념
4.2 맵리듀스 아키텍처
4.3 WordCount 만들기

[02부] 맵리듀스 애플리케이션 개발

▣ 05. 맵리듀스 기초 다지기
5.1 맵리듀스 잡의 실행 단계
5.2 분석용 데이터 준비
5.3 항공 출발 지연 데이터 분석
5.4 항공 도착 지연 데이터 분석
5.5 사용자 정의 옵션 사용
5.6 카운터 사용
5.7 다수의 파일 출력
5.8 체인

▣ 06. 정렬
6.1 보조 정렬
6.2 부분 정렬
6.3 전체 정렬

▣ 07. 조인
7.1 조인 데이터 준비
7.2 맵 사이드 조인
7.3 리듀스 사이드 조인

[03부] 하둡 운영 및 활용

▣ 08. 맵리듀스 튜닝
8.1 셔플 튜닝
8.2 콤바이너 클래스 적용
8.3 맵 출력 데이터 압축
8.4 DFS 블록 크기 수정
8.5 JVM 재사용
8.6 투기적인 잡 실행
8.7 압축 코덱 선택

▣ 09. 하둡 운영
9.1 클러스터 계획
9.2 네임노드 HA 구성
9.3 파일 시스템 상태 확인
9.4 밸런서
9.5 HDFS 어드민 명령어 사용
9.6 데이터 저장 공간 관리
9.7 데이터노드 제거
9.8 데이터노드 추가
9.9 네임노드 장애 복구
9.10 데이터노드 장애 복구
9.11 셸 스크립트를 이용한 배포 관리
9.12 리눅스 서버 설정

▣ 10. 하둡 부가기능 활용
10.1 하둡 스트리밍
10.2 잡 스케줄러
10.3 MR유닛

▣ 11. 클라우드 환경에서의 하둡 실행
11.1 아마존 웹 서비스(AWS) 소개
11.2 AWS 가입
11.3 EC2 하둡 설정
11.4 S3 설정
11.5 EMR 사용

[04부] 하둡2와의 만남

▣ 12. 하둡2 소개
12.1 하둡2의 등장 배경
12.2 하둡2 특징
12.3 얀
12.4 네임노드 HA
12.5 HDFS 페더레이션
12.6 HDFS 스냅샷
12.7 쇼트 서킷 조회
12.8 헤테로지니어스 스토리지

▣ 13. 하둡2 설치
13.1 프로토콜 버퍼 설치
13.2 하둡2 다운로드
13.3 가상 분산 모드 설치
13.4 네임노드 HA 설치
13.5 하둡2 빌드

▣ 14. 얀 애플리케이션 개발
14.1 예제 애플리케이션 소개
14.2 클라이언트 구현
14.3 애플리케이션마스터 구현
14.4 애플리케이션 구현
14.5 애플리케이션 실행

▣ 15. 얀 아키텍처의 이해
15.1 얀 작업 흐름
15.2 얀 단계별 동작 방식
15.3 보조서비스
15.4 프리엠션
15.5 타임라인 서비스
15.6 얀 이벤트 처리 방식
15.7 아키텍처 심화 학습

▣ 16. 얀 클러스터 운영
16.1 얀 명령어
16.2 포트 설정
16.3 맵리듀스 설정
16.4 얀 스케줄러 설정
16.5 노드매니저 추가 및 제거
16.6 리소스매니저 HA 구성

[05부] 하둡 에코시스템

▣ 17. 하이브
17.1 하이브 아키텍처
17.2 하이브 설치
17.3 하이브QL
17.4 파티션 테이블
17.5 데이터 정렬
17.6 데이터 저장 포맷

▣ 18. 스쿱
18.1 스쿱 아키텍처
18.2 스쿱 설치
18.3 TPC-H 데이터 구성
18.4 데이터 임포트
18.5 데이터 익스포트

▣ 19. 타조
19.1 SQL-온-하둡이란?
19.2 SQL-온-하둡 분류 기준
19.3 타조란?
19.4 타조 설치
19.5 항공 운항 통계 데이터 분석
19.6 파일 포맷
19.7 하이브 연동

[06부] 하둡 적용 사례

▣ 20. 하둡 적용 사례
20.1 네이버: 하둡과 몽고디비를 이용한 로그 분석 시스템
20.2 아프리카TV의 추천 시스템 구축 사례
20.3 타조를 이용한 코호트 분석

[부록]

▣ A. 하둡 개발 환경 설정
A.1 이클립스
A.2 메이븐
A.3 Git

▣ B. HDFS 롤링 업그레이드
B.1 HDFS 롤링 업그레이드란?
B.2 HDFS 롤링 업그레이드 실행하기
B.3 HDFS 업그레이드 복원

▣ C. 용어 설명

▣ D. 참고문헌

추천사

권영길(그루터 대표이사)

"엔터프라이즈 진영에 들어선 하둡과 관련된 최근의 다양한 기술과 기능까지 업그레이드하여 소개함으로써 관련 개발자들에게 더욱 필요한 필독서가 되리라 믿어 의심치 않습니다."

김우승(줌인터넷 연구소장)

"Hadoop2 와 SQL on Hadoop에 대한 전반적인 내용을 빠르게 이해하고자 하는 분들에게도 크게 도움이 될 것이다."

도안구(테크수다 대표)

"나 스스로도 이 책을 통해서 빅데이터 플랫폼들의 변화를 배운다."

출판사 서평

★ 이 책에서 다루는 내용 ★

◎ 리눅스, 아마존 웹 서비스(AWS) 환경에서의 하둡 설치
◎ HDFS와 맵리듀스의 구조 및 활용
◎ 맵리듀스 튜닝, 하둡 클러스터 운영
◎ 하둡2의 구조 및 활용
◎ YARN의 상세 아키텍처 및 클러스터 운영
◎ 헤테로지니어스 스토리지 및 HDFS 롤링 업그레이드
◎ 하둡 에코시스템: 하이브, 스쿱, 타조
◎ 네이버 및 아프리카TV의 하둡 적용 사례

이 책은 하둡의 설치부터 핵심 구성 요소인 HDFS와 맵리듀스의 동작 원리, 그리고 다양한 실용적인 예제를 포함하고 있어 하둡 ... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트 적립은 작성 후 다음 날 혹은 해당 도서 출고 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기+

이 분야의 신간

더보기+

바로가기

  • 우측 확장형 배너 2

최근 본 상품