본문내용 바로가기
MD의선택 무료배송 이벤트 소득공제

엔터프라이즈 데이터 레이크 구축 람다 아키텍처 기반의 엔터프라이즈 데이터 레이크 구축 가이드

데이터 과학
톰시 존 , 판카이 미스라 지음 | 양원국 , 우성한 , 이영호 옮김 | 에이콘출판 | 2018년 04월 30일 출간
클로버 리뷰쓰기
  • 정가 : 40,000원
    판매가 : 36,000 [10%↓ 4,000원 할인]
  • 혜택 :
    [기본적립] 2000원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2,000원 추가적립 안내 [회원혜택] 회원 등급 별, 3만원 이상 구매 시 2~4% 추가적립 안내 [리뷰적립] 리뷰 작성 시 e교환권 최대 300원 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 도서상태 : 절판

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
  • 책을 통해 성장해나가는 개발자를 응원합니다.
    2017.06.22 ~ 2025.07.31
  • MANNING, O'REILLY, PACKT, WILE..
    2016.03.07 ~ 2022.12.31
상품상세정보
ISBN 9791161751399(1161751394)
쪽수 688쪽
크기 189 * 236 * 38 mm /1240g 판형알림
이 책의 원서/번역서 Data Lake for Enterprise: Leveraging Lambda Architecture for building Enterprise Data Lake Systems / Packt Publishing

책소개

이 책이 속한 분야

2019년 대한민국학술원 우수학술도서 선정도서

디지털 트랜스포메이션을 추구하는 기업이 빅데이터 가치 실현에 필요한 기업 내 단일 저장소인 '데이터 레이크'를 구축할 수 있도록 안내하는 실전서이다. 데이터에 대한 이해부터 아키텍처 구축에 필요한 코드까지 모든 과정을 망라해, 데이터 레이크 구축에 어려움을 겪는 기업에게 이정표가 될 것이다.

★ 이 책에서 다루는 내용 ★
■ 적절한 빅데이터 기술을 사용해 엔터프라이즈급 데이터 레이크 구축
■ 람다 아키텍처의 핵심과 엔터프라이즈 환경에 적용하는 방법 이해
■ 아파치 스쿱(Sqoop)과 그 기능에 대한 기술적 세부 사항
■ 카프카(Kafka)와 하둡 구성요소를 통합해 엔터프라이즈 데이터 획득
■ 스트림 기반 처리를 위한 스트리밍 기술과 플룸 사용 방법 학습
■ 아파치 플링크(Flink)의 스트림 기반 처리에 대한 이해
■ 하둡 구성 요소 통합 방법과 엔터프라이즈 환경의 데이터 레이크에 제공할 수 있는 장점
■ 일래스틱 스택(Elastic Stack)을 사용해 고성능 스트리밍 애플리케이션을 빠르게 구축
■ 설정으로 다양한 유형의 데이터 포맷을 데이터 획득 과정에서 일관되게 처리하는 방법

★ 이 책의 대상 독자 ★
■ 기업에서 엔터프라이즈급 데이터 레이크를 구현하고자 하는 자바 개발자나 설계자
■ 람다 아키텍처와 빅데이터 기술에 대한 실제 경험을 얻으려는 자바 개발자
■ 빅데이터의 세계를 발견하고 해당 기술을 사용해 실용적인 솔루션을 구현하고자 하는 자바 개발자

작가의 말

데이터는 많은 기업에서 매우 중요해지고 있으며, 이제는 다양한 측면에서 중추적인 역할을 담당하고 있다. 사실 기업들은 데이터를 활용해 스스로를 변화시키고 있다. 이 책은 데이터에 대한 소개와 기업 및 데이터의 관련성, 그리고 디지털 방식으로 변화할 때 데이터를 사용하는 방법을 소개하면서 시작된다. 데이터를 활용하려는 기업은 우선 데이터 저장소가 필요하며, 현대에는 이를 데이터 웨어하우스가 아닌 데이터 레이크라 부른다.
최근에는 빅데이터 기술을 활용한 사례를 많이 목격할 수 있다. 데이터 레이크라는 개념은 꽤 오래됐지만, 최근 들어 기업 환경에서 더 주목 받고 있다. 이 책에서는 빅데이터와 데이터 레이크 두 가지 모두를 융합해 잘 정립한 아키텍처 패턴에 따라 최신 빅데이터 기술을 사용해 직접 데이터 레이크를 구축해본다.
이 책은 데이터 레이크와 람다 아키텍처를 하나로 결합해 독자가 기업에서 실제로 데이터 레이크를 운영할 수 있게 안내할 것이다. 여러 가지 빅데이터 기술을 상위 수준으로 소개할 것이며, 기술별로 다루는 내용은 별도의 책으로 나올 정도로 방대하기 때문에 이 책을 매뉴얼 대용으로 사용할 수는 없을 것이다. 이 책은 선택된 기술을 사용한 패턴 설명과 구현 방법 위주로 다룬다.
여기에 소개된 기술은 미래에 조직의 관련 표준에 따라 좀 더 적합한 기술로 대체될 수 있으며, 이를 염두에 두고 작성됐기 때문에 지금뿐만 아니라 오랜 시간 동안 유의미한 책이 될 수 있을 것이다. 특정 버전을 기준으로 소프트웨어 기술을 서술하지 않았기 때문에 이 책이 갖는 유효 기간은 같은 주제를 다루는 다른 책과 비교할 때 상당히 길 것이다.
이 책은 직관적이고 흥미로운 구조를 통해 당신을 환상적인 데이터 레이크의 세계로 안내할 것이다.

목차

1부. 개요
1장. 데이터에 대한 소개
__데이터 탐색
__엔터프라이즈 데이터란?
__엔터프라이즈 데이터 관리
__빅데이터의 개념
__데이터의 연관성
__데이터의 품질
__데이터는 어디에 있을까?
__엔터프라이즈 환경의 현재 상태
__기업의 디지털 트랜스포메이션은
__데이터 레이크 사용 사례 이해
__요약

2장. 데이터 레이크의 개념
__데이터 레이크란 무엇인가?
__데이터 레이크는 기업을 어떻게 도울 수 있을까?
__데이터 레이크는 어떻게 동작하는가?
__데이터 레이크와 데이터 웨어하우스의 차이점
__데이터 레이크 구축을 위한 접근법
__람다 아키텍처 기반의 데이터 레이크
__요약

3장. 람다 아키텍처 패턴
__람다 아키텍처란?
__람다 아키텍처의 역사
__람다 아키텍처의 원칙
__람다 아키텍처의 컴포넌트
__람다 아키텍처의 완전한 동작 방식
__람다 아키텍처의 장점
__람다 아키텍처의 단점
__람다 아키텍처 관련 기술 개요
__람다 아키텍처 응용
__람다 아키텍처의 실제 활용 사례
__카파 아키텍처
__요약

4장. 데이터 레이크에 적용된 람다 아키텍처
__하둡 배포판
__엔터프라이즈 환경의 빅데이터 체계를 위한 선택 기준
__데이터 처리를 위한 배치 계층
__제공 계층
__요약

2부. 데이터 레이크의 기술적 구축 단위
5장. 아파치 스쿱을 사용한 배치 데이터 획득
__데이터 레이크의 배경: 데이터 획득
__아파치 스쿱인 이유
__스쿱으로 작업
__스쿱 커넥터
__스쿱의 HDFS 지원
__스쿱 작동 예
__스쿱을 사용해야 하는 경우
__스쿱을 사용하지 말아야 하는 경우
__실시간 스쿱: 가능한가?
__대안
__요약

6장. 아파치 플룸을 사용한 스트림 데이터로부터 데이터 획득
__데이터 레이크 관점에서 데이터 획득
__플룸을 선택한 이유
__플룸 아키텍처 원칙
__플룸 아키텍처
__플룸 이벤트: 스트림 데이터
__플룸 에이전트
__플룸 소스
__플룸 채널
__플룸 싱크
__플룸 설정
__플룸 트랜잭션 관리
__기타 플룸 컴포넌트
__문맥 라우팅
__플룸 구동 예제
__플룸을 사용할 때
__플룸을 사용하지 말아야 할 때
__다른 선택 사항
__요약

7장. 아파치 카프카를 사용한 메시지 전달 계층
__데이터 레이크의 상황: 메시지 전달 계층
__왜 아파치 카프카인가?
__카프카 구조
__기타 카프카 컴포넌트
__카프카 프로그래밍 인터페이스
__프로듀서와 컨슈머 신뢰성
__카프카 보안
__메시지 중심 미들웨어로서의 카프카
__카프카의 수평 확장 아키텍처
__카프카 커넥트
__카프카 동작 예제
__카프카를 사용할 때
__카프카를 사용하지 말아야 할 때
__기타 옵션
__요약

8장. 아파치 플링크를 사용한 데이터 처리
__데이터 레이크의 상황: 데이터 흡수 계층
__아파치 플링크를 사용하는 이유
__플링크의 동작 방식
__플링크 API
__플링크 동작 예제
__플링크를 사용해야 하는 경우
__플링크를 사용하면 안 되는 경우
__플링크의 대안
__요약

9장. 아파치 하둡을 사용한 데이터 저장소
__데이터 레이크의 상황: 데이터 저장 및 람다 배치 계층
__하둡을 사용하는 이유
__하둡의 동작 방식
__하둡 에코시스템
__하둡 배포판
__HDFS와 데이터 형식
__근실시간 애플리케이션을 위한 하둡
__하둡 배포 모드
__하둡 동작 예제
__하둡을 사용하면 안 되는 경우
__기타 하둡 처리 옵션
__요약

10장. 일래스틱서치 색인 데이터 저장소
__데이터 레이크의 상황: 데이터 저장소와 람다 속도 계층
__일래스틱서치란?
__일래스틱서치를 사용하는 이유
__일래스틱서치의 동작 방식
__엘라스틱 스택
__엘라스틱 클라우드
__일래스틱서치 DSL(쿼리 DSL)
__일래스틱서치의 노드
__일래스틱서치와 관계형 데이터베이스
__일래스틱서치 에코시스템
__일래스틱서치 배포 옵션
__일래스틱서치 클라이언트
__빠른 스트리밍 계층을 위한 일래스틱서치
__일래스틱서치 데이터 소스
__콘텐츠 색인을 위한 일래스틱서치
__일래스틱서치와 하둡
__일래스틱서치 동작 예제
__일래스틱서치를 사용해야 하는 경우
__일래스틱서치를 사용하면 안 되는 경우
__일래스틱서치의 다른 대안
__요약

3부. 모두 통합
11장. 데이터 레이크 컴포넌트 연동
__데이터 레이크를 어디까지 구현했을까?
__데이터 레이크의 핵심 아키텍처 원칙
__엔터프라이즈 환경의 데이터 레이크가 직면한 과제
__데이터 레이크에 기대하는 것
__다른 활동을 위한 데이터 레이크
__데이터 저장소에 대해 자세히 알아보기
__데이터 처리에 대해 자세히 알아보기
__데이터 보안에 대한 생각
__데이터 암호화에 대한 생각
__데이터 관리 및 거버넌스
__데이터 감사에 대한 생각
__데이터 추적성에 대한 생각
__제공 계층 더 알아보기
__요약

12장. 데이터 레이크 활용 방법 제안
__엔터프라이즈 환경에 사이버 보안 적용
__기업에 대한 고객 인식 알아내기
__효율적인 창고 관리
__브랜드 개발과 기업 마케팅
__더 높은 수준의 개인화 구현
__IoT 데이터 분석 능력 갖추기
__더 실용적이고 유용한 데이터 기록 저장소
__기존 데이터 웨어하우스 인프라 보완
__통신사의 보안 및 규제 준수
__요약

추천사

토마스 벤자민(GE 디지털항공 CTO)

지난 40~50년 동안 기업은 발전하면서 조직 관리 전반에 IT/소프트웨어 시스템을 도입해 느리지만 꾸준히 발전시켜왔다. 오늘날 [포춘(Fortune)] 선정 200대 기업은 각각 250개 이상의 애플리케이션을 운영하고 있을... 더보기

출판사 서평

1부 ‘개요’에서는 데이터, 데이터 레이크, 그리고 주요 컴포넌트와 관련된 다양한 개념을 소개한다. 1부는 다음과 같은 4개의 장으로 구성돼 있다.
1장, ‘데이터에 대한 소개’에서는 책 전반에 대해 소개하고 데이터가 무엇인지, 그리고 기업에서 데이터가 갖는 의미를 살펴본다. 또한 현대에서 데이터는 왜 중요하며 어떻게 사용할 수 있는지 설명한다. 실제 사례를 통해 데이터의 중요성을 살펴보고, 데이터가 오늘날 비즈니스를 어떻게 변화시키는지 알아본다. 실제 사례를 통해 데이터를 이용해 기업에 변화를 줄 방법에 대해 생각해볼 수 있는 ... 더보기

Klover 리뷰 (0)

북로그 리뷰 (0) 쓰러가기

북로그 리뷰는 본인 인증 후 작성 가능합니다.
책이나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 내용은 비공개 처리 될 수 있습니다.
※ 북로그 리뷰 리워드 제공 2021. 4. 1 종료

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매 후 문장수집 작성 시, 리워드를 제공합니다. 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서/번역서

안내
바로가기
  • 우측 확장형 배너 2
  • 우측 확장형 배너 2
최근 본 상품