본문내용 바로가기
MD의선택 무료배송 이벤트 소득공제

Amazon Redshift 레드시프트 구축부터 성능, 쿼리, 비용 최적화까지 마스터하기

김현준 , 이성수 지음 | 에이콘출판 | 2019년 10월 31일 출간
클로버 리뷰쓰기
  • 정가 : 30,000원
    판매가 : 27,000 [10%↓ 3,000원 할인]
  • 통합포인트 :
    [기본적립] 1,500원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2천원 추가적립 안내 [회원혜택] 실버등급 이상, 3만원 이상 구매 시 2~4% 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    11월 30일 출고 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내 바로드림 혜택
    휴일에는 바로드림 픽업으로 더 빨리 받아 보세요. 바로드림 혜택받고 이용하기

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 에이콘의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2020.12.31
  • 책을 통해 성장해나가는 개발자를 응원합니다.
    2017.06.22 ~ 2025.07.31
상품상세정보
ISBN 9791161753591(1161753591)
쪽수 324쪽
크기 188 * 235 * 25 mm /765g 판형알림

책소개

이 책이 속한 분야

아마존에서 제공하는 데이터 웨어하우스 서비스인 아마존 레드시프트를 처음 접하는 독자를 위한 책이다. 먼저 레드시프트 클러스터의 아키텍처를 자세히 설명한다. 다음으로 AWS 콘솔에서 클러스터를 생성하고 쿼리를 수행할 때 어떠한 데이터 구조를 가져가야 하는지, 어떤 쿼리를 수행해야 하는지 성능, 보안, 비용 측면에서 자세히 설명한다. 마지막으로 AWS에서 레드시프트 스펙트럼을 이용해 다른 서비스와 함께 데이터 레이크를 구축하는 방법을 예제를 들어 설명한다. 이 책을 읽고 나면 AWS 데이터 웨어하우스 구축의 시작부터 최적화까지 100% 활용할 수 있을 것이다.

작가의 말

★ 지은이의 말 ★
레드시프트를 구축하고 관리하면서 관리자와 사용자로부터 다양한 시행 착오를 겪었다. 데이터 웨어하우스 전반적인 지식이 부족하기도 했고, 아마존 레드시프트 사용 경험과 자료도 부족했기 때문이다. 이 책을 출판하기 전만 해도 국내 서점과 온라인에 아마존 레드시프트 관련 자료를 찾아보기 힘들었다. 그러다 보니 레드시프트를 OLTP 데이터베이스와 같은 방식으로 사용하는 사용자도 많아져서 클러스터를 확장하기 전 관리자와 사용자 교육이 더욱 시급했다. 레드시프트는 빠르면서도 저렴한 OLAP 분석용 데이터베이스다. 물론 제대로 활용했을 때 그렇다. 레드시프트를 용도에 맞지 않게 사용하면 오히려 쿼리 수행 성능이 느려지고, 느려진 성능을 고 사양 노드로 대체하면서 클러스터 비용이 비싸지는 악순환이 발생한다. 이런 레드시프트 관련 오해를 풀고, 레드시프트를 20%가 아닌 120% 활용하길 바라는 마음에 사용자 교육과 운영 경험을 토대로 이 책을 쓰기로 결심했다.
이 책은 레드시프트에 익숙하지 않은 입문자를 위해 작성했다. 레드시프트에 쿼리를 실행하는 사용자와 데이터를 제공하는 데이터 관리자, 레드시프트를 운영하는 클러스터 관리자에게 필요한 내용을 모두 담았다. 사용자, 데이터 관리자, 클러스터 관리자의 역할과 필요한 지식이 크게 다르다고 생각할 수도 있지만, 사실 레드시프트에서 이들이 학습해야 할 내용은 공통 부분이 많다. 레드시프트에서 실행되는 쿼리는 데이터와 클러스터 구성에 따라 성능이 크게 달라지기 때문에 최적화된 쿼리를 작성하기 위해서는 데이터와 시스템 구성을 이해해야 한다. 데이터와 클러스터 관리자도 사용자 쿼리에 최적화된 데이터와 클러스터를 제공하기 위해서 사용자 쿼리 유형을 파악해야 한다.
아마존 레드시프트 매뉴얼의 내용은 최대한 배제하고 실전에 활용할 수 있는 내용과 노하우를 위주로 담았다. 자동차 매뉴얼에는 차를 수리하는 데 사용하는 정비 매뉴얼이 있고, 차를 안전하게 운전하고 차의 기능을 100% 활용하기 위한 운전자 매뉴얼이 있다. 이 책은 운전자 매뉴얼과 같이 레드시프트 클러스터를 안정적이면서도 100% 활용하는 방법을 설명한다. 독자에게 이 책이 큰 도움이 되길 바라며 최고의 성능을 자랑하는 레드시프트 클러스터를 만들어가기 바란다.
2019.9.1
김현준

처음 회사에서 모든 서비스를 AWS로 이관하려 했을 때 막막함을 감출 수 없었다. 이미 수 천 개의 원천 테이블이 수 백 개의 마트 테이블을 생성하고 있었고, 그때 당시 처음 들어보는 데이터베이스에 데이터뿐 아니라 모든 파이프라인까지 이관해야 했기 때문이다. 아마존 레드시프트와 기존에 사용하던 데이터 웨어하우스 장비는 여러 방면에서 다른 특징이 있었으며, 모든 이관 작업을 진행하면서 얻을 수 있는 정보가 아마존 문서밖에 없었기 때문에 여러 시행착오를 겪을 수밖에 없었다. 시행착오 가운데 동료들과 많은 의견을 나누고 때로는 AWS의 도움을 받아가면서 직접 몸으로 부딪혀 하나하나 경험을 얻게 됐고 현재는 안정적으로 클러스터를 운영하고 있다. 이 경험을 바탕으로 레드시프트를 처음 접하며 우리와 같은 고민을 하고 있는 엔지니어에게 경험을 공유할 책을 만들고자 결심했다.
과연 클라우드 환경에서 데이터 웨어하우스를 잘 구축할 수 있을지 걱정했었다. 하지만 아마존 레드시프트는 AWS에서 데이터 웨어하우스를 클라우드 환경에 최적화해 사용할 수 있게 돼 있다. 또한 지속적인 업데이트와 다양한 추가 기능을 제공하기 때문에 이제는 안정적이고 빠른 퍼포먼스를 제공하는 중요한 서비스로 자리매김했다. 특히 클라우드로 서비스가 넘어감에 따라 점차 데이터베이스 관리자와 데이터 엔지니어가 해야 하는 일의 경계가 허물어지고 있는 시점에서 데이터 웨어하우스 개발자와 빅데이터 엔지니어를 모두 포괄할 수 있는 서비스를 제공하고 있다. 이제는 엔지니어가 클러스터를 관리하고, 관리자는 데이터를 알고 최적화할 수 있는 능력이 요구된다. 이 책을 읽는 많은 독자가 엔지니어와 관리자의 경계를 넘나들며 AWS에서 데이터 웨어하우스를 성공적으로 구축할 수 있기를 바란다.
2019.9.1
이성수

목차

CHAPTER 1. AWS 소개

__1.1 클라우드 서비스
__1.2 클라우드 요금 제도
__1.3 고객 지원과 마케팅
____AWS re:Invent
____AWS Summit
____AWS TechConnect
____AWS Transformation Days
____AWS Online Tech Talks
____오픈소스
____API & SDK
____AWS 교육과 자격증
__1.4 지속적인 서비스 진화
__1.5 글로벌 가용성
__1.6 시스템 보안
__1.7 정리


CHAPTER 2. 레드시프트 시작하기

__2.1 Amazon Redshift
____레드시프트의 특징
____레드시프트 포지셔닝
__2.2 시작하기
____AWS 웹 콘솔 접속
____레드시프트 클러스터 생성
____노드 유형
__2.3 접속하기
____데이터베이스 툴
____JDBC 접속
____ODBC 접속
____Python 접속
____CLI 접속
__2.4 레드시프트 아키텍처
____시스템 아키텍처
____데이터 분산
____데이터 저장
__2.5 정리


CHAPTER 3. 데이터 최적화

__3.1 실습 데이터 적재
__3.2 테이블 생성
____CREATE TABLE
____CREATE TABLE AS
____CREATE TABLE LIKE
____CREATE TEMP TABLE
____CREATE TABLE IF NOT EXISTS
____테이블 생성 제약 사항
__3.3 컬럼
____데이터 자료형
____컬럼 인코딩
__3.4 데이터 분산
____테이블 분산 방식
____테이블 분산 방식 선택하기
__3.5 소트키
____존맵(Zone Map)
____컴파운드 소트키(COMPOUND SORT KEY)
____인터리브 소트키(INTERLEAVED SORT KEY)
____소트키 유형 선택하기
__3.6 데이터 적재와 추출
____COPY
____UNLOAD
__3.7 정리


CHAPTER 4. 쿼리 최적화

__4.1 SQL 복습
____WHERE
____GROUP BY
____JOIN
____쿼리 강제 종료
__4.2 쿼리 분석
____쿼리 플래닝
____실행 계획 분석하기
____오퍼레이터
____종료된 쿼리 분석하기
____시스템 점유율 분석하기
__4.3 쿼리 튜닝
____쿼리 패턴 분석과 테이블 디자인
____컬럼 프로젝션
____데이터 스캔 줄이기
____조건절에 함수 피하기
____GROUP BY 튜닝
____커밋 빈도 줄이기
____통계 정보 최신으로 유지하기
____데이터 재 분산 & 재 배포 피하기
____쿼리 결과 최소화하기
__4.4 정리


CHAPTER 5. 클러스터 최적화

__5.1 클러스터 설정
____관리자 뷰
____시스템 테이블
____파라미터 그룹
____WLM
____스냅샷
__5.2 클러스터 모니터링
____레드시프트 웹 콘솔 모니터링
____Audit 로깅
____레드시프트 어드바이저
__5.3 테이블 최적화
____ANALYZE
____VACUUM
____딥 카피
____데이터의 균형
__5.4 클러스터 자동화
____AWS Lambda
____CloudWatch Events
__5.5 정리


CHAPTER 6. 레드시프트 보안

__6.1 레드시프트 네트워크 인프라
____네트워크 플랫폼
____VPC & 서브넷
____라우팅 테이블
____인터넷 게이트웨이
____NAT 게이트웨이
____VPN(Virtual Private Network)
____VPC Endpoints(PrivateLink)
____네트워크 방화벽
__6.2 사용자 인증
____사용자 생성
____그룹 생성
____사용자 인증 보안
__6.3 사용자 권한
____테이블 권한
____스키마 권한
____데이터베이스 권한
____함수 권한
____UDF 언어 권한
____권환 회수
__6.4 데이터 보안
____데이터베이스 암호화
____S3 데이터 암호화
__6.5 SSL
____SSL 연결
____SSL 인증서
____Trust Store
____클러스터 설정
____클라이언트 설정
__6.6 정리


CHAPTER 7. 레드시프트 스펙트럼 사용하기

__7.1 레드시프트 Spectrum
__7.2 스펙트럼 구성하기
____IAM 역할 설정하기
____외부 스키마 생성하기
____외부 테이블 생성하기
____메타데이터 저장소
____테이블 파티셔닝
__7.3 스펙트럼 쿼리 작성하기
____외부 테이블 조회 쿼리 및 비교
____내부 테이블과 외부 테이블의 조인
__7.4 스펙트럼 비용
__7.5 레드시프트 스펙트럼 최적화
____최적화된 데이터 포맷 사용
____압축 파일 사용
____대량 병렬 처리를 위한 파일 분할
____데이터 파티셔닝
__7.6 정리


CHAPTER 8. 부록

__8.1 클러스터 리사이즈
____클래식 리사이즈
____스냅샷 리사이즈
____일래스틱 리사이즈
__8.2 컨커런시 스케일
____컨커런시 스케일 요금
__8.3 AWS Glue
__8.4 Amazon Athena
__8.5 레드시프트 비용
____온디맨드 요금
____리저브드 인스턴스 요금
____레드시프트 비용 절약 방법

출판사 서평

★ 이 책에서 다루는 내용 ★
■ 데이터 분석에 맞춤화된 실습용 레드시프트 클러스터 생성
■ 다양한 형식의 데이터를 적재하고 최적화하는 방법
■ 실습 데이터를 이용해 최적화한 테이블 분산 방식과 소트키 선정 방법
■ 레드시프트 쿼리 프로파일링 방법
■ 레드시프트 쿼리 튜닝 노하우
■ 안정적인 레드시프트 클러스터 구성과 관리, 모니터링 방법
■ 레드시프트 WLM과 스냅샷, VACUUM 작업 100% 이해하기
■ 레드시프트 정보 보안 수준 향상 방법
■ 레드시프트 스펙트럼을 활용한 S3 데이터 쿼리 방법
■ 레드시프트... 더보기

Klover 리뷰 (0)

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면
결제 90일 이내 300원, 발송 후 5일 이내 400원, 이 상품의 첫 리뷰 500원의 포인트를 드립니다.

포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
북로그 리뷰는 본인인증을 거친 회원만 작성 가능합니다.
(※ 외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외) 안내
  • 해당도서의 리뷰가 없습니다.

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매도서의 문장수집을 기록하면 통합포인트 적립 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품