본문내용 바로가기
MD의선택 무료배송 사은품 소득공제

데이터 플랫폼 설계와 구축 클라우드 데이터 플랫폼 구축 시 고려사항

클라우드 컴퓨팅
다닐 즈부리브스키 , 린다 파트너 지음 | 박종하 , 최철원 , 구본아 옮김 | 에이콘출판 | 2022년 04월 15일 출간
클로버 리뷰쓰기
  • 정가 : 40,000원
    판매가 : 36,000 [10%↓ 4,000원 할인]
  • 혜택 :
    [기본적립] 2000원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2,000원 추가적립 안내 [회원혜택] 회원 등급 별, 3만원 이상 구매 시 2~4% 추가적립 안내 [리뷰적립] 리뷰 작성 시 e교환권 최대 300원 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    지금 주문하면 내일( 6일,수) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내 바로드림 혜택
    휴일에는 바로드림 픽업으로 더 빨리 받아 보세요. 바로드림 혜택받고 이용하기

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
  • 상반기 베스트/추천도서 확인하고 머그&노트 사은품도!
    2022.06.24 ~ 2022.07.31
상품상세정보
ISBN 9791161756370(116175637X)
쪽수 448쪽
크기 189 * 237 * 29 mm /1106g 판형알림
이 책의 원서/번역서 Designing Cloud Data Platforms / Danil Zburivsky

책소개

이 책이 속한 분야

엔터프라이즈 데이터 플랫폼 설계 유용한 개념과 사례를 알아보자!
잘 설계된 데이터 플랫폼의 파이프라인, 스토리지 시스템과 API는 온프레미스 데이터 센터에서 발생하는 복잡한 유지보수 문제와 무분별한 증설, 확장작업을 없애 준다. 클라우드 데이터 플랫폼 설계 패턴을 배우면 어떤 클라우드 공급업체를 사용하더라도 성능을 극대화할 수 있다.
데이터 플랫폼의 유연성을 높이고 비용을 절감하는 6계층 접근 방식을 소개한다. 다양한 소스에서 데이터를 수집하기 위한 패턴을 찾고, 클라우드 공급업체에서 제공하는 서비스를 활용하는 방법을 배울 수 있다.

상세이미지

데이터 플랫폼 설계와 구축(클라우드 컴퓨팅) 도서 상세이미지

작가의 말

◈ 지은이의 말 ◈
이 책은 데이터, 신기술, 고객의 문제 해결을 좋아하는 서로 다른 두 사람의 협업과 팀워크를 통해서 나오게 됐다. 우리는 클라우드 IT 서비스 회사에서 5년 동안 데이터와 분석 관련 일을 하면서 클라우드 분석 사례를 함께 개발했다. 다닐은 수년간의 하둡 경험을 바탕으로 기술적인 부분을, 린다는 비즈니스 관점의 전문성을 기반으로 협업했으며, 비즈니스와 기술이 합쳐져야 실제 데이터 문제를 해결할 수 있음을 깨달은 후 협업을 시작했다. 시간이 지나면서 다닐은 비즈니스지향적으로 바뀌었고 린다는 클라우드와 데이터를 기술적으로 알게 됐다. 우리는 서로 맞대응하기도 하면서 기술지향적인 상황도 경험했다.
빅데이터 플랫폼인 하둡 기반에서 데이터와 분석을 위한 클라우드 네이티브 플랫폼 기반으로 전환하는 것은 쉬운 일이었다. 클라우드와 빅데이터의 가능성이 무궁무진하다고 생각하는 사람 중 하나였던 우리는 회사의 지원을 받아 내부 팀을 구성해서 기술 솔루션을 설계하고 구축하는 프로젝트와 실제 비즈니스 문제를 해결하기 위한 데이터와 클라우드 기반 솔루션 구축 프로젝트도 진행했다. 이 기간 동안 수십여 명의 고객 대상으로 프로젝트를 수행해왔는데, 이 과정들로 관련 지식을 축적하고 모범 사례도 확보할 수 있게 됐다. 이러한 경험을 토대로 기술, 비즈니스 기반의 협업을 통해 더 복잡한 주제도 해결할 수 있을 것이라는 자신감도 생겼고, 이 분야에 관심 있는 분들에게도 관련 사례를 전파하면 좋겠다는 생각을 하게 됐다.
둘 다 업계 행사 같은 곳에서 강연자로 활발히 활동하고 있어 이 기회를 활용해 책 방향성에 대한 아이디어를 정리했고, 참석한 청중들의 피드백을 통해 흐름과 내용을 구체화할 수 있었다. 또한 이해를 돕기 위한 실제 고객 사례를 모아서 정리했다. 2년에 가까운 시간이 걸렸지만 우리 모두 결과에 정말 만족하기에, 여러분도 만족하기를 기대한다.
이 책을 출간하려는 이유는 기술 변화가 불가피하게 일어나고 있는 상황에서 확장 가능하고 유연한 클라우드 데이터 플랫폼을 설계하고자 하는 분들에게 도움을 주고자 함이었다. 클라우드 데이터 플랫폼의 정의부터 왜 중요한지, 또 클라우드 데이터 웨어하우스와 비교했을 때 무엇이 다른지 설명한다. 그리고 데이터 흐름에 따른 데이터의 수집, 구조, 처리, 관리에 이르기까지 더욱 상세한 내용을 다룬다. 다양한 데이터 소비자들이 데이터 플랫폼의 데이터를 어디에서 사용하는지를 살펴보고, 끝으로 클라우드 데이터 플랫폼 프로젝트의 성공에 영향을 미칠 수 있는 공통 비즈니스 이슈들을 짚어본다.

목차

1장. 데이터 플랫폼 소개
1.1 데이터 웨어하우스에서 데이터 플랫폼으로의 이동과 관련된 동향들
1.2 데이터의 속도, 규모, 다양성이 증가하는 상황에서 데이터 웨어하우스의 한계
1.2.1 데이터의 다양성
1.2.2 데이터 규모
1.2.3 데이터 속도
1.2.4 세 가지 V
1.3 데이터 레이크가 대안이 될 수 있을까?
1.4 퍼블릭 클라우드 활용
1.5 클라우드, 데이터 레이크, 데이터 웨어하우스: 클라우드 데이터 플랫폼의 등장
1.6 클라우드 데이터 플랫폼의 빌딩 블록(building block)
1.6.1 수집 계층
1.6.2 스토리지 계층
1.6.3 처리 계층
1.6.4 서비스 계층
1.7 클라우드 데이터 플랫폼이 세 가지 V를 다루는 방법
1.7.1 데이터의 다양성
1.7.2 데이터 규모
1.7.3 데이터 속도
1.7.4 추가 V 두 가지
1.8 공통 유스 케이스
요약

2장. 데이터 웨어하우스만이 아닌 데이터 플랫폼인 이유
2.1 클라우드 데이터 플랫폼과 클라우드 데이터 웨어하우스: 실용적 측면
2.1.1 데이터 소스 자세히 살펴보기
2.1.2 클라우드 데이터 웨어하우스만 활용한 사례
2.1.3 클라우드 데이터 플랫폼 아키텍처 사례
2.2 데이터 수집
2.2.1 애저 시냅스로 직접 데이터 수집
2.2.2 애저 데이터 플랫폼으로 데이터 수집
2.2.3 업스트림 데이터 소스의 변경 관리
2.3 데이터 처리
2.3.1 웨어하우스에서 데이터 처리
2.3.2 데이터 플랫폼에서 데이터 처리
2.4 데이터 액세스
2.5 클라우드 비용 고려사항
요약
2.6 연습문제 정답

3장. 빅 3의 활용과 확대: 아마존, 마이크로소프트 애저, 구글
3.1 클라우드 데이터 플랫폼 계층 아키텍처
3.1.1 데이터 수집 계층
3.1.2 고속 스토리지와 저속 스토리지
3.1.3 처리 계층
3.1.4 기술 메타데이터 계층(Technical metadata layer)
3.1.5 서비스 계층과 데이터 소비자
3.1.6 오케스트레이션 오버레이와 ETL 오버레이 계층
3.2 데이터 플랫폼 아키텍처에서 계층의 중요성
3.3 클라우드 데이터 플랫폼 계층에 활용할 수 있는 툴 매핑
3.3.1 AWS
3.3.2 구글 클라우드
3.3.3 애저
3.4 상용 소프트웨어 및 오픈소스 대안
3.4.1 배치 데이터 수집
3.4.2 스트리밍 데이터 수집 및 실시간 분석
3.4.3 오케스트레이션 계층
요약
3.5 연습문제 답안

4장. 플랫폼으로 데이터 가져오기
4.1 데이터베이스, 파일, API, 스트림
4.1.1 관계형 데이터베이스(Relational databases)
4.1.2 파일
4.1.3 SaaS API
4.1.4 스트림
4.2 관계형 데이터베이스에서 데이터 수집
4.2.1 SQL 인터페이스를 사용해 RDBMS에서 데이터 수집
4.2.2 테이블 전체 데이터 수집
4.2.3 증분 데이터 수집
4.2.4 변경 데이터 캡처
4.2.5 CDC 공급 업체 개요
4.2.6 데이터 타입 변환(Data type conversion)
4.2.7 NoSQL 데이터베이스에서 데이터 수집
4.2.8 RDBMS 또는 NoSQL 수집 파이프라인용 메타데이터 캡처
4.3 파일에서 데이터 수집
4.3.1 수집된 파일 추적
4.3.2 파일 수집 메타데이터 캡처
4.4 스트림 방식의 데이터 수집
4.4.1 배치와 스트리밍 수집의 차이점
4.4.2 스트리밍 파이프라인의 메타데이터 캡처
4.5 SaaS 애플리케이션들로부터 데이터 수집
4.5.1 API 설계 표준의 부재
4.5.2 전체 데이터나 증분 데이터 내보내기(export) 처리 방법의 표준 부재
4.5.3 일반적으로 결과 데이터는 중첩된 JSON 도큐먼트다
4.6 클라우드 데이터 수집에서 네트워크 및 보안 고려 사항
4.6.1 클라우드 데이터 플랫폼과 타 네트워크 간 연결
요약
4.7 연습문제 답안

5장. 데이터의 구성과 처리
5.1 데이터 플랫폼에서 처리(Processing) 계층을 별도로 분리한다는 것
5.2 데이터 처리 스테이지
5.3 클라우드 스토리지 구성
5.3.1 클라우드 스토리지 컨테이너와 폴더
5.4 공통 데이터 처리 단계
5.4.1 파일 포맷 변환
5.4.2 데이터 중복 제거
5.4.3 데이터 품질 검사
5.5 설정 가능한 파이프라인
요약
5.6 연습문제 정답

6장. 실시간 데이터 처리 및 분석
6.1 실시간 수집 계층과 실시간 처리 계층 비교
6.2 실시간 데이터 처리 유스케이스
6.2.1 소매점(Retail) 유스케이스: 실시간 수집
6.2.2 온라인 게임 유스케이스: 실시간 수집과 실시간 처리
6.2.3 실시간 수집과 실시간 처리의 비교 요약
6.3 실시간 수집과 실시간 처리의 활용 시점
6.4 실시간 사용을 위한 데이터 구조화
6.4.1 고속 스토리지의 구조
6.4.2 고속 스토리지 스케일링 방법
6.4.3 실시간 스토리지에서 데이터 구조화
6.5 실시간 시스템에서 공통 데이터 변환
6.5.1 실시간 시스템에서 데이터 중복의 원인
6.5.2 실시간 시스템에서 데이터 중복 제거
6.5.3 실시간 파이프 라인에서 메시지 포맷 변환
6.5.4 실시간 데이터 품질 체크
6.5.5 배치 데이터와 실시간 데이터 결합하기
6.6 실시간 데이터 처리용 클라우드 서비스의 종류
6.6.1 AWS 실시간 처리 서비스
6.6.2 GCP 실시간 처리 서비스
6.6.3 애저 실시간 처리 서비스
요약
6.7 연습문제 해답

7장. 메타데이터 계층 아키텍처
7.1 메타데이터의 의미
7.1.1 비즈니스 메타데이터
7.1.2 파이프라인 메타데이터(데이터 플랫폼 내부 메타데이터)
7.2 파이프라인 메타데이터의 장점
7.3 메타데이터 모델
7.3.1 메타데이터 도메인
7.4 메타데이터 계층 구현 옵션
7.4.1 설정 파일의 모음인 메타데이터 계층
7.4.2 메타데이터 데이터베이스
7.4.3 메타데이터 API
7.5 기존 솔루션 개요
7.5.1 클라우드 메타데이터 서비스
7.5.2 오픈소스 메타데이터 계층
요약
7.6 연습문제 답안

8장. 스키마 관리
8.1 스키마 관리가 필요한 이유
8.1.1 기존 데이터 웨어하우스 아키텍처의 스키마 변경
8.1.2 스키마 온 리드 방식
8.2 스키마 관리 방식
8.2.1 스키마를 계약으로 다루는 방식
8.2.2 데이터 플랫폼의 스키마 관리
8.2.3 스키마 변경 모니터링
8.3 스키마 레지스트리 구현
8.3.1 아파치 아브로 스키마
8.3.2 스키마 레지스트리 솔루션
8.3.3 메타데이터 계층의 스키마 레지스트리
8.4 스키마 진화 시나리오(Schema evolution scenarios)
8.4.1 스키마 호환성 규칙
8.4.2 스키마 진화와 데이터 변환 파이프라인
8.5 스키마 진화와 데이터 웨어하우스
8.5.1 클라우드 데이터 웨어하우스의 스키마 관리 기능
요약
8.6 연습문제 답

9장. 데이터 액세스 방법과 보안
9.1 데이터 소비자 유형
9.2 클라우드 데이터 웨어하우스
9.2.1 AWS 레드시프트
9.2.2 애저 시냅스
9.2.3 구글 빅쿼리(Google BigQuery)
9.2.4 적합한 데이터 웨어하우스 선정하기
9.3 애플리케이션 데이터 액세스
9.3.1 클라우드 관계형 데이터베이스
9.3.2 클라우드 키/밸류 데이터 저장소
9.3.3 전문 검색 서비스
9.3.4 인메모리 캐시
9.4 데이터 플랫폼에서의 머신러닝
9.4.1 클라우드 데이터 플랫폼에서의 머신러닝 모델 라이프사이클
9.4.2 ML 클라우드 협업 툴
9.5 비즈니스 인텔리전스와 리포팅 툴(reporting tool)
9.5.1 BI 툴(Business Intelligence tool)과 클라우드 데이터 플랫폼 통합
9.5.2 BI 툴로 엑셀(Excel) 사용하기
9.5.3 클라우드 공급 업체 서비스에 포함돼 있지 않은 BI 툴
9.6 데이터 보안
9.6.1 사용자, 그룹 및 역할
9.6.2 자격 증명 및 설정 관리
9.6.3 데이터 암호화
9.6.4 네트워크 바운더리(boundary)
요약
9.7 연습문제 정답

10장. 비즈니스 가치 제고를 위한 데이터 플랫폼 활용
10.1 데이터 전략이 필요한 이유
10.2 분석 역량 성숙을 위한 여정
10.2.1 SEE: 데이터로부터 인사이트를 얻는 단계
10.2.2 PREDICT: 데이터를 활용해서 예측하는 단계
10.2.3 DO: 분석 결과를 기반으로 액션을 진행하는 단계
10.2.4 CREATE: 분석을 넘어서 제품에 반영하는 단계
10.3 데이터 플랫폼: 분석 역량 성숙을 강화하는 엔진
10.4 플랫폼 프로젝트 장애물들
10.4.1 시간에 대한 인식 차
10.4.2 사용자 확산
10.4.3 사용자로부터의 신뢰성 확보와 데이터 거버넌스
10.4.4 플랫폼 사일로
10.4.5 달러 댄스
요약

추천사

마이크 젠슨(Mike Jensen)(Arcadia)

“데이터 플랫폼을 처음부터 구축하기에 훌륭한 가이드다!”

우발도 페스카토레(Ubaldo Pescatore)(Generali Business Solutions)

“클라우드 데이터 플랫폼에 대해 포괄적으로 설명하는 귀중한 자료다.”

켄 프리클라스(Ken Fricklas)(Google)

“명확하고 간결하게 설명하면서도 유용한 가이드다. 애플리케이션과 플랫폼의 전체 스펙트럼에 걸쳐 아키텍처와 툴을 훌륭하게 소개한다.”

휴고 크루즈(Hugo Cruz)(People Driven Technology)

“클라우드 데이터 플랫폼의 아키텍처, 도전 과제와 패턴에 대해 실용적이고도 현실적인 관점을 담고 있다.”

출판사 서평

◈ 이 책에서 다루는 내용 ◈

◆ 정형 및 비정형 데이터 세트에 대한 모범 사례
◆ 클라우드 기반 머신러닝 툴
◆ 메타데이터와 실시간 분석
◆ 디펜시브 아키텍처, 액세스, 보안

◈ 이 책의 대상 독자 ◈

데이터 플랫폼이 무엇인지, 클라우드의 장점을 활용한 데이터 플랫폼 설계란 무엇인지 궁금한 독자들을 위한 책이다. 데이터 플랫폼 솔루션을 설계할 때 참고할 수 있는 내용을 상세히 다루고 있으며 기술과 비즈니스 간의 연관성을 기반으로 설명했기에 데이터 분석가, 비즈니스 분석가, 프로덕트 오너와 같이 아키텍처, 솔루션 설계를 직접 ... 더보기

Klover 리뷰 (0)

북로그 리뷰 (0) 쓰러가기

북로그 리뷰는 본인 인증 후 작성 가능합니다.
책이나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 내용은 비공개 처리 될 수 있습니다.
※ 북로그 리뷰 리워드 제공 2021. 4. 1 종료

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매 후 문장수집 작성 시, 리워드를 제공합니다. 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서/번역서

안내
바로가기
  • 우측 확장형 배너 2
  • 우측 확장형 배너 2
최근 본 상품