데이터 중심 애플리케이션 설계
도서+교보Only(교보배송)을 함께 15,000원 이상 구매 시 무료배송
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
책 소개
이 책이 속한 분야
- 국내도서 > 컴퓨터/IT > 데이터베이스 > 데이터베이스일반
- 국내도서 > 컴퓨터/IT > 전산통계/해석 > 자료분석/빅데이터
- 국내도서 > 컴퓨터/IT > 웹프로그래밍 > 웹프로그래밍일반
마틴 클레프만은 이 실용적이고 포괄적인 안내서에서 데이터를 처리하고 저장하는 다양한 기술의 장단점을 검토한다. 이 책은 여러분이 거대한 문제 공간 속을 항해하는 데 좋은 길잡이가 될 것이다. 소프트웨어는 계속 변하지만 근본 원리는 동일하다. 이 책에서 소프트웨어 엔지니어와 아키텍트는 실전에 이 개념을 어떻게 적용하는지, 그리고 현대 애플리케이션에서 어떻게 데이터를 최대한 활용하는지 배운다.
작가정보
저자(글) 마틴 클레프만
저자 마틴 클레프만은 영국 캠브리지 대학에서 분산 시스템을 연구하는 연구원이다. 마틴은 링크트인(LinkedIn)과 래포티브(Rapportive) 등의 인터넷 회사에서 대규모 데이터 인프라를 다루는 소프트웨어 엔지니어와 사업가로 일했다. 그 과정에서 많은 고생을 하며 몇 가지를 배웠고 사람들이 이 같은 실수를 반복하지 않기를 바라는 마음에 이 책을 썼다.
마틴은 정규 컨퍼런스 강연자이자 블로거, 오픈소스 공헌자로 활약 중이다. 그는 심오한 기술적 개념은 모든 사람들이 쉽게 접근 가능해야 하고 이해가 깊으면 깊을수록 더 좋은 소프트웨어를 개발하는 데 도움이 된다고 믿는다.
번역 정재부
역자 정재부는 현재 네이버에서 다양한 분산 오픈소스 솔루션을 이용한 데이터 처리 플랫폼을 개발, 운영하고 있다. 하둡, 슬라이더 기반의 멀티테넌트 분산 플랫폼 구축과 스톰, 스팍을 이용한 데이터 처리 프레임워크 개발에 관심이 많다. 《빅데이터: 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법》(정보문화사, 2016)을 공역했다.
번역 김영준
역자 김영준은 아주대학교에서 컴퓨터공학을 전공했다. 네이버에서 검색 서비스, 모니터링 시스템, 증분 검색 솔루션을 개발했다. 현재는 딥러닝에 기반한 이미지 검색 기술을 연구하고 있다. 《빅데이터: 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법》(정보문화사, 2016)을 공역했다.
번역 이도경
역자 이도경은 서울대학교 컴퓨터 공학부를 졸업했고 동 대학원에서 석사 학위를 받았다. 네이버에서 검색 시스템 개발과 시스템 운영을 경험했고 대규모 실시간 처리 시스템 설계와 개발 및 시스템 운영을 했다. 지금은 이전 빅데이터 처리 경험을 바탕으로 대규모 실시간 추천 시스템을 설계, 개발, 운영하고 있다. 《빅데이터: 람다 아키텍처로 알아보는 실시간 빅데이터 구축의 핵심 원리와 기법》(정보문화사, 2016)을 공역했다.
목차
- [Part 1] 데이터 시스템의 기초
▣ 01장: 신뢰할 수 있고 확장 가능하며 유지보수하기 쉬운 애플리케이션
데이터 시스템에 대한 생각
신뢰성
하드웨어 결함
소프트웨어 오류
인적 오류
신뢰성은 얼마나 중요할까?
확장성
부하 기술하기
성능 기술하기
부하 대응 접근 방식
유지보수성
운용성: 운영의 편리함 만들기
단순성: 복잡도 관리
발전성: 변화를 쉽게 만들기
정리
참고 문헌
▣ 02장: 데이터 모델과 질의 언어
관계형 모델과 문서 모델
NoSQL의 탄생
객체 관계형 불일치
다대일과 다대다 관계
문서 데이터베이스는 역사를 반복하고 있나?
관계형 데이터베이스와 오늘날의 문서 데이터베이스
데이터를 위한 질의 언어
웹에서의 선언형 질의
맵리듀스 질의
그래프형 데이터 모델
속성 그래프
사이퍼 질의 언어
SQL의 그래프 질의
트리플 저장소와 스파클
초석: 데이터로그
정리
참고 문헌
▣ 03장: 저장소와 검색
데이터베이스를 강력하게 만드는 데이터 구조
해시 색인
SS테이블과 LSM 트리
B 트리
B 트리와 LSM 트리 비교
기타 색인 구조
트랜잭션 처리나 분석?
데이터 웨어하우징
분석용 스키마: 별 모양 스키마와 눈꽃송이 모양 스키마
칼럼 지향 저장소
칼럼 압축
칼럼 저장소의 순서 정렬
칼럼 지향 저장소에 쓰기
집계: 데이터 큐브와 구체화 뷰
정리
참고 문헌
▣ 04장: 부호화와 발전
데이터 부호화 형식
언어별 형식
JSON과 XML, 이진 변형
스리프트와 프로토콜 버퍼
아브로
스키마의 장점
데이터플로 모드
데이터베이스를 통한 데이터플로
서비스를 통한 데이터플로: REST와 RPC
메시지 전달 데이터플로
정리
참고 문헌
[Part 2] 분산 데이터
고부하로 확장
비공유 아키텍처
복제 대 파티셔닝
참고 문헌
▣ 05장: 복제
리더와 팔로워
동기식 대 비동기식 복제
새로운 팔로워 설정
노드 중단 처리
복제 로그 구현
복제 지연 문제
자신이 쓴 내용 읽기
단조 읽기
일관된 순서로 읽기
복제 지연을 위한 해결책
다중 리더 복제
다중 리더 복제의 사용 사례
쓰기 충돌 다루기
다중 리더 복제 토폴로지
리더 없는 복제
노드가 다운됐을 때 데이터베이스에 쓰기
정족수 일관성의 한계
느슨한 정족수와 암시된 핸드오프
동시 쓰기 감지
정리
참고 문헌
▣ 06장: 파티셔닝
파티셔닝과 복제
키-값 데이터 파티셔닝
키 범위 기준 파티셔닝
키의 해시값 기준 파티셔닝
쏠린 작업부하와 핫스팟 완화
파티셔닝과 보조 색인
문서 기준 보조 색인 파티셔닝
용어 기준 보조 색인 파티셔닝
파티션 재균형화
재균형화 전략
운영: 자동 재균형화와 수동 재균형화
요청 라우팅
병렬 질의 실행
정리
참고 문헌
▣ 07장: 트랜잭션
애매모호한 트랜잭션의 개념
ACID의 의미
단일 객체 연산과 다중 객체 연산
완화된 격리 수준
커밋 후 읽기
스냅숏 격리와 반복 읽기
갱신 손실 방지
쓰기 스큐와 팬텀
직렬성
실제적인 직렬 실행
2단계 잠금(2PL)
직렬성 스냅숏 격리(SSI)
정리
참고 문헌
▣ 08장: 분산 시스템의 골칫거리
결함과 부분 장애
클라우드 컴퓨팅과 슈퍼컴퓨팅
신뢰성 없는 네트워크
현실의 네트워크 결함
결함 감지
타임아웃과 기약 없는 지연
동기 네트워크 대 비동기 네트워크
신뢰성 없는 시계
단조 시계 대 일 기준 시계
시계 동기화와 정확도
동기화된 시계에 의존하기
프로세스 중단
지식, 진실, 그리고 거짓말
진실은 다수결로 결정된다
비잔틴 결함
시스템 모델과 현실
정리
참고 문헌
▣ 09장: 일관성과 합의
일관성 보장
선형성
시스템에 선형성을 부여하는 것은 무엇인가?
선형성에 기대기
선형성 시스템 구현하기
선형성의 비용
순서화 보장
순서화와 인과성
일련번호 순서화
전체 순서 브로드캐스트
분산 트랜잭션과 합의
원자적 커밋과 2단계 커밋(2PC)
현실의 분산 트랜잭션
내결함성을 지닌 합의
멤버십과 코디네이션 서비스
정리
참고 문헌
[Part 3] 파생
▣ 10장: 일괄 처리
유닉스 도구로 일괄 처리하기
단순 로그 분석
유닉스 철학
맵리듀스와 분산 파일 시스템
맵리듀스 작업 실행하기
리듀스 사이드 조인과 그룹화
맵 사이드 조인 일괄 처리
워크플로의 출력
하둡과 분산 데이터베이스의 비교
맵리듀스를 넘어
_중간 상태 구체화
그래프와 반복 처리
고수준 API와 언어
정리
참고 문헌
▣ 11장: 스트림 처리
이벤트 스트림 전송
메시징 시스템
파티셔닝된 로그
데이터베이스와 스트림
시스템 동기화 유지하기
변경 데이터 캡처
이벤트 소싱
상태와 스트림과 불변성
스트림 처리
스트림 처리의 사용
시간에 관한 추론
스트림 조인
내결함성
정리
참고 문헌
▣ 12장: 데이터 시스템의 미래
데이터 통합
파생 데이터에 특화된 도구의 결합
일괄 처리와 스트림 처리
데이터베이스 언번들링
데이터 저장소 기술 구성하기
데이터플로 주변 애플리케이션 설계
파생 상태 관찰하기
정확성을 목표로
데이터베이스에 관한 종단 간 논증
제약 조건 강제하기
적시성과 무결성
믿어라. 하지만 확인하라.
옳은 일 하기
예측 분석
사생활과 추적
정리
참고 문헌
용어집
추천사
-
“이 책은 물건이다. 분산 시스템 이론과 실제 엔지니어링 사이의 거대한 간격을 메우는 책이다. 이 책은 10년 전에 나왔어야 했다. 그때 내가 이 책을 읽었다면 그동안 저질렀던 실수를 하지 않았을 것이다.”
-
소프트웨어 엔지니어라면 모두 이 책을 읽어야 한다. 《데이터 중심 애플리케이션 설계》는 이론과 실전을 넘나드는 책으로 데이터 인프라와 시스템을 설계하고 구현하는 개발자가 현명한 결정을 내려야 할 때 이 정도 도움을 줄 수 있는 책은 거의 없다.”
출판사 서평
이 책에서 배우는 내용
◎ 기존에 사용하고 있는 시스템의 내부를 자세히 들여다보고 더 효율적으로 사용하고 운용하는 방법을 배운다.
◎ 정보에 입각한 의사결정이 가능하게끔 다양한 도구의 강점과 약점을 파악한다.
◎ 일관성, 확장성, 내결함성, 복잡성에 관한 트레이드오프를 배운다.
◎ 현대 데이터베이스의 기반이 되는 분산 시스템 연구를 이해한다.
◎ 주요 온라인 서비스의 배경을 파악하고 서비스 아키텍처를 배운다.
기본정보
ISBN | 9791158390983 | ||
---|---|---|---|
발행(출시)일자 | 2018년 04월 12일 | ||
쪽수 | 608쪽 | ||
크기 |
190 * 242
* 31
mm
/ 1285 g
|
||
총권수 | 1권 | ||
시리즈명 |
데이터베이스 & 빅데이터 시리즈
|
||
원서명/저자명 | Designing Data-Intensive Applications/Kleppmann, Martin |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립