실무로 배우는 빅데이터 기술
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
빅데이터 시스템 구축에 필요한 실무 요건들을 도출하고 이를 해결하기 위한 빅데이터의 수집, 적재, 처리, 분석 아키텍처와 10여 개의 핵심 기술 요소들을 설명하는 방식으로 독자들이 빅데이터를 더욱 쉽게 이해할 수 있게 돕는다.
작가정보
저자(글) 김강원
저자 김강원은 2017년 현재 KT DS의 금융사업TF 소속으로, 대한민국의 1호 인터넷전문은행인 K뱅크에서 빅데이터 프로젝트 총괄 리더 역할을 수행했다. 2000년 중반부터 대용량 데이터 인터페이스 프로젝트를 수행하면서 클라우드 컴퓨팅과 빅데이터 기술에 관심을 갖게 됐고, 현대증권 HTS, 현대중공업 EAI, 삼성 S-클라우드와 KT 오픈플랫폼, KT 빅데이터 분석 플랫폼 등의 프로젝트에 참여했다. 2013년부터는 KT DS의 소프트웨어 기술연구소에서 다양한 오픈소스와 하둡 에코시스템을 연구하기 시작했고, 2014년엔 전사 빅데이터 TF를 리딩하며 빅데이터 버티컬 솔루션인 빅펜스 1.0을 개발해 릴리즈했다.
목차
- ▣ 01장: 빅데이터 이해하기
1.1 빅데이터의 개념
1.2 빅데이터 시장
1.3 빅데이터의 목적
1.4 빅데이터 프로젝트
1.5 빅데이터 기술의 변화
1.6 빅데이터 구현 기술
__수집 기술
__적재 기술
__처리/탐색 기술
__분석/응용 기술
1.7 빅데이터와 보안
__데이터 보안
__접근제어 보안
1.8 마치며
▣ 02장: 빅데이터 파일럿 프로젝트
2.1 파일럿 프로젝트 도메인의 이해
__요구사항 파악
__데이터셋 살펴보기
2.2 빅데이터 파일럿 아키텍처 이해
__소프트웨어 아키텍처
__하드웨어 아키텍처
__구축 환경의 이해
2.3 빅데이터 파일럿 프로젝트용 PC 환경 구성
__자바 설치
__이클립스 설치
__오라클 버추얼 박스 설치
__기타 개발환경 구성
__리눅스 가상 머신 환경 구성
2.4 빅데이터 파일럿 서버 구성
__CentOS 설치
__CentOS 환경 구성
__가상 머신 복제
2.5 클라우데라 매니저 설치
__빅데이터 기본 소프트웨어 설치 - 하둡, 주키퍼 등 기본 구성
__DataNode 추가 및 환경 설정
__HDFS 명령을 이용한 설치 확인
__주키퍼 클라이언트 명령을 이용한 설치 확인
2.6 스마트카 로그 시뮬레이터 설치
2.7 파일럿 환경 관리
2.8 마치며
▣ 03장: 빅데이터 수집
3.1 빅데이터 수집 개요
3.2 빅데이터 수집에 활용할 기술
__플럼
__카프카
3.3 수집 파일럿 실행 1단계 - 수집 아키텍처
__수집 아키텍처
3.4 수집 파일럿 실행 2단계 - 수집 환경 구성
__플럼 설치
__카프카 설치
3.5 수집 파일럿 실행 3단계 - 플럼 수집 기능 구현
__SmartCar 에이전트 생성
__SmartCar 에이전트에 Interceptor 추가
__DriverCarInfo 에이전트 생성
3.6 수집 파일럿 실행 4단계 - 카프카 기능 구현
__카프카 Topic 생성
__카프카 Producer 사용
__카프카 Consumer 사용
3.7 수집 파일럿 실행 5단계 - 수집 기능 테스트
__SmartCar 로그 시뮬레이터 작동
__플럼 에이전트 작동
__카프카 Consumer 작동
__수집 기능 점검
3.8 마치며
▣ 04장: 빅데이터 적재 I - 대용량 로그 파일 적재
4.1 빅데이터 적재 개요
4.2 빅데이터 적재에 활용하는 기술
__하둡
__하둡 아키텍처
__하둡 활용 방안
__주키퍼
__주키퍼 아키텍처
__주키퍼 활용 방안
4.3 적재 파일럿 실행 1단계 - 적재 아키텍처
__적재 요구사항
__적재 아키텍처
4.4 적재 파일럿 실행 2단계 - 적재 환경 구성
__하둡 설치
4.5 적재 파일럿 실행 3단계 - 적재 기능 구현
__SmartCar 에이전트 수정
4.6 적재 파일럿 실행 4단계 - 적재 기능 테스트
__플럼의 사용자 정의 Interceptor 추가
__플럼의 Conf 파일 수정
__SmartCar 로그 시뮬레이터 작동
__플럼 이벤트 작동
__HDFS 명령어 확인
4.7 마치며
▣ 05장: 빅데이터 적재 II - 실시간 로그/분석 적재
5.1 빅데이터 실시간 적재 개요
5.2 빅데이터 실시간 적재에 활용하는 기술
__HBase
__레디스
__스톰
__에스퍼
5.3 실시간 적재 파일럿 실행 1단계 - 실시간 적재 아키텍처
__실시간 적재 요구사항
__실시간 적재 아키텍처
5.4 실시간 적재 파일럿 실행 2단계 - 실시간 적재 환경 구성
__HBase 설치
__레디스 설치
__스톰 설치
5.5 실시간 적재 파일럿 실행 3단계 - 실시간 적재 기능 구현
__카프카 Spout 기능 구현
__Split Bolt 기능 구현
__HBase Bolt 기능 구현
__에스퍼 Bolt 기능 구현
__레디스 Bolt 기능 구현
__레디스 클라이언트 애플리케이션 구현
__HBase 테이블 생성
__스톰 Topology 배포
5.6 실시간 적재 파일럿 실행 4단계 - 실시간 적재 기능 테스트
__로그 시뮬레이터 작동
__HBase에 적재 데이터 확인
__레디스에 적재된 데이터 확인
__레디스 클라이언트 애플리케이션 작동
__실시간 개발 환경 구성
5.7 마치며
▣ 6장: 빅데이터 탐색
6.1 빅데이터 탐색 개요
6.2 빅데이터 탐색에 활용되는 기술
__하이브
__스파크
__우지
__휴
6.3 탐색 파일럿 실행 1단계 - 탐색 아키텍처
__탐색 요구사항
__탐색 아키텍처
6.4 탐색 파일럿 실행 2단계 - 탐색 환경 구성
__하이브 설치
__우지 설치
__휴 설치
__스파크 설치
__탐색 환경의 구성 및 설치 완료
6.5 탐색 파일럿 실행 3단계 - 휴를 이용한 데이터 탐색
__휴의 빠른 시작 마법사 구성
__HDFS에 적재된 데이터 확인
__HBase에 적재된 데이터 확인
__하이브를 이용한 External 데이터 탐색
__하이브를 이용한 HBase 데이터 탐색
__데이터셋 추가
__스파크를 이용한 추가 데이터셋 탐색
6.6 탐색 파일럿 실행 4단계 - 데이터 탐색 기능 구현 및 테스트
__주제 영역 1. 스마트카 상태 정보 모니터링 - 워크플로 작성
__주제 영역 2. 스마트카 운전자 운행 기록 정보 - 워크플로 작성
__주제 영역 3. 이상 운전 패턴 스마트카 정보 - 워크플로 작성
__주제 영역 4. 긴급 점검이 필요한 스마트카 정보 - 워크플로 작성
__주제 영역 5. 스마트카 운전자 차량용품 구매 이력 정보 - 워크플로 작성
6.7 마치며
▣ 07장: 빅데이터 분석
7.1 빅데이터 분석 개요
7.2 빅데이터 분석에 활용 기술
__임팔라
__제플린
__머하웃
__머하웃 아키텍처
__스쿱
7.3 분석 파일럿 실행 1단계 - 분석 아키텍처
__분석 요구사항
__분석 아키텍처
7.4 분석 파일럿 실행 2단계 - 분석 환경 구성
__임팔라 설치
__스쿱 설치
__제플린 설치
__머하웃 설치
7.5 분석 파일럿 실행 3단계 - 임팔라를 이용한 데이터 실시간 분석
__하이브 QL를 임팔라에서 실행하기
__임팔라를 이용한 운행 지역 분석
7.6 분석 파일럿 실행 4단계 - 제플린을 이용한 실시간 분석
__제플린을 이용한 운행 지역 분석
7.7 분석 파일럿 실행 5단계 - 머하웃을 이용한 데이터 마이닝
__머하웃 추천 - 스마트카 차량용품 추천
__머하웃 분류 - 스마트카 상태 정보 예측/분류
__머하웃 군집 - 스마트카 고객 정보 분석
7.8 분석 파일럿 실행 6단계 - 스쿱을 이용한 분석 결과 외부 제공
__스쿱의 내보내기 기능 - 이상 운전 차량 정보
7.9 마치며
▣ 부록: 빅데이터 간접 분석도구 활용
부록 A: R을 이용한 회귀분석 - 스마트카 배기량에 따른 운전자 연소득 예측
__R 설치 및 환경 구성
__R 활용 방안
__R 파일럿 실행 1단계 - 분석 데이터셋 생성
__R 파일럿 실행 2단계 - 하이브 클라이언트 라이브러리 구성
__R 파일럿 실행 3단계 - R에서 하이브 데이터 로드
__R 파일럿 실행 4단계 - 데이터 탐색 및 회귀모델 생성
부록 B: 텐서플로를 이용한 신경망 분석 - 주행 중 스마트카의 위험 징후 판별
__설치 및 환경 구성
__텐서플로 활용 방안
__텐서플로 파일럿 실행 1단계 - 텐서플로 개발 환경 실행
__텐서플로 파일럿 실행 2단계 - 텐서플로를 이용한 딥러닝 학습 및 평가
__텐서플로 파일럿 실행 3단계 - 텐서보드를 이용한 학습 결과 시각화
추천사
-
지금까지 많은 빅데이터 책들이 개념과 이론에 치중해서 출간됐는데, 이 책은 실무 빅데이터 프로젝트를 기반으로 기술에 접근하면서 활용법까지 알려준다.
-
이 책에서는 빅데이터가 어떠한 과정을 통해 인사이트와 가치를 만들어 내는지를 빅데이터 가상 프로젝트를 통해 하나부터 열까지 낱낱이 알려준다.
-
수집/적재된 데이터가 5가지 탐색 과정을 거쳐 머하웃을 통해 고급 분석 영역으로 이어지는 것은 지금까지 어떠한 빅데이터 서적에서도 다루지 못했던 내용이다.
-
빅데이터 경쟁력을 키우기 위해서는 개발자, 설계자, 분석가, 데이터 과학자, 도메인 전문가 등 다양한 관점에서 빅데이터를 바라보고 이해할 수 있어야 하는데, 그때 필요한 책이 바로 이 책이다.
-
책에서 다루는 7개의 목차가 하나의 빅데이터 구축 스토리로 연결됐고, 마지막 7장이 끝날 무렵 내 노트북에는 나만의 빅데이터 도구가 하나 만들어져 있었다.
출판사 서평
★ 이 책에서 다루는 내용 ★
◎ 플럼, 카프카를 이용한 스마트카 상태 정보와 운행정보 수집
◎ 스톰, 에스퍼, 하둡, HBase, 레디스로 대용량 파일과 실시간 데이터 적재
◎ 하이브, 스파크 애드혹 쿼리로 데이터를 선택, 변환, 통합, 축소
◎ 휴, 우지를 통한 빅데이타 마트 구축
◎ 임팔라, 제플린으로 고성능 인메모리 분석을 수행하고 결과를 시각화
◎ 머하웃으로 추천, 분류, 군집 등의 고급 분석
◎ 스쿱을 빅데이터 분석 결과를 다른 응용 시스템의 RDBMS에 익스포트.
★ 개정증보판에서 추가된 내용 ★
◎ 빅데이터 시스템 구축 목적, 프로젝트 유형, 보안 기술 요소에 대한 내용(1장)
◎ 빅데이터의 고급분석 요건과 도구(R, 텐서플로)의 활용(부록)
기본정보
ISBN | 9791158390778 | ||
---|---|---|---|
발행(출시)일자 | 2017년 09월 21일 | ||
쪽수 | 408쪽 | ||
크기 |
187 * 241
* 27
mm
/ 946 g
|
||
총권수 | 1권 | ||
시리즈명 |
데이터베이스 & 빅데이터 시리즈
|
||
이 책의 개정정보 |
새로 출시된 개정판이 있습니다.
개정판보기
|
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립