해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
작가정보
저자(글) 최현희
저자 최현희는 분석기업인 데이타솔루션내 데이터부문의 수석 컨설턴트로 근무해 왔으며, 고려대학교 통계학과 박사과정을 수료하였다. 데이터 사이언티스트로서 분석 이론 및 분석이론을 실무에 적용하는 데에 필요한 올바른 데이터 수집, 저장, 분석, 정보 제공의 전반적인 과정에 큰 관심을 가지고 있다. 통계학과 전산학의 기반 지식을 활용하여 데이터 마이닝 업무를 실무에 적용함에 있어 독자들에게 도움이 되고자 IBM Korea 의 소프트웨어 연구소 근무 당시 "Intelligent Miner Application Guide(공저)", "eCRM 실무지침(공저)"을 저술한 바 있다.
저자(글) 최영랑
저자 최영랑은 마케팅 전공 및 MIS부전공으로 경희대학교 경영학 박사학위를 받았으며, KMAC연구위원, 한국NCR 및 한국 테라데이타(Teradata) 상무를 거치면서 현재 기업의 대용량데이터(DW)기반의 CRM 전략 수립 및 마케팅 자동화 관련 컨설팅을 수행하고 있으며 최근에는 Big Data & Mobile기반의 개인화 마케팅 컨설팅을 하고 있다. 주요 프로젝트는 백화점(현대, 갤러리아, 롯데, 신세계 등)과 대형 마트 (이마트, 롯데마트, 한화유통 등)의 국내 유통업을 중심으로 보험업(현대해상, 삼성화재, 동부화재, 신동아화재 등)과 금융업(Standard Chartered은행, 우리투자증권 등) 및 기타 삼성전자, KT&G, 철도청, CJ- CGV 등의 제조 및 서비스업과 같은 다양한 업종에서 컨설팅을 수행하였다.?
목차
- 1. R기반의 데이터 탐색 및 통계분석
1.1 데이터 분석 프로세스
1.1.1 데이터의 이해
1.1.2 분석 프로세스
1.2 R과 분석입문
1.2.1 R의 활용
1.2.2 데이터의 입출력
1.2.3 데이터 구조
1.2.4 데이터 핸들링
1.3 데이터 탐색
1.3.1 GIGO(garbage in garbage out)
1.3.2 그래프를 활용한 탐색
1.4 통계분석
1.4.1 교차표(cross table)
1.4.2 카이제곱 검정(Chi-square test)
1.4.3 분산분석(ANOVA)
1.4.4 t-검정(평균비교)
1.5 파생변수 생성 및 분석 데이터 만들기
1.5.1 최근성 값은 날짜로 계산하여 생성
1.5.2 zipcode를 area code로 변경
1.5.3 구매 시간대 구간화
2. 고객 세분화 모델링
2.1 고객세분화
2.1.1 고객 가치 분석 (RFM 스코어링)
2.1.2 구매 상품 다양성 분석
2.1.3 서비스 경험 분석
2.2상세 세분화(MICRO SEGMENTATION) 모델
2.2.1 잠재 요인에 따른 변수 군집
2.2.2 LDA(latent dirichlet allocation)의 활용
3. 모델 구축 유형
3.1 모델 적용 전 고려해야 할 것들
3.1.1 모델링을 위한 변수 선택과 유의확률(p-value)
3.1.2 변수선택을 위한 상관계수 고려
3.1.3 변수변환
3.1.4 변수 변환을 통한 이상치 제거
3.1.5 이상치 검증
3.2 모델 구축
3.2.1 연관성(association) 분석과 순차패턴(sequential pattern) 분석
3.2.2 협업필터링(collaborative filtering)
3.2.3 회귀분석(regression analysis)
3.2.4 앙상블(ensemble)
3.2.5 Adaboost
3.3 모형검증
4. 머신 러닝 기술과 알고리즘
4.1 분류
4.1.1 지지 벡터 기계(SVM)
4.1.2 임의 숲(random forest)
4.1.3 로지스틱 회귀(logistic regression)
4.2 그룹화
4.3 차원축소
4.3.1 주성분 분석
4.3.2 특이값 분해(SVD)
4.4 시계열 분석 235
참고문헌
책 속으로
[서문 중에서]
최근 분석 툴에 대한 성향의 변화에 맞춰서 서가에는 R의 활용을 주제로 한 R 활용서가 많다. 이들은’R‘을 C나 Java와 같은 프로그래밍 언어로서, 그리고, 다른 상용프로그램들과 같이 데이터 분석을 위한 언어로서 활용하는 방법을 알려준다. 그러나 비즈니스 주제에 접근을 위하여 R을 활용하는 방법에 대하여 기술한 책은 거의 없다는 것이 현실이다. 출판되어 있는 문헌들을 참고로 하여 R의 언어적 활용 수준은 초급 이상이 될 수 있으나, R의 활용을 비즈니스 문제의 해결을 목적으로 하는 독자들에게 도움을 주고자 하는 것이 본 서의 의의라 하겠다. 특히 저자는 본 서를 다양한 상품과 수많은 브랜드를 준비하여 고객 성향이나 니즈 변화를 반영하고 시장의 트랜드와 시즌성에 맞춰서 상품 구색을 확대하거나 감소해야 하는 유통업 비즈니스에서의 상품 추천과 같은 주제를 중심으로 서술하였다.
(중략)
출판사 서평
[이 책의 내용]
1장은 전반적인 데이터 분석 프로세스에 대하여 설명하고, R이라는 프로그램의 사용에 어려움이 있는 독자를 위하여 R의 설치부터 R 구동 방법까지의 과정을 설명하였다. 그리고, 비즈니스 요구 사항, 데이터 탐색 결과, 기초 통계 분석 결과에 따른 파생변수를 정의하고 생성된 파생변수에 대한 장표를 만드는 방법을 기술하였다.
2장에서는 유통업의 업태와 업무 특성을 고려하여 전사 관점의 고객 세분화시 주요변수 선정 및 세분화 방안을 설명하였고, 고객 세분화 이후에 특정 목적인 상세 세분화를 기술하되, 통계 모델 방법인 인자분석, 변수 클러스터링 (hclustvar), 지금까지 문서 분류를 위하여 많이 사용되어 왔던 LDA(잠재 디리슐레 할당) 의 활용 방법을 기술하였다.
3장에서는 개인화 추천을 수행하기 위한 모델링과 이의 검증을 위한 장으로 모델링 방법으로 연관성분석, 순차패턴분석, 협업필터링, 회귀분석을 포함한 확률 예측방법 등과 같은 모델링에 대하여 기술하였다.
4장은 머신 러닝과 알고리즘이라는 제목으로, 1~3장에서 언급되었으나 상세 기술이 없었던 머신 러닝 알고리즘을 간략하게 기술하였다.
[추천사]
저자는 지식과 오랜 경험을 바탕으로 데이터 사이언스를 위한 이론적 배경과 함께, 구현시의 고려점들을 명시하여 독자들이 응용력과 현실성을 가질 수 있도록 배려한다. 손쉽게 접근 할 수 있는 오픈소스인 R 패키지를 활용하여, 데이터로부터 실질적으로 의미 있는 결과를 도출 할 수 있는 구체적인 프로세스를 제시한다. 결과적으로 독자로 하여금 데이터로부터 얻을 수 있는 최종적인 가치인 인사이트를 도출 할 수 있게 한다.
-김동철 (데이타솔루션 데이터부문장, 공학박사)
본 책은 풍부한 실무경험과 해당분야의 깊은 이해를 가지고 계신 두 분의 저자가 실제 사례와 함께, 분석을 위한 이론배경과 기술 측면까지 상세히 다루고 있다. 이론에 비해 R을 다루는 능력이 부족했던 분, R을 다루는 부분은 탁월했지만 이론이 부족한 분, 자기 분야에서 어떻게 데이터를 다루어 볼 수 있는지에 대한 경험이 부족한 분, 모두에게 더할 나위 없이 좋은 책이라 생각한다.
-김종희(대교 CIO)
이 책의 1장에서는 자유로운 자료 다루기를 위한 필수요소 설명이 전형적인 교과서처럼 장황하지 않으면서도 자세한 설명이 포함되어 있다. 일부 R을 이용한 응용분석 저서에서는 이를 생략하거나 축소했던 것과 비교하면 R 소프트웨어의 이해와 2장 이후의 실제 분석 방법을 터득하는데 중요한 역할을 하며, R의 활용에 부담감을 덜어주는데 기여하고 있다. 또 다른 특징은 통계적 분석방법론 중심의 내용구성이 아닌 유통업 비즈니스의 예를 적용하여 데이터 분석의 과정/흐름 중심의 내용 구성으로 실무 적용이 용이하도록 하는 배치가 돋보인다. 그럼에도 불구하고 최신의 통계적 방법론 이해를 위한 내용이 요소요소에 포함되어 있는 특징이 매우 인상적이다. 이와 같은 내용구성은 독자들이 데이터분석시에 전체 흐름을 파악하는 안목을 기르는데 도움이 될 것으로 기대한다.
-이정복(서울아산병원, 울산의대, 의학통계학과 교수)
기본정보
ISBN | 9791187497103 |
---|---|
발행(출시)일자 | 2017년 11월 13일 |
쪽수 | 188쪽 |
크기 |
174 * 232
* 8
mm
/ 340 g
|
총권수 | 1권 |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립