본문내용 바로가기
MD의선택 무료배송 이벤트 소득공제

R 시뮬레이션 빅데이터와 샘플 데이터를 연결하다

마티아스 템플 지음 | 김재민 옮김 | 에이콘출판 | 2019년 09월 30일 출간
  • 정가 : 35,000원
    판매가 : 31,500 [10%↓ 3,500원 할인]
  • 통합포인트 :
    [기본적립] 1,750원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 3만원 이상 구매 시 2~4% 추가적립
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    01월 20일 출고 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내 바로드림 혜택
    휴일에는 바로드림 픽업으로 더 빨리 받아 보세요. 바로드림 혜택받고 이용하기

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • IT전문서 올해의 책 후보 발표! 지금 투표해주세요!
    2019.12.13 ~ 2020.01.31
  • 개발자로 입문하기: 일단 이것부터 읽어보자!
    2019.05.31 ~ 2020.12.31
  • 에이콘의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2020.12.31
  • MANNING, O'REILLY, PACKT, WILE..
    2016.03.07 ~ 2020.12.31
상품상세정보
ISBN 9791161753362(1161753362)
쪽수 492쪽
크기 189 * 236 * 29 mm /925g 판형알림
이 책의 원서/번역서 Simulation for Data Science with R/Templ, Matthias

책소개

이 책이 속한 분야

석사 또는 박사 과정에서 공부한 경험이 있다면 대게 샘플 데이터를 이용해서 모집단을 추정하고 예측하는 전통적 연구 방법에 익숙할 것이다. 샘플 데이터로 분석한다는 것은 많은 가정이 요구되는 작업이기도 하며 샘플 데이터의 질에 따라 예측 결과가 달라지기도 하지만, 시간과 돈이라는 현실적인 한계 앞에서 계속해서 데이터만 모을 수도 없는 노릇이다. 전통적 샘플링-추론 방식에 익숙한 분들에게 시뮬레이션이라는 용어는 어쩌면 항공기 모의실험실이나 기상관측 연구소에서나 사용되는 것으로 자신과는 동떨어진 작업이라고 생각할 수도 있다. 하지만 학위과정에서 해결해야 하는 연구과제, 시장분석이나 정치환경과 같은 사회조사, 그리고 샘플이 부족한 연구 환경에서 시뮬레이션 기법은 훌륭한 해결책이 될 수 있다. 이 책은 수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.

저자소개

저자 : 마티아스 템플

오스트리아 비엔나 공과대학교 경제학과 소속 통계수학 방법론 연구소 부교수로 재직 중이다. 오스트리아 통계국의 방법론 학자로 활동하고 있으며, 두 명의 동료 연구자와 함께 파트너십 형태로 데이터 분석data-analysis OG를 운영 중이다. 주요 연구 분야는 대체(imputation), 응답자 정보의 통계적 노출 통제, 시각화, 구성 데이터 분석, 전산통계, 통계적 강건성, 다변량 방법론 등이다. 유명 과학저널에 45편 이상의 논문을 게재했으며, 누락값 시각화와 대체를 위한 패키지인 VIM, 합성 집단 시뮬레이션 패키지 simPop, 구성 데이터 강건 분석 패키지 robCompositions 등 여러 패키지의 저자이자 관리자로도 활동하고 있다. 대중들이 무료로 볼 수 있는 「Austrian Journal of Statistics」의 편집장이기도 하다. 여가시간에는 산 정상에서 그를 만날 가능성이 매우 크다.

역자 : 김재민

2014년도 미국 미시시피 대학교에서 경영학 박사를 마치고 뉴저지에 있는 스탁턴 대학교 조교수를 거쳐, 현재 미시간에 있는 오클랜드 대학교 비즈니스 스쿨에서 경영 전략을 가르치면서 연구하고 있다. 강의와 연구를 통해 경영 전략에 사용되는 데이터를 직접 만들고 분석하는 데 관심을 갖게 돼, ‘Statistics & Sports(통계와 스포츠)’라는 과목을 강의하고 ‘IOT & Data Science(사물인터넷과 데이터 과학)’를 개설했다. 2018년에는 140년 이상 축적된 메이저리그 야구 데이터로 회귀 분석, 연관성 분석, 판별 분석, 네트워크 분석, 군집 분석, 딥러닝을 통한 분류 및 패널 분석을 소개하는 『메이저리그 야구 통계학』(에이콘, 2018)을 출판했으며, 2018년 세종도서 학술부문 도서로 선정됐다. 현재는 경영자들의 관심(managerial attention)을 연구하면서 그들이 작성한 글과 문서에서 경영 전략에 대한 많은 힌트를 얻기 위해 노력하고 있으며, 이를 위해 숫자가 아닌 자연어(natural language)를 이용한 지도 학습 기반 내용 분석과 감성 분석 연구 방법에 집중하고 있다. 데이터 분석과 관련해서 10년 이상 포스팅하고 있는 블로그 ibuyworld.blog.me에서 역자를 만날 수 있다.

작가의 말

시뮬레이션은 데이터 과학과 통계학에서 필수 분야가 됐으며, 여러 분야에서 발생하는 많은 실무적 문제를 해결하는 데이터 기반 해법으로 자리 잡고 있다.
이 책에서는 분석 프로그램 플랫폼인 R을 기반으로 현실적인 예제를 통해 관련된 이론들을 설명하고 데이터를 고급스럽게 처리하는 방법을 소개한다. 이 책은 전산통계와 데이터 과학 관련 지식을 어느 정도 갖춘 독자들에게 통계 시뮬레이션용 전산 및 방법론적 프레임워크를 제공하겠다는 목표를 갖고 있다.
구체적으로 말하자면 책을 통해 독자에게 시뮬레이션 활용법과 필요한 조언을 전하고, 통계 시뮬레이션과 컴퓨터 기반 분석 방법에서 흔히 발생할 수 있는 문제를 해결하는 도구를 제공하기 위해 이 책을 썼다.
핵심 내용은 데이터 시뮬레이션과 분포, 추정 통계, 마이크로시뮬레이션, 동적 시스템을 위한 몬테카를로 방법, 컴퓨터 방법을 활용한 솔루션 제공이다. 현장에서 나온 실제 데이터를 이용해 문제를 다루기 때문에 앞에서 제시한 내용들을 좀 더 잘 이해하게 될 뿐만 아니라 R을 활용해 적용하는 방법에 대해 다양한 경험을 쌓을 수 있을 것이다.
여러분의 흥미를 높일 수 있도록 여러 장에서 기억에 오래 남을 수 있는 재미있는 예제를 만들고자 노력했다. 어렵고 심각한 내용 다음에는 ‘나의 사망 가능성’과 같은 내용처럼 호기심을 줄 만한 예제가 제공되는데, 비슷한 예제로 해리 왕자와 그의 여자 친구 첼시 데이비 사이에서 나타나는 사랑과 증오라는 시스템 다이내믹스(system dynamics), 최적화를 통해 오스트리아에서 가장 높은 산을 찾으려는 호주 사람, 복권 당첨의 약법칙(weak law) 등을 다룬다.

목차

1장. 서론
__시뮬레이션이란 무엇이며, 어디에 적용되는가?
__왜 시뮬레이션을 사용하는가?
__시뮬레이션과 빅데이터
__올바른 시뮬레이션 방법 선택하기
__요약
__참고문헌

2장. R과 고성능 컴퓨팅
__R 통계 환경
____R 기초
____R에 대한 아주 기본적인 내용들
____설치 및 업데이트
____help
____R 작업공간 및 작업 디렉토리
____데이터 유형
____누락값
__일반 함수, 메소드, 클래스
__R에서의 데이터 전처리
____apply와 기본 R의 친구들
____패키지 dplyr로 하는 기본 데이터 전처리
____패키지 data.table을 이용한 데이터 전처리
__고성능 컴퓨팅
____코딩에서 계산 속도가 느린 함수를 찾기 위한 분석법
____병렬 컴퓨팅
____C++ 인터페이스
__정보 시각화
____R의 그래픽 시스템
____graphics 패키지
____ggplot2 패키지
__참고문헌

3장. 연필 기반 이론과 데이터 기반 전산 솔루션의 불일치
__기계 수 반올림 문제
____예제: 수를 64비트 형식으로 나타내기
____결정론적 케이스에서 수렴
____예제: 수렴
__문제의 상태
__요약
__참고문헌

4장. 난수 시뮬레이션
__진성난수
__의사난수 시뮬레이션
____합동 생성기
____선형 합동 생성기 및 승산 합동 생성기
____지연 피보나치 수열 생성기
____그 밖의 의사난수 생성기
__비균등하게 분포되는 임의 변수 시뮬레이션
____역함수 변환 방법
____에일리어스 방법 또는 대체법
____로그 선형 모델을 이용한 테이블상의 빈도수 추정
____기각 샘플링
____절단 분포
____메트로폴리스-헤이스팅스 알고리즘
____깁스 샘플링
____MCMC 샘플 진단
__난수 테스트
____난수 평가: 테스트 예제
__요약
__참고문헌

5장. 최적화 문제를 위한 몬테카를로 기법
__수치 최적화
____경사 상승/하강 탐색 방법
____뉴턴-라프슨 방법
____범용성을 가진 최적화 방법들
__확률적 최적화 다루기
____간편한 절차(스타트렉, 스페이스볼, 스페이스볼 프린세스)
____메트로폴리스-헤이스팅스 분석 기법 다시 보기
____경사 기반 확률 최적화
__요약
__참고문헌

6장. 시뮬레이션으로 보는 확률 이론
__확률 이론에 대한 기본 내용
__확률 분포
____이산 확률 분포
____연속 확률 분포
__복권 당첨
__대수의 약법칙
____황제펭귄과 여러분의 상사
__중심극한정리
__추정량의 속성
____추정량의 속성
____신뢰구간
____강건 추정량에 대한 고찰
__요약
__참고문헌

7장. 리샘플링 방법
__부트스트랩
____오즈비에 대한 흥미로운 예제
____부트스트랩이 작동하는 이유
____부트스트랩 자세히 살펴보기
____플러그인 원칙
__부트스트랩으로 표준오차 추정
____부트스트랩을 이용한 복잡 추정의 예
__모수 부트스트랩
__부트스트랩으로 편향 추정하기
____부트스트랩으로 구하는 신뢰구간
__잭나이프
____잭나이프의 단점
____관측치 d개가 제거된 잭나이프
____부트스트랩 후 잭나이프
__교차 검증
____고전 선형 회귀 모델
____교차 검증의 기본 개념
____고전적 교차 검증: 70/30 방법
____LOO 교차 검증
____k배 교차 검증
__요약
__참고문헌

8장. 리샘플링 방법과 몬테카를로 테스트의 적용
__회귀 분석에서의 부트스트랩
____부트스트랩을 사용해야 하는 동기
__누락값을 포함한 적절한 분산 추정
__시계열 분석에서 부트스트랩하기
__복합 샘플링 디자인에서 사용되는 부트스트랩
__몬테카를로 테스트
____흥미로운 예제
____몬테카를로 테스트의 특별한 종류인 순열 테스트
____복수의 그룹에 대한 몬테카를로 테스트
____부트스트랩을 사용한 가설 테스트
____다변량 정규성 테스트
____몬테카를로 테스트 크기의 적합성
____검증력 비교
__요약
__참고문헌

9장. EM 알고리즘 381
__기본 EM 알고리즘
____전제 조건
____EM 알고리즘의 공식적 정의
____EM 알고리즘을 이해하기 위한 간단한 예
__k 평균 클러스터링 예로 보는 EM 알고리즘
__누락값 대체를 위한 EM 알고리즘
__요약
__참고문헌

10장. 복합 데이터로 하는 시뮬레이션
__다양한 종류의 시뮬레이션 및 소프트웨어
__복합 모델을 사용해 데이터 시뮬레이션하기
____모델 기반의 간단한 예제
____혼합 데이터를 가진 모델 기반 예제
____데이터를 시뮬레이션하기 위한 모델 기반 접근법
____고차원 데이터를 시뮬레이션하는 예제
____클러스터 또는 계층구조의 유한 모집단 시뮬레이션하기
__모델 기반 시뮬레이션 연구
____잠재 모델 예제
____모델 기반 시뮬레이션의 간단한 예제
____모델 기반 시뮬레이션 연구
__디자인 기반 시뮬레이션
____복합 설문조사 데이터의 예
____합성 모집단 시뮬레이션
____관심 있는 추정량
____샘플링 디자인 정의하기
____층화 샘플링 사용하기
____오염 추가
____다른 영역에 대해 별도의 시뮬레이션 실행
__누락값 삽입
__요약
__참고문헌

11장. 시스템 다이내믹스와 에이전트 기반 모델
__에이전트 기반 모델
__사랑과 증오의 역동성
__생태 모델링의 다이내믹 시스템
__요약
__참고문헌

책 속으로

★ 옮긴이의 말 ★

이 책을 번역하면서 머릿속에서 뚜렷해지는 생각이 있었다. ‘고정된 것은 변하는 것보다 항상 좋은 것 같아. 세상이 변하지만 않는다면 말이지.’ 경영 전략을 연구하는 나에게 의사결정자의 제한적 이성(bounded rationality)은 항상 흥미로운 주제다. 사람들이 모든 요인을 고려해서 미래 지향적으로 최적의 의사결정을 하기보다는 과거의 경험, 노하우, 그리고 현장에서 얻은 지식(idiosyncratic knowledge) 등 과거 지향적으로 의사결정을 하기 때문에 예상하지 못했던 나쁜 결과가 종종 발생한... 더보기

출판사 서평

★ 이 책에서 다루는 내용 ★
■ 데이터에서 통찰력을 이끌어 내기 위한 데이터 시뮬레이션과 리샘플링
■ 고성능 컴퓨팅과 고도의 데이터 처리 방법 등 R의 고급 기능
■ 분포, 데이터, 집단 시뮬레이션에 사용하는 난수 시뮬레이션
■ 에이전트 기반 마이크로시뮬레이션과 모델 및 디자인 기반 시뮬레이션을 기준으로 현실과 가까운 데이터 시뮬레이션
■ 과학적이며 현실적인 문제를 해결할 수 있도록 R을 사용한 통계 솔루션
■ boot, simPop, VIM, data.table, dplyr, cvTools, deSolve 등 다양한... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매도서의 문장수집을 기록하면 통합포인트 적립 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서번역서

안내

이 분야의 베스트

  • 길벗알앤디
    27,900원
  • 길벗R&D
    17,100원
  • 윤종식
    25,200원
  • 윤인성
    16,200원
  • 길벗R&D
    32,400원
더보기+

이 분야의 신간

  • 윤종식
    25,200원
  • BC카드 빅데이터센터
    17,100원
  • 조현준
    40,500원
  • NCS 정보처리기술사 연구회
    25,200원
  • NCS 정보기술 연구회
    27,900원
더보기+

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품