본문내용 바로가기
MD의선택 무료배송 이벤트 소득공제

메이저리그 야구 통계학 빅데이터 분석의 시작 R

데이터 과학
김재민 지음 | 에이콘출판 | 2018년 06월 12일 출간
  • 정가 : 30,000원
    판매가 : 27,000 [10%↓ 3,000원 할인]
  • 통합포인트 :
    [기본적립] 1,500원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 : 카드/포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    당일배송 지금 주문하면 오늘(20일,월) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내
장바구니 담기 바로구매

책 그리고 꽃 서비스
책 그리고 꽃 | 책과 꽃을 함께 선물하세요 자세히보기

닫기

바로드림 주문 선물하기 보관함 담기
이벤트도서포함, 5만원이상 구매시 택1 (벚꽃/자동차/나뭇잎/번짐4종, 포인트 차감)
닫기
  • 심리학 도서 x 피크닉 매트 마인드 바캉스
  • 7월 어린이 손수건
  • 더나은 해답은 반드시 있다
  • 과장K의 비즈니스 리포트
  • 지식인 추천도서 X 아이스 텀블러 2018 인문교양 마스터스 오픈 섬머
  • 이벤트도서포함, 5만원이상 구매시 택1 (블랙/네이비/웜그레이/그레이블루 4종, 포인트 차감)
  • 비치타월 증정 월간 생활책방 8월호
  • 취업콘서트
  • 역사는 여행이다 (유시민 여권케이스)
  • 역사에 부는 바람 (조선왕조실록 출간기념 역사도서전)
  • 교보문고  X 제주관광공사
  • 이기주 작가 사인 북케이스 증정 리-커버:K #19 이기주, 말의 품격
  • 이벤트도서포함, 2만원이상 구매시 택1 (마을/호텔/꽃잎/퍼플 4종, 포인트 차감)

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • #리드잇 페이스북 페이지 팔로우 하시고, 신간소식 빠르게 받아보..
    2017.06.22 ~ 2025.07.31
상품상세정보
ISBN 9791161751641(1161751645)
쪽수 364쪽
크기 188 * 236 * 23 mm /837g 판형알림

책소개

이 책이 속한 분야

4차 산업의 거대한 물결로 빅데이터 같은 대형 데이터의 활용 가치는 더욱 높아지고 있지만, 수학이라는 진입장벽 때문에 데이터 분석에 접근하지 못하는 어려움이 반복되고 있다. 한국에서 가장 인기 있는 프로 스포츠인 야구로 통계분석을 다룬다면, 데이터에 대한 새로운 관점을 가질 수 있다. 메이저리그에서 140년 이상 쌓여온 대형 패널 데이터를 이용해 전통적 분석인 상관관계 분석, 회귀분석, 로지스틱 회귀분석, 분산분석과 최근 인공지능으로 주목받고 있는 판별분석, 클러스터링 분석, 요인분석, 네트워크 분석, 신경망분석 등을 통해 흥미로운 야구 이야기를 모델링하고 데이터로 직접 테스트한다. 모든 작업에는 학계와 산업계의 분석에서 이미 중심이 된 오픈소스 통계 프로그램 R이 있다.

저자소개

저자 : 김재민

저자 김재민은 KDI 국제정책대학원 해외직접투자 석사와 미시시피대학교에서 경영학 박사학위를 취득했다. 뉴저지 스탁턴대학교를 거쳐 2018년 9월부터 미시간 오클랜드대학교 비지니스스쿨 경영학과 조교수로 재직하게 된다. 중소기업 비지니스 전략에 관한 연구주제로 「Entrepreneurship Theory & Practice」, 「Journal of Business Ethics」, 「Journal of Cleaner Production」, 「Organization & Environment」 등의 저널에 다수의 논문이 실렸으며, 2016년부터 R과 스포츠 데이터를 이용한 「Statistics & Sports」 그리고 R과 사물인터넷을 결합한 「Data Science & IOT」를 강의하고 있다.

작가의 말

 

목차

지은이 소개
지은이 말
들어가며

1장. 변수를 알면 분석모델을 디자인할 수 있다

__데이터과학에서 왜 야구인가?
__분석 공부 중도에 포기하지 않는 방법: 나만의 데이터 만들기
__변수를 알아야 분석이 보인다
____연속 변수
____이산 변수
____명목 변수
____서열 변수
__데이터 구조를 파악하다
__여러분이 가지고 있는 변수의 특징
____데이터 중심화 경향
____데이터의 분포범위
__데이터는 조작되지 않아야 한다
__데이터 분석의 완성: 데이터 밸류 체인
__R 스튜디오와 친구들
____R 스크립트
____R 노트북
____R 마크다운
____샤이니웹앱
__패키지 없는 R은 앱 없는 스마트폰
__정리하며

2장. 메이저리그 데이터 마이닝

__마이닝의 개념
__간단한 데이터 내 손으로 직접 만들기
__데이터를 R로 불러올 때 알아두면 좋은 정보
__인터넷에서 만난 팬그래프닷컴 데이터를 R로 불러오기
__빅데이터에서 필요한 데이터 분리하기
__작업했던 코딩과 데이터 정보 저장하기
__순서가 같은 테이블 합치기: cbind( ) 그리고 rbind( )
__순서가 다른 테이블 합치기: merge( )
__양적 변수를 명목 변수로 바꾸기
__괄호 사용법
____소괄호 ( )
____중괄호 {}
____대괄호 [ ]
__결측값 제거하기
__조건문 사용하기
__계속 사용할 테이블 고정하기
__추가로 공유하고 싶은 마이닝 기법들
__정리하며

3장. 선수의 능력은 어떻게 측정할 것인가?

__과학적 측정
__측정의 신뢰도
__영화 <머니볼>에서 보는 신뢰도가 높은 지표의 활용 케이스
__측정의 타당도
__능력과 운의 결과물: 시즌 성적
__공격지표들을 이용한 상관관계
__장타력과 득점의 상관관계
__지도에 산포도를 그리다: R과 구글의 만남
__선수와 감독의 인적 상관성: 네트워크 분석
__기술통계와 추정통계의 매개: 히스토그램은 막대그래프가 아니다
__히스토그램과 확률밀도함수가 만나다: 패키지 lattice
__정리하며

4장. 상관관계는 인과관계가 아니다

__인과관계의 필수조건
__확률로 따지면 말이야
__오류는 모델링의 꽃
____진실이 존재하는 신의 영역
____예측모델과 데이터가 있는 현실계
__확률과 우도
__타석에서 안타를 1개만 칠 확률이 가장 높은 타율을 찾다: 최대우도추정법
____[4개의 막대그래프를 한 화면에 제시하는 코드]
__정규분포: 얼마나 칠 것인가?
____중심극한정리란?
____회귀분석에서는 왜 정규분보를 사용하지 않고 스튜던트 t 분포를 사용하는가?
__좋은 예측모델 구별법: 표준오차
__팀타율 1푼의 가치는 2천 4백만 달러?
__팀득점 예측을 위해 만든 추정모델 해석하기
____조절된 설명력
__모델 전체의 의미: F 통곗값
____계수의 p 값: 긍정오류의 가능성 유의확률
__게임당 팀득점을 신뢰성 있게 예측하기
____신뢰구간
____예측구간
__정리하며

5장. 비교와 구분

__다른가?
__시각적 비교
__모델에 영향을 주는 이상치를 찾아라
__메이저리그 140년 역사의 원동력: 표준편차의 힘
____시즌타율 3할의 효과 40년간의 관찰: 패키지 plyr
____시즌타율 표준편차가 적을수록 야구장에 관중들이 더 모인다?
__실험군은 아메리칸리그, 대조군은 내셔널리그
__그룹 간 비교 시각화 방법: 패널차트
__구글 트렌드와 분산분석(ANOVA) 연계
__데이터를 분리해 필요한 부분만 취하다: 스트링 변수
__비모수 시대의 그룹 간 비교
__긍정오류와 부정오류
__긍정오류, 부정오류, 그리고 판별분석
__내셔널리그, 아메리칸리그, 그리고 판별분석
__지구에서 우승할 가능성, 우승하지 못할 가능성: 로지스틱 회귀분석
__지구에서 우승할 팀, 우승하지 못할 팀, 그리고 딥러닝
__자율학습을 활용한 군집분석
__정리하며

6장. 모델링

__복잡한 현실을 수학으로 모델링하고 통계로 증명하다
__2차함수 사고하기
__고차함수 사고하기
__논리와 데이터를 연결하다: 모델 선택
____단순선형회귀분석모델(simple linear regression)에 기반한 주장
____다중선형회귀분석모델(multiple regression)에 기반한 주장
____고정효과모델(fixed effects model)에 기반한 주장
____다수준혼합모델(multilevel mixed effects model)에 기반한 주장
____시차 변수를 보유하는 다수준혼합모델에 기반한 주장
____시차 변수와 자기상관을 보유하는 다수준혼합모델에 기반한 주장
__조건이 포함되는 모델링: 조절 변수
__리그별 홈런의 관중 동원 효과: 리그의 조절효과
__다수준혼합모델로 메이저리그 팀승수 추정하기
__실험실 없이 실험환경 통제하기: 통제 변수
__눈에 보이지 않는 교란요인들 잡아내기
__단순선형모델, 임의효과모델, 고정효과모델의 비교
____단순선형모델
____임의효과모델
____고정효과모델
__정리하며

맺음말
__데이터과학을 대하는 자세
__R을 대하면서 확장되는 생각의 범위
__라만 데이터 적용 부분

찾아보기

책 속으로

★ 이 책의 구성 ★
이 책은 총 6개 장으로 구성됐다. 데이터와 분석 목적이 일치하는가, 측정하려는 개념을 측정하고 있는가, 과학적 예측은 어떻게 하는가, 다름과 같음을 구분할 수 있는가, 분석결과를 호도할 수 있는 소음은 잡아낼 수 있는가에 대해 R에서 메이저리그 경기 데이터를 사용해 직접 실험한 결과를 바탕으로 설명하고 각 장에서 코드를 제시한다.
1장, ‘변수를 알면 분석모델을 디자인할 수 있다’에서는 분석 목적에 맞는 맞춤형 데이터를 만들기 위해 반드시 알아야 하는 데이터 구조와 그 중심에 있는 변수를 메이저리그 데이터... 더보기

출판사 서평

★ 이 책에서 다루는 내용 ★
■ 야구 이야기와 통계 프로그램 R 코드가 동시에 진행되는 이해하기 쉬운 설명
■ 다양한 목적의 분석 툴을 야구에서 발생하는 특수 상황에 맞게 적용
■ 실제 메이저리그 대형 데이터인 라만(Lahman) 데이터베이스 활용
■ 대형 데이터를 분석 목적에 맞게 마이닝하는 방법 제시
■ 예측모델에서 발생할 수 있는 소음을 제거하는 모델링 방법 소개
■ 인공지능으로 주목받고 있는 비지도학습법인 판별분석, 군집분석, 신경망분석 등을 소개

★ 이 책의 대상 독자 ★
■ R에 관심은 있지만 특별한... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트는 작성 후 다음 날 적립되며, 도서 발송 전 작성 시에는 발송 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기+

이 분야의 신간

  • 김계철
    23,000원
  • 조현영
    28,800원
  • 김민준
    32,400원
  • Mojang
    10,800원
  • 오완구
    12,870원
더보기+

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품