본문내용 바로가기
MD의선택 무료배송 사은품

딥러닝 데이터 전처리 입문 파이썬과 R로 배우는 데이터 다루기

앨런 비소첵 지음 | 김창엽, 강병호 옮김 | 에이콘출판 | 2018년 05월 24일 출간
  • 정가 : 20,000원
    판매가 : 18,000 [10%↓ 2,000원 할인]
  • 통합포인트 :
    [기본적립] 1,000원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 : 카드/포인트 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    지금 주문하면 내일(26일,토) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 매장에서 직접 수령 안내
5월 보스턴백 증정
닫기
  • 한국사능력검정시험, 30일 완성 프로젝트
  • 질문하는 시간
  • 자기계발 메인이벤트
  • 5월 보스턴백 증정
  • 우드북케이스
  • 한정판매 / 최대 1만5천원할인 10%특별할인쿠폰 / 종이방향제 선택 (1000P차감)
  • [초등학습] 계산력. 연산력. 독해력 이벤트
  • 이벤트도서 포함, 2만원 이상 구매시 증정
  • 에코젠 보틀&파우치 증정 월간 생활책방 5월호
  • 인문교양 메인이벤트

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • IT 출판사와 함께하는 Dev ReadIT 2018!
    2018.05.16 ~ 2018.07.15
상품상세정보
ISBN 9791161751580(1161751580)
쪽수 232쪽
크기 188 * 235 * 15 mm 판형알림

책소개

이 책이 속한 분야

실제 데이터 분석에 가장 중요한 기초 데이터 전처리를 다룬다. 데이터 전처리 과정은 머신 러닝을 통해 만든 모델의 성능을 크게 좌우한다. 데이터 분석에 입문한다면 데이터 전처리를 위한 데이터 전처리 개념과 사용 도구, 주요 파일 형식, 정규 표현식 등 꼭 알아야 할 내용을 실습을 통해 쉽게 익힐 수 있다.

저자소개

저자 : 앨런 비소첵

저자 앨런 비소첵은 코네티컷 주 뉴 헤이븐에서 활동하고 있는 프리랜서 웹 개발자이자 데이터 분석가며, 업무 외적으로 머신 러닝과 인공지능에 관심이 많다.

지식을 가르치고 공유하기를 즐긴다. 유다시티(Udacity)의 데이터 분석 나노 학위(Nanodegree) 프로그램을 수료한 후, 유다시티에서 수개월간 포럼 멘토 및 프로젝트 검수자로 활동하면서 데이터 분석 프로젝트를 수행하는 학생들에게 도움을 줬다. learntoprogram.tv에 기술 자료를 기고하기도 한다.

역자 : 김창엽

역자 김창엽은 데이터 분석과 머신 러닝에 관심이 많아 현재 고려대학교 산업경영공학과 데이터 사이언스 및 비즈니스 어낼리틱스(DSBA) 연구실에서 박사 과정을 밟고 있다. 이전에는 안랩에서 9년간 근무하며 악성코드 대응 및 침해 사고 분석 업무를 수행했다. 에이콘출판사에서 펴낸 『텐서플로 入門』(2016), 『리눅스 바이너리 분석』(2016), 『모의 해킹을 위한 메타스플로잇』(2014), 『케라스로 구현하는 딥러닝과 강화학습』(2017) 등을 번역했다.

역자 : 강병호

역자 강병호는 한양대학교 공과대학 컴퓨터공학부 및 동 대학원 컴퓨터·소프트웨어학과를 졸업했으며, 현재 한국전자통신연구원(ETRI)에 근무하고 있다. 관심 분야는 컴퓨터 보안과 머신 러닝이다.

작가의 말

최종 사용자용으로 가공되지 않은 데이터가 있다. 프로젝트별로 데이터의 개수가 너무 많거나, 너무 적거나, 누락돼 있거나, 잘못돼 있거나, 또는 구조화되지 않거나 부적절한 형태로 구성돼 있을 수 있다. 이 책은 사용 가능한 데이터를 모으고 출력 데이터를 구성하는 방법을 다룬다. 각 장에서는 데이터 다루기에 대한 새로운 접근법을 보여주기 위해 하나 이상의 예시를 사용한다.

목차

1장. 데이터 프로그래밍
__데이터 처리의 이해
____데이터의 수집과 읽어오기
____데이터 정리
____데이터 형성 및 구조화
____데이터 저장
__데이터 처리 도구
____파이썬
____R
__요약

2장. 파이썬 프로그래밍 소개
__외부 리소스
__이번 장 살펴보기
____설치 요구 사항
____다른 학습 리소스
____파이썬 2와 파이썬 3의 차이점
__파이썬에서 프로그램 실행
____텍스트 편집기를 사용해 프로그램 작성 및 관리
____터미널을 사용해 프로그램 실행
____동작하지 않면 어떻게 해야 할까?
__데이터 유형, 변수, 파이썬 셸
____숫자: 정수와 실수
____문자열
____부울 데이터 형식
____print 함수
____변수
____배열(파이썬에서의 리스트)
____사전
__복합문
____복합문 문법과 들여쓰기 수준
____for문과 이터러블
____if문
____함수
__프로그램에서 주석 달기
__프로그래머 리소스
____공식 문서
____온라인 포럼과 메일링 리스트
__요약

3장. 데이터 입력, 탐색, 수정: 1부
__외부 리소스
__이번 장 살펴보기
____설치 요구 사항
____데이터
____파일시스템 설정
__기본 데이터 처리 작업 흐름 소개
__JSON 파일 형식 소개
__파이썬의 파일 I/O를 이용한 파일 열기와 닫기
____open 함수와 파일 객체
____파일 구조: 데이터 저장을 위한 좋은 방법
____파일 열기
__파일 내용 읽기
____파이썬 모듈
____json 모듈을 이용한 JSON 파일 파싱
__데이터 파일의 내용 탐색
____데이터의 주요 내용 추출
____데이터상의 모든 변수 출력
__데이터셋 수정
____원본 데이터셋에서 데이터 변수 추출
__수정된 데이터를 새 파일에 기록
__터미널에서 입출력 파일명 지정
____터미널에서 파일명 지정
__요약

4장. 데이터 입력, 탐색, 수정: 2부
__이번 장 살펴보기
____파일시스템 설정
____데이터
____pandas 설치
__CSV 형식 이해
__csv 모듈 소개
__CSV 데이터를 읽고 처리하기 위해 csv 모듈 사용
__CSV 데이터 기록을 위한 csv 모듈 사용
__데이터를 읽고 처리하기 위해 pandas 모듈 사용
____2011년 총 도로 길이 다시 계산
__비표준 CSV 인코딩과 다이얼렉트 처리
__XML 이해
____XML과 JSON 비교
__XML 데이터 파싱을 위한 xmletreeElementTree 모듈 사용
____Xpath
__요약

5장. 텍스트 데이터 처리: 정규 표현식 소개
__이번 장 살펴보기
____데이터
____파일 구조 설정
__패턴 인식의 필요성
____정규 표현식 소개
____정규 표현식 작성
____특수 문자
____공백 문자 탐색
____시작 문자 탐색
____종료 문자 탐색
____문자 또는 숫자의 범위 탐색
____여러 패턴의 탐색
____하나의 문자가 아닌 문자열 시퀀스 탐색
____패턴 결합
____문자열로부터 패턴 추출
____정규 표현식의 split() 함수
____파이썬 정규 표현식 문서
__패턴 탐색
__패턴 정량화
____도로명 주소를 탐색하는 정규 표현식 작성
____탐색 횟수 측정
____탐색 정확도 검증
__패턴 추출
____출력 결과 파일 저장
__요약

6장. 수치 데이터 정리: R과 RStudio 소개
__이번 장 살펴보기

____데이터
____디렉터리 구조
____R과 Rstudio 설치
__R과 RStudio 소개
__RStudio 연습
____R 명령어 실행
____작업 디렉터리 지정
____데이터 불러오기
____R 데이터프레임
____R 벡터
____R 데이터프레임 인덱싱
____R을 활용한 2001년 데이터 분석
__기본적인 이상치 탐지 및 제거
__NA 값 처리
____결측치 제거
____결측치를 상수로 대체
____결측치 대체
__변수명과 내용
__요약

7장. dplyr을 이용한 데이터 처리 간소화
__이번 장 살펴보기
____데이터
____파일시스템 구성
____dplyr 및 tibble 패키지 설치
__dplyr 소개
__dplyr 시작하기
__명령어 체인 사용
__데이터프레임의 행 필터링
__항목별로 데이터 요약하기
__dplyr을 이용한 코드 재작성
__요약

8장. 웹에서 데이터 수집하기
__이번 장 살펴보기
____파일시스템 설정
____requests 모듈 설치
____인터넷 연결
__API 소개
__API를 통해 파이썬으로 데이터 추출하기
__결과 필터링을 위한 URL 파라미터 사용
__요약

9장. 대용량 데이터 처리
__이번 장 살펴보기
____시스템 요구 사항
____데이터
____파일시스템 설정
____MongoDB 설치
____시간 계획
____정리
__컴퓨터 메모리 이해
__데이터베이스 이해
__MongoDB 소개
__파이썬에서 MongoDB 사용하기
__요약

출판사 서평

★ 이 책에서 다루는 내용 ★
■ 파이썬과 R로 CSV를 읽어 데이터의 통계량 출력하기
■ 데이터 형식과 API를 활용한 데이터 추출에 필요한 프로그래밍 구조 학습
■ 데이터 정리 과정에 필요한 정규 표현식의 효과적인 사용
■ 수치 데이터 분석에 필요한 도구와 패키지 탐색
■ 더 나은 데이터 구조 제어 방법 탐색
■ 프로그래밍 방식을 통한 데이터의 읽기, 검사, 수정, 형태 변경
■ 데이터셋을 불러오고 정제하고 출력하는 프로그램 작성

★ 이 책의 대상 독자 ★
데이터를 분석해보고 싶은 데이터 과학자, 데이터 분석... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트 적립은 작성 후 다음 날 혹은 해당 도서 출고 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

  • 길벗R&D
    27,900원
  • 오렐리앙 제롱
    29,700원
  • 길벗알앤디
    18,900원
  • 박응용
    16,920원
  • 선양미
    18,900원
더보기+

이 분야의 신간

  • 오렐리앙 제롱
    29,700원
  • 로널드 그레이엄
    44,100원
  • 이남호
    22,410원
  • 신의철
    23,400원
  • 톰 호프
    20,700원
더보기+

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품