본문내용 바로가기
MD의선택 무료배송 이벤트 한정판매 소득공제

PyTorch를 활용한 강화학습 /심층강화학습 실전 입문 파이토치로 익히는 기초 강화학습 및 심층강화학습 알고리즘의 원리와 구현

위키북스 데이터 사이언스 시리즈 25
오가와 유타로 지음 | 심효섭 옮김 | 위키북스 | 2018년 12월 18일 출간
클로버 리뷰쓰기
  • 정가 : 25,000원
    판매가 : 22,500 [10%↓ 2,500원 할인]
  • 혜택 :
    [기본적립] 1250원 적립 [5% 적립] [추가적립] 5만원 이상 구매 시 2,000원 추가적립 안내 [회원혜택] 회원 등급 별, 3만원 이상 구매 시 2~4% 추가적립 안내 [리뷰적립] 리뷰 작성 시 e교환권 최대 300원 추가적립 안내
  • 추가혜택 : 포인트 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    05월 15일 출고 예정 배송일정 안내

알립니다.

  • 출판사 품절로 한정 수량 판매, 조기 품절 될 수 있습니다.

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
  • 책을 통해 성장해나가는 개발자를 응원합니다.
    2017.06.22 ~ 2025.07.31
상품상세정보
ISBN 9791158391287(1158391285)
쪽수 256쪽
크기 174 * 235 * 19 mm /534g 판형알림
이 책의 원서/번역서 つくりながら學ぶ!深層强化學習 PYTORCHによる實踐プログラミング / 小川雄太郞

책소개

이 책이 속한 분야

강화학습과 심층강화학습 알고리즘을 직접 구현하면서 이해한다!

이 책에서는 강화학습이나 딥러닝 같은 이론보다는 강화학습을 실제로 구현하는 데 초점을 맞춘다. 연구자가 아닌 일반인을 대상으로 실제로 강화학습 알고리즘을 구현하는 과정과 통해 강화학습 및 강화학습에 딥러닝을 접목한 심층강화학습을 이해하는 것을 목표로 한다. 따라서 이론보다는 구현을 중시하고 코드와 그에 대한 설명을 많이 다룬다. 초보 수준의 파이썬 프로그래밍 및 선형대수에 대한 지식을 갖췄고, 딥러닝과 강화학습에 대해 관심은 있지만 자세한 구현 방법을 알지 못하는 분들이라면 이 책을 통해 강화학습 및 심층강화학습 알고리즘의 원리와 구체적인 구현 방법을 손에 익힐 수 있을 것이다.

★ 이 책에서 다루는 내용 ★

◎ 강화학습 기초 이론
◎ 미로찾기를 통한 강화학습 구현
◎ 역진자 문제를 통한 강화학습 구현
◎ 파이토치를 이용한 딥러닝 구현
◎ 심층강화학습 알고리즘 구현: DQN
◎ 기타 심층강화학습 알고리즘 및 구현 방법
◎ AWS GPU 환경에서 벽돌 깨기 구현

목차

▣ 01장: 강화학습이란 무엇인가?
1.1 머신러닝의 유형(지도학습, 비지도학습, 강화학습)
__용어 정리
__지도학습, 비지도학습, 강화학습
1.2 강화학습 및 심층강화학습의 역사
__강화학습과 뇌에서 일어나는 학습
__강화학습과 딥러닝의 결합
1.3 심층강화학습의 응용 사례
__심층강화학습의 응용 사례
__심층강화학습의 미래

▣ 02장: 미로찾기를 위한 강화학습 구현
2.1 주피터 노트북 체험 페이지 사용법
__이번 장에서 사용할 강화학습 구현 및 실행 환경
__주피터 노트북 체험 페이지 사용법
2.2 미로와 에이전트 구현
__미로 구현
__에이전트 구현
2.3 정책반복 구현
__정책반복과 가치반복
__정책경사 알고리즘에 따라 에이전트 이동시키기
__정책경사 알고리즘으로 정책 수정
__정책경사 알고리즘에 대한 이론
__보상
2.4 가치반복 알고리즘 관련 용어 정리
__행동가치와 상태가치
__벨만 방정식과 마르코프 결정 프로세스
__ε-greedy 알고리즘으로 정책 구현하기
2.5 Sarsa 알고리즘 구현
__행동가치 함수 Q(s,a)를 Sarsa 알고리즘으로 수정
__Sarsa로 미로찾기 구현
__Q러닝의 알고리즘
__Q러닝 구현
2.6 Q러닝 구현

▣ 03장: 역진자 문제를 위한 강화학습 구현
3.1 로컬 PC에 강화학습 개발환경 갖추기
__파이썬 실행 환경인 아나콘다 설치
__강화학습에 사용할 라이브러리 설치
3.2 역진자 태스크 “CartPole”
__CartPole이란?
__CartPole 구현
3.3 다변수, 연속값 상태를 표형식으로 나타내기
__CartPole의 상태
__상태의 이산변수 변환 구현
3.4 Q러닝 구현

▣ 04장: 파이토치를 이용한 딥러닝 구현
4.1 신경망과 딥러닝의 역사
__첫 번째 신경망 연구 붐
__두 번째 신경망 연구 붐
__세 번째 신경망 연구 붐
4.2 딥러닝의 계산 과정
__추론 단계
__학습 단계
4.3 파이토치를 이용한 MNIST 손글씨 이미지 분류 구현
__파이토치란?
__파이토치 개발환경 갖추기
__MNIST 데이터 다운로드
__파이토치를 이용한 딥러닝 구현
____1. 데이터 전처리
____2. DataLoader 생성
____3. 신경망 구성
____4. 오차함수 및 최적화 기법 설정
____5. 학습 및 추론 설정
____6. 학습 및 추론 수행
파이토치 사용법에 대한 보충 설명

▣ 05장: 딥러닝을 적용한 강화학습 - DQN 구현
5.1 딥러닝을 적용한 Q러닝
__표형식 표현의 문제점
__심층강화학습 알고리즘 DQN
5.2 DQN을 구현할 때 중요한 4가지 기법
5.3 DQN 구현(1)
__파이토치로 DQN을 구현할 때 주의점
__DQN 구현
5.4 DQN 구현(2)

▣ 06장: 딥러닝을 적용한 강화학습 - 심화 과정
6.1 심층강화학습 알고리즘 지도
6.2 DDQN(Double-DQN) 구현
__DDQN
__DDQN 구현
6.3 Dueling Network 구현
__Dueling Network
__Dueling Network 구현
6.4 Prioritized Experience Replay 구현
__Prioritized Experience Replay
__Prioritized Experience Replay 구현
6.5 A2C 구현
__A2C
__A2C 구현

▣ 07장: AWS GPU 환경에서 벽돌 깨기 구현
7.1 벽돌 깨기 게임 “Breakout”
7.2 AWS로 GPU를 사용하는 딥러닝 실행 환경 구성
__우분투 터미널 설치
__가상 서버와 통신하는 데 사용할 키 생성
__AWS에서 딥러닝을 실행할 가상 서버 만들기
__벽돌 깨기 게임 실행 환경 구축
7.3 Breakout 학습에서 중요한 포인트 4가지
__로컬 PC 환경 설정
__Breakout 게임을 학습하는 데 중요한 포인트 4가지
7.4 A2C 구현(1)
7.5 A2C 구현(2)

Klover 리뷰 (0)

북로그 리뷰 (0) 쓰러가기

북로그 리뷰는 본인 인증 후 작성 가능합니다.
책이나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 내용은 비공개 처리 될 수 있습니다.
※ 북로그 리뷰 리워드 제공 2021. 4. 1 종료

문장수집 (0) 문장수집 쓰기 나의 독서기록 보기
※구매 후 문장수집 작성 시, 리워드를 제공합니다. 안내

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①서양도서-판매정가의 12%, ②일본도서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서/번역서

안내

바로가기

  • 우측 확장형 배너 2
  • 우측 확장형 배너 2

최근 본 상품