본문내용 바로가기
MD의선택 무료배송 이벤트 경품

추천 엔진을 구축하기 위한 기본서 R, 파이썬, 스파크, 머하웃, Neo4j를 이용해 추천 엔진 구축 시작하기

acorn+PACKT 시리즈
수레시 고라칼라 지음 | 테크 트랜스 그룹 T4 옮김 | 에이콘출판 | 2017년 09월 06일 출간

이 책의 다른 상품 정보

  • 정가 : 33,000원
    판매가 : 29,700 [10%↓ 3,300원 할인]
  • 제휴할인가 : 22,270 교보-롯데카드 최대 25% 청구할인 카드/포인트 안내
  • 통합포인트 :
    [기본적립] 1,650원 적립 [5% 적립] 안내 [추가적립] 5만원 이상 구매 시 2천원 추가적립 [회원혜택] 우수회원 5만원 이상 구매 시 2~3% 추가적립
  • 추가혜택 :
    naver네이버페이 결제 시 무조건 1% 추가 적립 payco페이코 결제 시 최대 1만원 적립 okcashbag 실 결제 금액의 0.5% 적립 안내
  • 배송비 : 무료 배송비 안내
  • 배송일정 : 서울특별시 종로구 세종대로 기준 지역변경
    지금 주문하면 내일(24일,금) 도착 예정 배송일정 안내
  • 바로드림 : 인터넷으로 주문하고 영업점에서 직접 수령 안내
행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
닫기
  • 스무 살 패브릭 포스터 증정 O tvN 어쩌다 어른 X 교보문고 단독혜택
  • 어린이 가을독서 추천도서전
  • 가을입맛 사로잡기
  • 행사도서 포함, 5만원이상 구매시 택 1 (라지 3000P, 스몰 2000P 차감)
  • 유아/어린이/가정육아 이달의 기대신간
  • 올재 클래식스 100권 완간! 시리즈의 정수만 모은, 올재 셀렉션즈 단독 판매
  • 자기계발 메인이벤트
  • 경제경영 메인이벤트
  • 행사도서 포함, 2만원이상 구매시 택 1 (1500P 차감)
  • 나만의 경쟁력, 동양고전 김원중 명품고전 독서대 증정
  • 비모 벽시계

이 책의 이벤트 해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

  • 에이콘의 도서를 한 눈에 살펴보세요
    2017.11.23 ~ 2019.12.31
  • 리드잇 IT칼럼 및 예약판매중인 책을 한 곳에서 보실 수 있습니..
    2017.11.22 ~ 2018.12.31
  • 설문참여 시 매월 5명 추첨통해 선물을 드립니다.
    10. 14 ~ 12. 31
상품상세정보
ISBN 9791161750460(1161750460)
쪽수 424쪽
크기 191 * 236 * 22 mm /820g 판형알림
이 책의 원서 Building Recommendation Engines/Gorakala, Suresh K.

책소개

이 책이 속한 분야

이 책의 주제어

R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용하여 협업 필터링, 컨텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다루기 때문에 실무에 있어서 기본 내용들을 한눈에 파악할 수 있다. 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 파악할 수 있으며, 추천 엔진의 미래에 대해서 설명하기 때문에 추천 엔진에 대해서 많은 인사이트를 얻을 수 있도록 돕는다.

이 책의 총서

총서 자세히 보기

저자소개

저자 : 수레시 고라칼라

저자 수레시 고라칼라(Suresh K. Gorakala)는 인공지능에 주력하는 데이터 과학자다. 여러 도메인의 다양한 글로벌 고객과 협력하며, 향상된 빅데이터 분석 기법을 사용해 비즈니스 문제를 해결하는 데 기여하고 있다. 추천 엔진, 자연어 처리, 고급 머신 러닝, 그래프 데이터베이스와 관련된 폭넓은 작업을 했으며, 『R로 만드는 추천 시스템』(에이콘, 2017)을 공동 저술했다. 열정적인 여행자며, 취미 생활로 사진 작가를 겸하기도 한다.

역자 : 테크 트랜스 그룹 T4

역자 테크 트랜스 그룹 T4는 최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용해 프레임워크를 구축하는 데 관심이 많으며, 최근에는 모바일을 접목한 하이브리드 환경에서의 HTML5, 스프링(Spring), NoSQL, React.js, Node.js 등의 기술과 빅데이터/데이터 분석 기술에 주목하고 있다. 또한 오픈소스 기반의 다양한 데이터베이스를 플랫폼 개발에 활용하는 데도 관심이 많다. 에이콘출판사가 펴낸 『구글 애널리틱스로 하는 데이터 분석 3/e』(2017), 『웹 개발자 레퍼런스 가이드』(2017) 등을 번역했다.

작가의 말

★ 지은이의 말 ★
R, 파이썬(Python), 스파크(Spark), 머하웃(Mahout), Neo4j 기술을 이용해 협업 필터링, 콘텐츠 기반 추천 엔진, 상황 인지 추천 엔진과 같은 추천 엔진을 구현하는 가이드를 제공한다. 이 책에서는 산업계에서 광범위하게 사용되는 다양한 추천 엔진들을 다룬다. 4장에서는 추천 시스템을 구축할 때 일상적으로 사용되는 유명한 데이터 마이닝 기술을 다루며, 마지막 장에서는 추천 엔진의 미래에 대해 간략히 논의하는 시간을 가진다.

★ 옮긴이의 말★
최근 들어 책이나 영화와 같은 매체를 선택하는 데 도움이 되는 다양한 추천 서비스가 제공되고 있다. 이뿐만 아니라 쇼핑하는 동안에도 구매 욕구를 불러일으키는 다양한 상품들을 추천받기도 한다. 이렇게도 추천 서비스는 머신 러닝의 진화와 함께 기술적으로 눈부시게 발전하고 있다.
1990년대에 연구가 시작됐을 무렵, 추천 시스템은 다소 조잡하고 그다지 정확하지 못했지만 웹 기술이 발전하고 웹사이트 이용자들이 증가함에 따라 그들에 대한 다양한 데이터를 활용하면서 시스템이 빠르게 개선됐다. 또한 딥러닝과 인공지능의 발전으로 추천 시스템은 더욱 정교해져 현재 훨씬 더 개인화된 추천 서비스를 제공한다 .
구글, 아마존, 페이스북, 유튜브, 넷플릭스 등의 미국 기업뿐만 아니라 국내 기업에서도 사용자의 활동, 습관 등의 데이터를 수집하고, 딥러닝 기술을 이용해 그 데이터를 분석한 결과를 기반으로 개인 취향에 맞는 콘텐츠를 추천한다. 그리고 이러한 추천 시스템의 효과는 어마어마하다.
아마존의 경우 판매의 35%가 추천 엔진으로부터 비롯됐으며, 넷플릭스의 경우 구독자의 80%가 추천 시스템을 통해 영화를 선택한다고 추정할 뿐 아니라 추천 엔진 덕분에 연간 10억 달러를 절약할 수 있다고 밝혔다. 네이버 역시 인공지능 기반 추천 시스템을 적용해 뉴스 소비량은 약 17%, 동영상 소비량은 약 18% 증가했으며, 이런 성과를 바탕으로 점차 적용 범위를 확대하고 있다.
추천 엔진을 구축하는 데 바탕이 되는 이론을 이해하는 것은 성능이 좋은 추천 엔진을 구축하는 중요한 기반이 된다. 이 책에서는 R 언어를 사용해 콘텐츠 기반의 추천 엔진과 협업 필터링 방식의 추천 엔진을 실제로 구현해볼 뿐만 아니라, 각 추천 엔진의 기반이 되는 이론도 충실하게 다룬다.
이 책이 모든 독자들이 추천 엔진에 대한 기본 이론을 이해하고 정확도가 높은 추천 엔진을 실제로 구현하는 데 많은 도움이 되길 바란다.

목차

1장. 추천 엔진 소개
__추천 엔진 정의
__추천 시스템의 필요성
__추천 시스템을 운영하는 빅데이터
__추천 시스템 종류
____협업 필터링 추천 시스템
____콘텐츠 기반 추천 시스템
____하이브리드 추천 시스템
____상황 인식 추천 시스템
__기술 발전에 따른 추천 시스템의 발전
____확장 가능한 추천 시스템을 위한 머하웃
____실시간 확장 가능 추천 시스템을 위한 아파치 스파크
____실시간 그래프 기반 추천 시스템을 위한 Neo4j
__요약

2장. 첫 번째 추천 엔진 구축하기
__기본 추천 엔진 구축하기
____데이터 로드 및 형식 변환
____사용자 사이의 유사도 계산
____사용자의 등급 예측
__요약

3장. 추천 엔진 이해
__추천 엔진의 진화
__최근접 이웃 기반 추천 엔진
____사용자 기반 협업 필터링
____아이템 기반 협업 필터링
____장점
____단점
__콘텐츠 기반 추천 시스템
____아이템 프로필 생성
____사용자 프로필 생성
____장점
____단점
__상황 인식 추천 시스템
____상황의 정의
____사전 필터링 방식
____사후 필터링 방식
____장점
____단점
__하이브리드 추천 시스템
____가중 방식
____혼합 방식
____캐스케이드 방식
____특징 조합 방식
____장점
__모델 기반 추천 시스템
____확률적 접근법
____머신 러닝 접근법
____수학적 접근법
____장점
__요약

4장. 추천 엔진에서 사용되는 데이터 마이닝 기법
__이웃 기반 기법
____유클리드 거리
____코사인 유사도
____자카드 유사도
____피어슨 상관계수
__수학적 모델 기법
____행렬 인수 분해
____교대 최소 제곱
____특이값 분해
__머신 러닝 기법
____선형 회귀
____분류 모델
______선형 분류
______KNN 분류
______서포트 벡터 머신
______결정 트리
______앙상블 방법
__클러스터링 기법
____K-평균 클러스터링
__차원 축소
____주성분 분석
__벡터 공간 모델
____단어 빈도
____단어 빈도-역문서 빈도
__평가 기법
____교차 검증
____정규화
______평균 제곱근 오차
______평균 절대 오차
______정확도와 재현율
__요약

5장. 협업 필터링 추천 엔진 구축하기
__RStudio에 recommenderlab 패키지 설치하기
__recommenderlab 패키지에서 사용 가능한 데이터 세트
____Jester5K 데이터 세트 탐색
______설명
______사용법
______형식
______상세 설명
__데이터 세트 탐색하기
____평가 값 탐색하기
__recommenderlab으로 사용자 기반의 협업 필터링 구축하기
____훈련 데이터와 테스트 데이터 준비하기
____사용자 기반 협업 모델 생성하기
____테스트 세트에서의 예측
____데이터 세트 분석하기
____k-교차 검증을 통한 추천 모델 평가하기
____사용자 기반 협업 필터링 평가하기
__아이템 기반 추천인 모델 구축하기
____IBCF 추천인 모델 구축하기
____모델 평가
____메트릭을 사용한 모델 정확도
____플롯을 사용한 모델 정확도
____IBCF의 매개변수 튜닝하기
__파이썬을 사용한 협업 필터링
____필요한 패키지 설치하기
____데이터 소스
__데이터 탐사
____평가 행렬 표현
____훈련과 테스트 세트 생성하기
____UBCF를 구축하는 단계
____사용자 기반 유사도 계산
____활성 사용자의 알려지지 않은 평가 예측하기
__k-최접 이웃과의 사용자 기반 협업 필터링
____최접 N 이웃 찾기
__아이템 기반 추천
____모델 평가하기
____k-최접 이웃에 대한 훈련 모델
____모델 평가하기
__요약

6장. 개인화 추천 엔진 구축하기
__개인화 추천인 시스템
__콘텐츠 기반 추천인 시스템
____콘텐츠 기반 추천 시스템 구축하기
____R을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
____파이썬을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
______사용자 활동
______아이템 프로필 생성
______사용자 프로필 생성
__상황 인식 추천인 시스템
____상황 인식 추천인 시스템 구축하기
____R을 사용한 상황 인식 추천
______상황 정의하기
______상황 프로필 생성하기
______상황 인식 추천 생성하기
__요약

7장. 스파크를 사용해 실시간 추천 엔진 구축하기
__스파크 2.0
____스파크 아키텍처
____스파크 구성 요소
____스파크 코어
______스파크 SQL을 이용한 구조화된 데이터
______스파크 스트리밍을 사용하는 스트리밍 분석
______MLlib를 사용하는 머신 러닝
______GraphX를 사용한 그래픽 계산
____스파크의 장점
____스파크 셋업하기
____SparkSession에 대해
____RDD
____ML 파이프라인에 대해
__교대 최소 제곱을 이용한 협업 필터링
__pyspark를 사용한 모델 기반 추천 시스템
__MLlib 추천 엔진 모듈
__추천 엔진 접근 방식
____구현 방법
______데이터 로딩
______데이터 탐색
______기본 추천 엔진 만들기
______예측하기
____사용자 기반 협업 필터링
____모델 평가
____모델 선택 및 하이퍼 매개변수 튜닝
______교차 유효성 검사
______CrossValidator
______학습 유효성 검사 분할
______ParamMaps/매개변수 설정하기
______평가자 객체 설정하기
__요약

8장. Neo4j로 실시간 추천 엔진 구축하기
__서로 다른 그래프 데이터베이스 식별
____레이블이 지정된 프로퍼티 그래프
______GraphDB 핵심 개념 이해하기
__Neo4j
____Cypher 쿼리 언어
______Cypher 쿼리 기본
____노드 문법
____관계 문법
____첫 번째 그래프 만들기
______노드 만들기
______관계 만들기
______관계에 프로퍼티 설정하기
______csv에서 데이터 불러오기
__Neo4j 윈도우 버전 설치하기
__리눅스에서 Neo4j 설치하기
____Neo4j 다운로드하기
____Neo4j 설정하기
____명령행에서 Neo4j 시작하기
__추천 엔진 만들기
____데이터를 Neo4j로 보내기
____Neo4j를 사용해 추천 정보 만들기
____유클리드 거리를 이용한 협업 필터링
____코사인 유사성을 사용한 협업 필터링
__요약

9장. 머하웃을 이용한 추천 엔진 구축하기
__머하웃: 개요
__머하웃 설정하기
____독립 모드: 라이브러리로서 머하웃 사용하기
____분산 모드용 머하웃 설정하기
__머하웃의 코어 빌딩 블록
____사용자 기반 협업 추천 엔진의 컴포넌트
____머하웃을 사용해 추천 엔진 만들기
____데이터 세트 내용
____사용자 기반의 협업 필터링
__아이템 기반의 협업 필터링
__협업 필터링 평가하기
__사용자 기반 추천인 평가
__아이템 기반 추천인 평가
__SVD 추천
__머하웃을 이용한 분산 추천
____하둡에서의 ALS 추천 방법
__확장 가능한 시스템 아키텍처
__요약

10장. 추천 엔진의 미래: 다음은 무엇일까?
__추천 엔진의 미래
__추천 엔진의 단계
____단계 1: 일반적인 추천 엔진
____단계 2: 개인화된 추천인 시스템
____단계 3: 미래 지향적 추천 시스템
______검색의 종료
______웹 검색의 종말
______웹에서의 새로운 등장
____차선책
____유스케이스 고려
______스마트 홈
______헬스케어 추천인 시스템
______추천 뉴스
__인기 있는 방법론
____세렌디피티
__추천 엔진의 시간적 측면
____A/B 테스트
____피드백 메커니즘
__요약

출판사 서평

★ 이 책에서 다루는 내용 ★
■ 첫 번째 추천 엔진 구축 방법
■ 추천 엔진을 구축하는 데 필요한 도구
■ 공동 작업, 콘텐츠 기반 및 교차 추천과 같은 추천 시스템의 다양한 기법
■ 업무를 쉽게 할 수 있는 효율적인 의사 결정 시스템
■ 다양한 프레임워크에서의 머신 러닝 알고리즘
■ 실제 코드 예제를 사용한 다양한 버전의 추천 엔진 마스터링
■ 다양한 추천 시스템의 탐색과 R, 파이썬, 스파크 등의 기술을 이용하는 구현 방법

★ 이 책의 대상 독자 ★
이 책은 R, 파이썬, 스파크, Neo4j, 하둡을 사용한... 더보기

북로그 리뷰 (0) 쓰러가기

도서 구매 후 리뷰를 작성하시면 통합포인트를 드립니다.
결제 90일 이내 작성 시 300원 / 발송 후 5일 이내 작성시 400원 / 이 상품의 첫 리뷰 작성 시 500원
(포인트 적립은 작성 후 다음 날 혹은 해당 도서 출고 후 익일에 적립됩니다.
외서/eBook/음반/DVD/GIFT 및 잡지 상품 제외)
안내
  • 해당도서의 리뷰가 없습니다.

Klover 평점/리뷰 (0)

교환/반품/품절안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품/품절안내
반품/교환방법 마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환신청 ,
[1:1상담>반품/교환/환불] 또는 고객센터 (1544-1900)

※ 오픈마켓, 해외배송주문, 기프트 주문시 [1:1상담>반품/교환/환불]
    또는 고객센터 (1544-1900)
반품/교환가능 기간 변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
  • 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에
    해당되는 경우
(1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시 ‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
상품 품절 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는
이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은
    소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의
    소비자 보호에 관한 법률에 따라 처리함

이 책의 원서번역서

안내

이 분야의 베스트

더보기+

이 분야의 신간

더보기+

바로가기

  • 우측 확장형 배너 2

최근 본 상품