해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
먼저 기계학습 뒤에 숨겨진 개념설명 후, 협업 필터링 기법, 두 개의 군집 기법, 검색엔진(크롤러, 인덱서, 쿼리엔진) 구조, 페이지랭킹 알고리즘, 신경만 작성 과정, 최적화 알고리즘, 베이지안 필터링, 의사결정트리 모델링, 가격 모델링, 고급 분류기법, 유전자 프로그래밍 등을 차례대로 소개한다.
이를 통해 웹 사이트에서 흥미로운 데이터 세트를 취득하는 방법, 독자운영 서비스의 사용자들로부터 데이터를 수집하는 방법, 발견한 데이터를 분석 및 이해하는 기법 등을 전수한다. 특히 각 절 내에 코드 예제를 가이드북 형태로 만들어 스스로 응용 프로그램을 단계별로 만들고 알고리즘 동작원리의 이해할 수 있도록 유도한다.
☞ 이 책의 독서 포인트!
여러 사람들이 매일 수집하는 정보를 이용하는 보다 세련된 프로그램 제작을 가르치는 것이 목적이다. 웹2.0 애플리케이션에 사용자의 성향이나 행태를 분석해서 반영하려는, 또는 웹2.0 서비스의 핵심 컨텐츠에 대해서 고민하는 기획자, 새로운 서비스 개발을 위해서 시장의 데이터를 분석하려는 이들에게 유용하다.
작가정보
저자(글) 토비 세가란
계산 생명공학 회사인 젠스트럭트에서 약제 발현 원리 이해를 위한 알고리즘을 설계하고 데이터마이닝 기법을 적용하는 소프트웨어 개발 부서를 맡고 있으며, 수집된 데이터 세트들을 분석해 원하는 값을 찾도록 돕는 오픈 소스 프로젝트에도 참여하고 관련된 여러 다른 회사와도 일하고 있다. 이 밖에도 인기 있는 태스크토이(www.tasktoy.com)와 레이지베이스(www.lazybase.com) 같은 다수의 무료 웹 서비스도 만들었다. 토비 세가란은 스노우보드와 와인에 푹 빠져있으며, 저자의 블로그는 blog.kiwitobes.com다. 현재 샌프란시스코에 거주한다.
번역 윤종완
KAIST에서 운영체제를 전공한 윤종완씨는 정보검색분야 분야 전문가로 현대전자, 현재정보기술 연구소 연구원, 코리아와이즈넛 기술이사를 거쳐 현재 오픈마루 검색팀 팀장으로 재직 중이다. 관심 분야는 인터넷 정보 검색, 웹 마이닝이고 검색기술에 많은 경험을 가지고 있다. 최근에는 웹2.0 서비스의 집단지성에 관한 연구를 활발히 하고 있다.
목차
- 1장. 집단지성 소개
1.1 집단지성이란?
1.2 기계학습이란?
1.3 기계학습의 한계
1.4 실제 예
1.5 기계학습의 다른 사례
2장. 추천시스템 만들기
2.1 협업 필터링
2.2 선호 정보 수집
2.3 유사 사용자 찾기
2.4 항목 추천
2.5 제품 매칭
2.6 딜리셔스 링크 추천 기능 만들기
2.7 항목 기반 필터링
2.8 무비렌즈(MovieLens) 데이터 세트 이용하기
2.9 사용자 기반과 항목 기반 필터링
2.10 함께 풀어보기
3장. 군집 발견
3.1 감독 대 무감독 학습
3.2 단어 벡터
3.3 계층적 군집화
3.4 계통도 출력
3.5 세로줄 군집화
3.6 k평균 군집화
3.7 선호도 군집
3.8 2차원으로 데이터 보기
3.9 군집 가능한 다른 것들
3.10 함께 풀어보기
4장. 검색과 랭킹
4.1 검색엔진이란?
4.2 단순 크롤러
4.3 색인하기
4.4 검색하기
4.5 내용 기반 랭킹
4.6 유입 링크 사용하기
4.7 클릭 학습
4.8 함께 풀어보기
5장. 최적화
5.1 단체 여행
5.2 해답 표현하기
5.3 비용 함수
5.4 무작위 검색
5.5 언덕등반
5.6 시뮬레이티드 어닐링
5.7 유전자 알고리즘
5.8 비행편 검색 실제
5.9 선호도 최적화
5.10 네트워크 시각화
5.11 다른 가능성들
5.12 함께 풀어보기
6장. 문서 필터링
6.1 스팸 필터링
6.2 문서와 단어
6.3 분류기 훈련시키기
6.4 확률 계산
6.5 기본 분류기
6.6 피셔 방식
6.7 학습 정보 저장
6.8 블로그 피드 필터링
6.9 향상된 특성 검출법
6.10 Akismet 사용하기
6.11 다른 기법들
6.12 함께 풀어보기
7장. 의사결정트리
7.1 가입 유형 추정
7.2 의사결정트리 소개
7.3 트리 학습
7.4 최적 단편 선정
7.5 재귀적으로 트리 만들기
7.6 트리 출력하기
7.7 새로운 관찰 분류하기
7.8 트리 가지치기
7.9 손상된 데이터 다루기
7.10 숫자 결과 다루기
7.11 주택 가격 모델링
7.12 "인기도" 모델링
7.13 의사결정트리 활용 시점
7.14 함께 풀어보기
8장. 가격 모델링
8.1 예제 데이터 세트 만들기
8.2 kNN
8.3 물품 가중치
8.4 교차검증
8.5 이질 변수
8.6 축척 최적화
8.7 불균등 분포
8.8 실 데이터 - 이베이 API
8.9 적절한 kNN 활용 방법
8.10 함께 풀어보기
9장. 고급 분류 기법: 커널 기법과 SVM
9.1 중매 데이터 세트
9.2 데이터를 다루는 어려움
9.3 기본 선형 분류
9.4 분류 데이터의 특성
9.5 데이터 축척 조정
9.6 커널 기법 이해
9.7 지지벡터머신
9.8 LIBSVM 사용
9.9 페이스북 매칭
9.10 함께 풀어보기
10장. 독립 특성 발견
10.1 뉴스 코퍼스
10.2 이전 방식들
10.3 비음수 행렬 인수분해
10.4 결과 출력하기
10.5 주식시장 데이터 사용하기
10.6 함께 풀어보기
11장. 진화지성
11.1 유전자 프로그래밍이란?
11.2 프로그램을 트리로 표현하기
11.3 초기 개체군 만들기
11.4 해답 검증하기
11.5 프로그램 돌연변이 시키기
11.6 교배하기
11.7 환경 구축하기
11.8 간단한 게임
11.9 다른 가능성들
11.10 함께 풀어보기
12장. 알고리즘 요약
12.1 베이지안 분류기
12.3 신경망
12.4 지지벡터머신
12.5 KNN
12.6 군집화
12.7 다차원 비례 축소법
12.8 비음수 행렬 인수분해
12.9 최적화
부록 A. 외부 라이브러리
부록 B. 수학 공식
책 속으로
세련된 웹 2.0 서비스 구축을 위한 집단지성 프로그래밍!
이 책은 참여 중심의 인터넷 서비스에서 생성한 방대한 데이터를 이용하는 웹 2.0 서비스 구축 방법을 알려준다. 기계학습과 통계의 세계로 독자를 인도하여 매일 수집되는 사용자 데이터로부터 사용성, 마케팅, 개인성향, 행태분석에 대한 결론을 끌어내는 방법을 보여준다. 또한 웹 사이트, 블로그, 위키, 기타 특수 애플리케이션에서 바로 사용할 수 있는 깔끔하게 정리한 알고리즘을 코드와 함께 제공한다.
이 책의 주요 내용
* 온라인 소매상이 제품 또는 미디어를 추천할 때 사용하는 협업 필터링 기법
* 대용량 데이터에 내재된 유사 아이템 묶음을 검출할 때 사용하는 군집 기법
* 특정 문제에 대한 수백만 개의 해결책 중 최선책을 찾을 때 사용하는 최적화 알고리즘
* 단어유형 및 기타 특성을 이용한 문서분류 기술인 베이지안 필터링 기법
* 온라인 데이트 사이트에서 짝짓기에 사용되는 SVM 기술
* 문제 해결에 사용되는 유전자 프로그래밍
출판사 서평
1장. 집단지성 소개
이 장에서는 기계학습 뒤에 숨겨진 개념을 설명하고, 이를 다른 영역에 적용하는 방법과 다수 사람들로부터 모은 데이터에서 새로운 결론을 꺼내는 방법을 설명한다.
2장. 추천
이 장에서는 온라인 소매상점에서 제품이나 미디어를 추천하는 데 곧잘 사용되는 협업 필터링 기법을 소개한다. 또한 소셜 북마크 사이트에서 링크를 사람들에게 추천하고 무비렌즈(MovieLens) 데이터 세트에서 영화를 추천하는 시스템을 만드는 방법에 대해서도 소개한다.
3장. 군집 발견
이 장에서는 2장의 아이디어를 이용해서 대규모 데이터 세트에서 유사항목을 가진 그룹을 자동으로 검출하는 두 개의 군집 기법들을 소개한다. 즉, 인기 블로그 집합에서 그리고 소셜 네트워킹 웹 사이트로부터의 사람들의 요구에서 그룹을 찾기 위해 군집을 사용하는 방법을 보여준다.
4장. 검색과 랭킹
이 장에서는 크롤러, 인덱서, 쿼리엔진과 같은 검색엔진 구조를 설명한다. 또한 유입 링크를 활용하여 웹 페이지 점수를 매기는 페이지랭킹(PageRanking) 알고리즘도 다루며, 검색어와 연계된 검색 결과를 학습하는 신경망(Neural Network)을 만드는 방법도 소개한다.
5장. 최적화 기법
이 장에서는 한 문제에 대한 수백만의 가능한 해답 중 최적 해답을 찾도록 설계된 최적화 알고리즘을 소개한다. 이 알고리즘의 다양한 사용법이 같은 지역을 여행하는 단체 여행객이 최적의 비행편을 찾는 문제와 학생들을 기숙사에 배치하는 가장 좋은 방법 그리고 최소의 교차점을 가지는 네트워크 배치 문제를 통해 소개된다.
6장. 문서 필터링
이 장에서는 베이지안 필터링 기법을 소개한다. 이 기법은 여러 무료 또는 상용 스팸 필터에서 사용하는 기법으로 단어의 유형 또는 문서 내의 여러 특성을 기반으로 문서를 자동 분류한다. 여기서는 이것을 RSS 검색 결과 집합에 적용하여 자동적으로 RSS 항목들을 분류하는 예제를 다룬다.
7장. 의사결정트리 모델링
의사결정트리(decision tree)는 예측뿐만 아니라 의사결정 과정 모델링에 유용한 방법이다. 첫 번째 의사결정트리는 서버로그에서 추출한 가상데이터로 만들고, 사용자가 프리미엄 가입자가 될 것인지 아닌지를 판단하는 데 사용한다. 기타 예제에서는 부동산 가격과 인기도를 모델링하는 데 부동산 웹 사이트의 데이터를 이용한다.
8장. 가격 모델링
이 장에서는 5장의 최적화 기법과 kNN 기법을 분류가 아닌 숫자 값 예측 문제에 적용해 본다. 이 방법들을 이베이 오픈 API와 결합하여 속성 집합에 기반을 둔 경매 물건들의 최종 경매 가격을 예측하는 시스템을 구축한다.
9장. 고급 분류 기법들: 커널 기법과 SVM
이 장에서는 온라인 데이트 사이트에서 사람들을 중매하거나 전문가 연락처를 검색하는 데 SVM(support-vector machine) 기법을 적용해 본다. SVM은 상당히 고급 기법으로, 다른 기법들과 비교도 해 본다.
10장. 독립 특성 발견
이 장에서는 다소 새로운 기법인 NMF(non-negative matrix factorization) 기법을 소개한다. 이 기법은 데이터 세트에서 독립적인 특성들을 찾는 데 사용된다. 많은 데이터 세트 내의 항목들은 미리 알기 어려운 다른 특성들과의 조합으로 생성되는데, 여기서는 이 특성들을 발견하는 것이다. 뉴스 기사 세트에 적용해서 주제를 검출하고 해당 주제를 가지는 뉴스 기사를 찾는 예제에 이 기법을 적용해 본다.
11장. 진화지성
이 장에서는 유전자 프로그래밍(genetic programming)을 소개한다. 이 기법은 최적화 기법을 넘는 고상한 기법으로 진화 사상을 이용해서 알고리즘을 생성하여 특정 문제를 해결하는 데 이용된다. 또한 컴퓨터가 처음에는 초보 플레이어지만 게임이 진행될수록 자신의 코드를 개선해 가며 기술을 향상시키는 간단한 게임 예제를 다룬다.
12장. 알고리즘 요약
이 장에서는 이 책에서 소개한 기계학습과 통계 알고리즘을 검토하고 이들을 인공지능 문제들에 비교한다. 이는 독자스스로 알고리즘 동작원리와 알고리즘이 데이터를 분할하는 방법을 이해하는 데 도움을 줄 것이다.
추천사
“이 책은 처음 AI 알고리즘과 사용법을 익히는 개발자에게 최고의 학습서다. 또한 나처럼 오랫동안 AI를 접해온 사람도 알고 있는 지식을 다시 돌아보는 데 최고다." - 댄 러셀, 최고기술리더, 구글.
“토비의 책은 복잡한 기계학습 알고리즘 문제를 현재 웹에서 나타나는 상호작용 분석에 바로 적용할 수 있게 이해하기 쉬운 예제로 다뤘다. 2년 전에 출간했으면 결실 없이 헤맸던 아까운 내 시간을 많이 절약했을 좋은 책이다.” - 팀 월터스, CTO, Collective Intellect.
“집단지성 프로그래밍은 방대한 데이터를 처리하는데 필요한 계산 기법들을 친절하게 집대성한 주옥같은 책이다. 특히, 이 책에서 소개한 기술들은 인터넷상의 격리된 데이터 섬들에서 가치 있는 것을 찾는데 적용할 수 있다. 여러분이 인터넷 개발자라면 이 책을 꼭 소장 바란다.”- 파울 티마, 선임 소프트웨어 엔지니어, 구글
기본정보
ISBN | 9788979145625 | ||
---|---|---|---|
발행(출시)일자 | 2008년 04월 30일 | ||
쪽수 | 400쪽 | ||
크기 |
188 * 254
mm
|
||
총권수 | 1권 | ||
원서명/저자명 | Programming collective intelligence : building smart web 2.0 applicati/Segaran, Toby |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립