직장인을 위한 데이터 분석 실무 with 파이썬
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
이 책에서는 누구나 궁금했던 그 질문에 대해 데이터로 답해 봅니다. 이 책은 파이썬을 처음 접하는 마케팅, 영업, 기획 실무 담당자들이 파이썬을 활용한 데이터 분석에 재미있게 빠져들 수 있도록 실제 업무에 활용할 수 있거나 흥미로운 예제로 구성돼 있습니다. 이 책을 마치고 나면 데이터를 기반으로 좋은 질문에 답할 수 있는 실력을 키울 수 있을 것입니다.
★ 이 책에서 다루는 예제 ★
◎ 코로나(COVID-19) 영향으로 해외 관광객수 얼마나 줄었을까?
- 사회 이슈에 따른 외국인 관광객수 변화 분석
◎ 가장 뜨는 제주도 핫플레이스는 어디일까?
- 인스타그램으로 살펴보는 트렌드 분석
◎ 왜 우리동네에는 스타벅스가 없을까?
- 스타벅스 입지전략 분석
◎ 어떤 무선청소기가 인기가 좋을까?
- 다나와(가격비교 사이트)를 통한 무선청소기 브랜드별 제품 비교 분석
작가정보
저자(글) 이형석
주로 안드로이드 앱 개발자로 활동하다가 현재 회사인 '망고플레이트'에 입사하면서 본격적으로 안드로이드, 백엔드, 프런트엔드 업무까지 담당하는 등 다양한 개발 경험을 쌓고 있다. 맛집 데이터 정보를 효율적으로 수집 및 관리하기 위해 파이썬을 이용하면서 우연히 데이터 분석 스터디 모임인 Play with Data를 알게 됐고 모임을 준비하고 진행하면서 많은 것을 배우고 있다.
저자(글) 장남수
목차
- ▣ 01장: 준비하기
1.1 실습 자료 내려받기
1.2 파이썬 준비
____1.2.1 아나콘다 내려받기
____1.2.2 아나콘다 설치
____1.2.3 주피터 노트북 준비
____1.2.4 주피터 노트북 시작하기
____1.2.5 주피터 노트북 사용하기
1.3 파이썬 맛보기
____1.3.1 파이썬 코드 입력 및 실행
____1.3.2 값 입력 및 출력
____1.3.3 리스트
____1.3.4 반복문
____1.3.5 문자열
____1.3.6 조건문
____1.3.7 함수
▣ 02장: 데이터 분석 기초
2.1 pandas 기초
____2.1.1 pandas란?
____2.1.2 데이터 불러오기(read_excel)
____2.1.3 데이터 선택 ① - 칼럼 기준
____2.1.4 데이터 선택 ② - 로우 기준
____2.1.5 데이터 통합 ① - 옆으로 통합(merge)
____2.1.6 데이터 통합 ② - 아래로 통합(append)
____2.1.7 데이터 저장(to_excel)
____2.1.8 데이터 집계(pivot_table)
2.2 웹 크롤링 기초
____2.2.1 selenium과 크롬드라이버 설치
____2.2.2 크롬드라이버 활용하기
____2.2.3 웹 페이지 접속
____2.2.4 웹 페이지(HTML) 다운로드
____2.2.5 HTML 구조 살펴보기
____2.2.6 크롬 브라우저에서 웹 페이지의 HTML 살펴보기
____2.2.7 BeautifulSoup을 이용한 정보 찾기
____2.2.8 HTML 정보 찾기 ① - 태그 속성 활용
____2.2.9 HTML 정보 찾기 ② - 상위 구조 활용
____2.2.10 정보 가져오기 ① - 태그 그룹에서 하나의 태그 선택하기
____2.2.11 정보 가져오기 ② - 선택한 태그에서 정보 가져오기
____2.2.12 멜론 노래 순위 정보 크롤링
____2.2.13 selenium을 활용한 크롤링
▣ 03장: 데이터 분석 맛보기
3.1 여러 음원 서비스의 순위 수집/정리하기
____3.1.1 멜론 크롤링 결과를 엑셀로 저장하기
____3.1.2 벅스 크롤링 결과를 엑셀 파일로 저장하기
____3.1.3 지니 크롤링 결과를 엑셀 파일로 저장하기
____3.1.4 멜론, 벅스, 지니 크롤링 엑셀 파일 통합하기
3.2 유튜브 랭킹 데이터 수집과 시각화
____3.2.1 유튜브 랭킹 데이터 수집하기
____3.2.2 유튜브 랭킹 데이터 시각화하기
____3.2.3 결론
▣ 04장: 코로나 바이러스(COVID19)의 영향으로 중국인 관광객이 얼마나 줄었을까
4.1 외국인 출입국 통계 데이터 구하기
4.2 데이터 불러오기 및 전처리
____4.2.1 불러올 데이터의 형태 파악
____4.2.2 파이썬에서 엑셀 데이터 불러오기
____4.2.3 데이터 전처리
____4.2.4 데이터 전처리 과정을 함수로 만들기
____4.2.5 반복문을 통해 다수의 엑셀 데이터를 불러와서 합치기
____4.2.6 통합 데이터를 엑셀 파일로 저장하기
____4.2.7 국적별 필터링된 데이터를 엑셀 파일로 저장하기
4.3 데이터 시각화
____4.3.1 데이터 시각화의 중요성
____4.3.2 시계열 그래프 그리기
____4.3.3 히트맵 그래프 그리기
4.4 시각화 해석하기
4.5 정리
▣ 05장: 가장 뜨는 제주도 핫플레이스는 어디일까?
5.1 인스타그램 크롤링
____5.1.1 크롤링 과정
____5.1.2 인스타그램 접속 후 로그인하기
____5.1.3 인스타그램 검색 결과 URL을 만들어 접속하기
____5.1.4 첫 번째 게시글 열기
____5.1.5 게시글 정보 가져오기
____5.1.6 다음 게시글 열기
____5.1.7 여러 게시글 정보 수집하기
____5.1.8 수집 데이터 저장
____5.1.9 여러 엑셀 파일의 중복을 제거한 후 통합 저장
5.2 워드 클라우드
____5.2.1 워드 클라우드를 만드는 과정
____5.2.2 해시태그 데이터 불러오기
____5.2.3 해시태그 출현 빈도 집계
____5.2.4 막대차트로 해시태그 살펴보기
____5.2.5 워드 클라우드 그리기
5.3 지도 시각화
____5.3.1 지도 시각화 과정
____5.3.2 데이터 준비
____5.3.3 카카오 검색 API 가입
____5.3.4 카카오 로컬 API를 활용한 장소 검색
____5.3.5 위치 정보별 인스타 게시량 정리
____5.3.6 folium을 이용한 지도 시각화 ① - 개별 표시
____5.3.7 folium을 이용한 지도 시각화 ② - 그룹으로 표시
5.4 특정 단어를 포함한 게시글 찾기
____5.4.1 원하는 게시글 찾기
____5.4.2 데이터 준비하기
____5.4.3 단어 선택하기
5.5 정리
▣ 06장: 왜 우리 동네에는 스타벅스가 없을까?
6.1 데이터 수집
____6.1.1 크롤링을 이용한 서울시 스타벅스 매장 목록 데이터 생성
____6.1.2 서울열린데이터광장의 OPEN API를 활용한 공공데이터 수집
6.2 데이터 전처리
____6.2.1 서울시 스타벅스 매장 목록, 인구, 사업체 데이터에 시군구명, 시군구코드 추가
____6.2.2 스타벅스 분석 데이터 만들기
6.3 데이터 시각화
____6.3.1 스타벅스 매장분포 시각화
____6.3.2 시군구별 스타벅스 매장 수 시각화
____6.3.3 스타벅스 매장 수와 인구수 비교
____6.3.4 스타벅스 매장 수와 사업체 수 비교
6.4 정리
▣ 07장: 어떤 무선청소기가 인기가 좋을까?
7.1 데이터 수집 1 - 한 페이지 크롤링
____7.1.1 다나와 소개
____7.1.2 다나와 검색 페이지 접속
____7.1.3 다나와 검색 웹 페이지에서 상품 정보 가져오기
7.2 데이터 수집 2 - 여러 페이지에 걸친 다나와 검색 페이지 크롤링
____7.2.1 다나와 검색 결과 페이지 URL 분석
____7.2.2 주피터 노트북의 진행표시줄 처리
____7.2.3 여러 페이지에 걸친 상품 정보 수집
____7.2.4 수집 데이터 저장
7.3 다나와 크롤링 데이터 전처리
____7.3.1 다나와 크롤링 데이터 불러오기
____7.3.2 회사명, 모델명 정리
____7.3.3 스펙 목록 데이터 살펴보기
____7.3.4 스펙 목록에서 카테고리, 사용시간, 흡입력을 추출해서 정리
____7.3.5 무선청소기 사용시간 단위 통일시키기
____7.3.6 무선 청소기 흡입력 단위 통일시키기
____7.3.7 다나와 전처리 결과를 엑셀로 저장
7.4 무선청소기 모델별 비교 분석
____7.4.1 데이터 살펴보기
____7.4.2 가성비 좋은 제품 살펴보기
____7.4.3 데이터 시각화
____7.4.4 인기 제품의 데이터 시각화
7.5 정리
기본정보
ISBN | 9791158392284 | ||
---|---|---|---|
발행(출시)일자 | 2020년 11월 12일 | ||
쪽수 | 364쪽 | ||
크기 |
175 * 235
* 26
mm
/ 799 g
|
||
총권수 | 1권 | ||
시리즈명 |
위키북스 데이터 사이언스 시리즈
|
||
이 책의 개정정보 |
가장 최근에 출시된 개정판입니다.
구판보기
|
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립