-
[책 리뷰] 핸즈온 데이터 시각화 (Hands-On Data Visualization)BOOK 2022. 7. 10. 18:13반응형
디지털 트랜스포메이션이라는 단어가 클리셰처럼 느껴질 정도로
많은 기업들이 데이터 기반의 의사결정을 위한 비즈니스 구조 전환을 시작했음에도 불구하고
현장에는 여전히 기본적인 데이터를 다루는 일에도 어려움을 느끼는 사람들이 많습니다.
- '옮긴이의 말'에서서평을 쓰는 본인이 일하고 있는 팀 명에도 '디지털 트랜스포메이션(Digital Transformation, 이하 DT 또는 DX)' 약어가 들어가는데 옮긴이의 말에 백번 공감을 했다. 정말 이 단어는 클리셰처럼 쓰이지만 정작 단어를 남발하기만 하고 제대로 DT를 알고 쓸 수 있는 사람은 많지 않다.
이 책은 개발자가 아닌, Python이나 R언어 등의 코딩 지식이 없어도 쉽게 따라할 수 있는 데이터 시각화 입문서이다. 실제로 많은 교육 기관에서 데이터 시각화 입문 교재로 이 책을 활용하고 있고, 또다른 견해로는 데이터 기반 보고서를 작성하고자 하는 리더들에게도 이 책을 추천하고 싶다. 데이터에 관한 기본 개념부터, 데이터에 대한 거짓과 편향 그리고 개인 데이터 관련 논쟁 (데이터에 관한 윤리/법률적 트렌드) 까지 정리되어 있는 꼼꼼한 기본서라고 할 수 있다.
책에서 소개하는 오픈 데이터 저장소들
미국 통계청 데이터
https://data.census.gov/cedsci/유럽 연합 통계청
https://ec.europa.eu/eurostat연방준비제도이사회 경제 연구
https://fred.stlouisfed.org/Google Dataset Search
구글에서 개발한 데이터셋 검색 엔진
https://datasetsearch.research.google.com/Harvard DataVerse
https://dataverse.harvard.edu/Integrated Public Use Microdata Series
세계에서 가장 큰 개인 수준 인구 데이터베이스
https://www.ipums.org/Open Data Network
주로 미국 주 및 시의 오픈 플랫폼 데이터셋을 제공
https://www.opendatanetwork.com/World Bank Open Data
세계 경제 개발 데이터
https://data.worldbank.org/World Inequality Database
https://wid.world/
목차
CHAPTER 0 서문
0.1 왜 데이터 시각화인가
0.2 무엇을 믿을 수 있을까요
0.3 더 설득력 있는 그림
0.4 진실의 여러 가지 그림자
0.5 책의 구성
0.6 마치며
[PART I 기본 기술]
CHAPTER 1 스토리를 위한 도구 선택하기
1.1 데이터 스토리 스케치하기
1.2 도구를 선택할 때 고려해야 할 10가지 요소
1.3 추천 도구
1.4 패스워드 관리자 사용
1.5 마치며
CHAPTER 2 스프레드시트 스킬 강화하기
2.1 스프레드시트 도구 선택
2.2 CSV 또는 ODS 형식으로 다운로드하기
2.3 구글 시트 복사본 만들기
2.4 구글 시트 공유하기
2.5 구글 시트 업로드하고 변환하기
2.6 구글 시트에서 주소 지오코딩하기
2.7 구글 설문지로 데이터 수집하기
2.8 데이터 정렬 및 필터
2.9 수식을 사용해 계산하기
2.10 피벗 테이블을 사용해 데이터 요약하기
2.11 VLOOKUP을 사용해 열 매칭하기
2.12 스프레드시트와 관계형 데이터베이스
2.13 마치며
CHAPTER 3 데이터를 찾고 질문하기
3.1 검색을 위한 질문 가이드
3.2 공공 데이터와 개인 데이터
3.3 민감한 데이터를 가리거나 집계하기
3.4 오픈 데이터 저장소
3.5 데이터 출처 남기기
3.6 불량 데이터 인식하기
3.7 데이터에 대해 질문하기
3.8 마치며
CHAPTER 4 지저분한 데이터 정리하기
4.1 구글 시트 스마트 클린업
4.2 찾기 및 바꾸기
4.3 행과 열 바꾸기
4.4 데이터를 서로 다른 열로 나누기
4.5 데이터를 한 열에 합치기
4.6 타불라를 사용해 PDF에서 테이블 추출하기
4.7 오픈리파인으로 데이터 정리하기
4.8 마치며
CHAPTER 5 의미 있는 비교하기
5.1 비교를 정확히 기술하기
5.2 데이터 정규화하기
5.3 편향된 비교 주의하기
5.4 마치며
[PART II 시각화 구축]
CHAPTER 6 차트 만들기
6.1 차트 디자인 원칙
6.2 구글 시트 차트
6.3 막대 차트와 열 차트
6.4 히스토그램
6.5 원형 차트, 선 차트, 영역 차트
6.6 데이터래퍼 차트
6.7 주석이 달린 차트
6.8 범위 차트
6.9 분산형 차트와 버블 차트
6.10 태블로 퍼블릭 차트
6.11 태블로 퍼블릭으로 만드는 분산형 차트
6.12 필터링된 선 차트
6.13 마치며
CHAPTER 7 데이터를 지도로 시각화하기
7.1 지도 디자인 원칙
7.2 코로플레스 색상과 간격 디자인
7.3 코로플레스 지도 데이터 정규화하기
7.4 구글 내 지도로 만드는 포인트 지도
7.5 데이터래퍼로 만드는 심벌 포인트 지도
7.6 데이터래퍼로 만드는 코로플레스 지도
7.7 태블로 퍼블릭으로 만드는 코로플레스 지도
7.8 소크라타 오픈 데이터로 만드는 실시간 지도
7.9 마치며
CHAPTER 8 테이블을 활용한 시각화
8.1 테이블 디자인 원칙
8.2 스파크라인으로 만드는 데이터래퍼 테이블
8.3 기타 테이블 생성 도구
8.4 마치며
CHAPTER 9 웹에 임베딩하기
9.1 정적 이미지와 대화형 iframe
9.2 임베드 코드 또는 iframe 태그 가져오기
9.3 코드 또는 iframe을 웹사이트에 붙여넣기
9.4 마치며
[PART III 코드 템플릿과 고급 도구]
CHAPTER 10 깃허브로 코드 수정하고 호스트하기
10.1 간단한 리플릿 맵 템플릿 복사, 수정, 호스팅하기
10.2 깃허브 페이지 링크를 iframe으로 변환하기
10.3 깃허브에 새로운 레포 만들고 파일 업로드하기
10.4 깃허브 데스크톱과 아톰 텍스트 편집기를 사용해 효율적인 코딩하기
10.5 마치며
CHAPTER 11 Chart.js와 하이차트 템플릿
11.1 Chart.js로 만드는 막대 또는 열 차트
11.2 Chart.js로 만드는 오류 바
11.3 Chart.js로 만드는 선 차트
11.4 하이차트로 만드는 주석이 달린 선 차트
11.5 Chart.js로 만드는 분산형 차트
11.6 Chart.js로 만드는 버블 차트
11.7 마치며
CHAPTER 12 리플릿 맵 템플릿
12.1 구글 시트로 만드는 리플릿 맵
12.2 구글 시트로 만드는 리플릿 스토리맵
12.3 구글 시트 API 키 가져오기
12.4 CSV 데이터로 만드는 리플릿 맵
12.5 CSV 데이터로 만드는 리플릿 히트맵 포인트
12.6 검색 가능한 리플릿 포인트 지도
12.7 오픈 데이터 API로 만드는 리플릿 맵
12.8 마치며
CHAPTER 13 지도 데이터 변환하기
13.1 지리 공간 데이터와 GeoJSON
13.2 GeoJSON 경계 파일 찾기
13.3 GeoJson.io를 사용해 그리고 편집하기
13.4 맵셰이퍼를 사용해 편집하고 병합하기
13.5 압축된 KMZ를 KML로 변환하기
13.6 맵 워퍼로 지오레퍼런스하기
13.7 미국 통계청 지오코더를 사용해 대량으로 지오코딩하기
13.8 포인트 데이터를 폴리곤 데이터로 피벗하기
13.9 마치며
[PART IV 진실하고 의미 있는 스토리 전달하기]
CHAPTER 14 거짓을 발견하고 편향 줄이기
14.1 차트로 거짓말하는 방법
14.2 지도로 거짓말하는 방법
14.3 데이터 편향 인지하고 줄이기
14.4 공간 편향 인지하고 줄이기
14.5 마치며
CHAPTER 15 데이터 스토리 말하고 보여주기
15.1 스토리보드에 내러티브 작성하기
15.2 의미에 주의를 기울이세요
15.3 출처와 불확실성 인정하기
15.4 데이터 스토리 형식 결정하기
15.5 마치며
APPENDIX 자주 발생하는 문제 해결법
A.1 도구 또는 플랫폼 문제
A.2 다른 브라우저 사용해보기
A.3 개발 도구로 진단하기
A.4 맥 또는 크롬북 문제
A.5 불량 데이터 체크하기
A.6 흔히 발생하는 iframe 에러
A.7 깃허브에서 코드 수정하기반응형'BOOK' 카테고리의 다른 글
[책 리뷰] 파이썬과 엑셀로 시작하는 딥러닝 (2) 2023.07.27 [책 리뷰] 클린 코드의 기술 (0) 2023.05.09 [책 리뷰] 구글 BERT의 정석 (0) 2022.06.26 [책 리뷰] 케라스로 구현하는 딥러닝 / 양자인공지능(QAI) 예제 (0) 2022.04.24 [책 리뷰] 금융 전략을 위한 머신러닝 (0) 2022.02.23