-
[책 리뷰] 파이썬으로 배우는 통계학 교과서 (2판)BOOK 2024. 12. 27. 18:51반응형
총평
많은 인공지능 모델, 특히 초기의 머신러닝 모델의 대부분은 통계모형을 기반으로 하고 있다. 필자도 대략 통계 모델을 어떤 상황에 쓰면 좋은지, 어떤 특징을 갖는 지 정도는 인지하고 있지만 그 개념과 원리에 대해서는 자세히 알지 못한다. 이에 대한 궁금증과 갈증이 있는 인공지능 개발자에게는 무척 도움이 될 것이다. 다만 통계학의 수학적 내용을 깊이 파고들고 싶거나 딥러닝 등 통계기반 모델이 아닌 인공지능에 관심이 있다면 거리가 멀 수 있다.
굳이굳이 리뷰 제목에 '2판'을 추가한 이유는 초판에 비하여 많은 내용들이 개편되었기 때문이다. 이전보다 초보자가 이해하기 쉽도록 쓰여졌고 (독자가 여러 이유로 통계학을 이해하지 못하는 일이 없도록 구성하였다고 자신있게 기술하였다) 실습 코드도 새롭게 추가되고 자세해졌다. 실제로 챕터 2에서 환경 셋업과 함께 파이썬 기본 문법을 소개하고 있어, 코드 작성을 처음 해 보는 사람에게도 추천할 만하다. 이 책이 처음이든, 초판을 읽었든 두 케이스 모두 읽을만한 가치가 있는 통계 바이블이다.
챕터 5부터는 다소 어려워지는데, 개인적으로 최근에 준비했었던 빅데이터분석기사 시험에도 많은 도움을 줄 것이라고 생각되었다. 특히 실습 3유형은 광범위하면서도 통계적 수준이 어느정도 있었었어야 하는데, 당시 시험볼때는 용어-코드 달달 외우기만 했었다. 이렇게 개념과 함께 실습을 하니 다시금 이해가 되었다.
책갈피
1.2.1 기술통계가 필요한 이유
기술통계는 데이터 해석이나 데이터 간의 비교를 간단하게 하면서도 가능한 한 정보를 잃지 않게 위해 필요한 이론입니다.
현대 사회에서 다루는 데이터의 크기는 대개 수천, 수만 혹은 그 이상일 수 있습니다. 이러한 데이터를 하나씩 확인하는 것은 너무 비효율적입니다. 따라서 데이터의 특징을 파악하는 데 유용한 몇 가지 지표를 계산하는 것이 일반적입니다.
이러한 지표를 문맥에 따라 데이터의 대푯값, 요약 통계량 또는 단순히 통계량이라고 합니다.1.3.1 추론통계가 필요한 이유
추론통계는 아직 얻지 못한 미지의 데이터에 대해 논의할 때 필요한 이론입니다. 조사 방법에는 크게 전수조사와 표본조사 두 종류가 있습니다. ...(중략)... 또한 특정 동물 종의 생태를 조사할 때 전 세계의 모든 개체를 대상으로 조사하는 것은 불가능합니다. 이처럼 추론통계는 비즈니스와 연구 활동 모두에게서 필수적이고 중요한 기술입니다.추가로,예제소스가 github에는 따로 없고, 한빛미디어 자료실에서 다운받을 수 있다.
https://www.hanbit.co.kr/support/supplement_survey.html?pcode=B6819729468
목차
CHAPTER 1 통계학 기본
_1.1 통계학
_1.2 왜 기술통계가 필요한가
_1.3 왜 추론통계가 필요한가
CHAPTER 2 파이썬과 주피터 노트북
_2.1 환경 구축
_2.2 주피터 노트북
_2.3 파이썬 프로그래밍
_2.4 넘파이와 팬더스
CHAPTER 3 기술통계
_3.1 데이터 분류
_3.2 수식을 읽는 방법
_3.3 도수분포
_3.4 1변량 데이터 통계량
_3.5 다변량 데이터 통계량
_3.6 층화분석
_3.7 그래프 활용
CHAPTER 4 확률과 확률분포
_4.1 확률론
_4.2 확률분포
_4.3 이항분포
_4.4 정규분포
CHAPTER 5 통계적 추정
_5.1 통계적 추론의 개념
_5.2 모집단에서 표본추출 시뮬레이션
_5.3 모평균 추정
_5.4 모분산 추정
_5.5 정규모집단에서 파생된 확률분포
_5.6 구간추정
CHAPTER 6 통계적 가설검정
_6.1 모평균에 대한 단일표본 t검정
_6.2 평균값 차이 검정
_6.3 분할표 검정
_6.4 검정 결과 해석
CHAPTER 7 통계모델
_7.1 통계모델 기본
_7.2 선형모델을 만드는 방법
_7.3 데이터 표현과 모델 명칭
_7.4 파라미터 추정: 가능도 최대화
_7.5 파라미터 추정: 손실 최소화
_7.6 예측 정확도 평가와 변수 선택
CHAPTER 8 정규선형모델
_8.1 연속형 독립변수가 하나인 모델: 단순회귀
_8.2 정규선형모델 평가
_8.3 분산분석
_8.4 독립변수가 여럿인 모델
CHAPTER 9 일반화선형모델
_9.1 일반화선형모델 기본
_9.2 로지스틱 회귀
_9.3 일반화선형모델 평가
_9.4 푸아송 회귀
CHAPTER 10 통계학과 머신러닝
_10.1 머신러닝 기본
_10.2 정규화와 리지 회귀, 라소 회귀
_10.3 파이썬을 이용한 리지 회귀와 라소 회귀
_10.4 선형모델과 신경망"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
반응형'BOOK' 카테고리의 다른 글
[책 리뷰] ChatGPT 제대로 써먹기 (8) 2024.10.26 [책 리뷰] 코드 밖 커뮤니케이션 (6) 2024.09.25 [책 리뷰] 개발자를 위한 커리어 관리 핸드북 (0) 2024.05.26 [책 리뷰] 인사이드 머신러닝 인터뷰 (6) 2024.04.09 [책 리뷰] GPT-4를 활용한 인공지능 앱 개발 (2) 2024.02.20