728x90
반응형
챕터 1과 챕터 2에서는 기본적인 통계 용어와 개념을 설명한다.
모든 내용이 중요하지만 대부분은 익숙한 용어라 부분부분 간단한 설명만 덧붙인다.
챕터 1 데이터 분석의 진행 순서 + 관련 용어
- 답이 필요한 질문을 찾는다
- 검증할 가설을 만든다
- 가설은 과학적으로 검증할 수 있어야 한다
- 측정할 변수를 정한다
- 변수의 분류
- 독립변수와 종속변수
- 범주형 변수 : 이분, 명목, 순서
- 연속변수 : 구간, 비율
- 변수 측정시 고려할 점
- 타당성 : 측정하고자 하는 것을 측정하는가?
- 기준 타당성
- 내용 타당성 : 측정이 대상을 얼마나 대표할 수 있는가?
- 신뢰도: 측정에 일관성이 있는가?
- 타당성 : 측정하고자 하는 것을 측정하는가?
- 변수의 분류
- 측정 방법을 정한다
- 상관연구와 실험연구
- 그룹간 설계 = 개체간 설계 = 독립설계
- 개체내 설계 = 반복측정 설계
- 체계적 변동과 비체계적 변동 > randomize로 해결하자
- 자료 분석
- 도수 분포표와 정규 분포, 왜도, 첨도
- 대푯값들: 최빈값, 중앙값, 평균
- 사분위수
- z score를 활용한 정규화 (X - X바) / s
- 귀무가설과 대립가설
챕터 2 통계학 기초 훑어보기
- 통계적 모형 - 평균
- 평균의 적합(fit) 평가: 오차의 제곱합, 분산, 표준편차
- 표준 오차와 표집 분포, 평균의 표준 오차, 중심극한정리
- 같은 모집단에서 추출한 표본 집단인 경우 신뢰구간이 유사하게 확인된다
- 신뢰구간의 뜻과 z값을 통해 신뢰구간 계산하기
- t 분포의 뜻과 t분포를 통해 신뢰구간 계산하기
- 자유도 n-1
- 검정통계량 : 모형이 설명하는 변동/모형이 설명하지 못하는 변동
- ex) t, F, 카이제곱 등
- 단측 검정과 양측 검정
- 1종 오류와 2종 오류
- 검정력 = 1-β(2종 오류 확률)
728x90
반응형
'데이터 분석 > R' 카테고리의 다른 글
앤디 필드의 유쾌한 R 통계학 챕터 6 - 상관분석 (0) | 2022.04.08 |
---|---|
앤디 필드의 유쾌한 R 통계학 챕터 5 - 자료 가정 (0) | 2022.04.05 |
앤디 필드의 유쾌한 R 통계학 챕터 4 - 기초 시각화 (0) | 2022.04.01 |
앤디 필드의 유쾌한 R 통계학 챕터 3 - R 기초 (0) | 2022.03.31 |
독학을 위한 책 선정(앤디 필드의 유쾌한 R 통계학) (0) | 2022.03.25 |