데이터 분석/R

앤디 필드의 유쾌한 R 통계학 챕터 1, 챕터 2 - 통계 용어와 개념

쎄마비 2022. 3. 29. 15:00
728x90
반응형

 

 

챕터 1과 챕터 2에서는 기본적인 통계 용어와 개념을 설명한다.

모든 내용이 중요하지만 대부분은 익숙한 용어라 부분부분 간단한 설명만 덧붙인다.

 

 

챕터 1 데이터 분석의 진행 순서 + 관련 용어

  1. 답이 필요한 질문을 찾는다
  2. 검증할 가설을 만든다
    • 가설은 과학적으로 검증할 수 있어야 한다
  3. 측정할 변수를 정한다
    • 변수의 분류
      • 독립변수와 종속변수
      • 범주형 변수 : 이분, 명목, 순서
      • 연속변수 : 구간, 비율
    • 변수 측정시 고려할 점
      • 타당성 : 측정하고자 하는 것을 측정하는가?
        • 기준 타당성
        • 내용 타당성 : 측정이 대상을 얼마나 대표할 수 있는가?
      • 신뢰도: 측정에 일관성이 있는가?
  4. 측정 방법을 정한다
    • 상관연구와 실험연구
    • 그룹간 설계 = 개체간 설계 = 독립설계
    • 개체내 설계 = 반복측정 설계
    • 체계적 변동과 비체계적 변동 > randomize로 해결하자
  5. 자료 분석
    • 도수 분포표와 정규 분포, 왜도, 첨도
    • 대푯값들: 최빈값, 중앙값, 평균
    • 사분위수
    • z score를 활용한 정규화 (X - X바) / s
    • 귀무가설과 대립가설

 

 


챕터 2 통계학 기초 훑어보기

  • 통계적 모형 - 평균
    • 평균의 적합(fit) 평가: 오차의 제곱합, 분산, 표준편차
  • 표준 오차와 표집 분포, 평균의 표준 오차, 중심극한정리
    • 같은 모집단에서 추출한 표본 집단인 경우 신뢰구간이 유사하게 확인된다
  • 신뢰구간의 뜻과 z값을 통해 신뢰구간 계산하기
  • t 분포의 뜻과 t분포를 통해 신뢰구간 계산하기
    • 자유도 n-1
  • 검정통계량 : 모형이 설명하는 변동/모형이 설명하지 못하는 변동
    • ex) t, F, 카이제곱 등
  • 단측 검정과 양측 검정
  • 1종 오류와 2종 오류
  • 검정력 = 1-β(2종 오류 확률)

 

 

728x90
반응형