안녕하세요.

이번글에서는 일(1)표본(=단일표본) T검정에 대해서 알아보도록 하겠습니다.

 

[가설검정의 종류]

  • '차이'와 관련된 검정
    1. '평균'의 차이를 검정 하고 싶을 때
      • 1-1. 비교하는 집단이 하나일 때 
        • 1-1-1. 모분산을 알고 있는 경우
          • 일(1)표본 Z 검정 (One-sample Z test) → ex) 귀무가설(\(H_{0}\)): 한국의 평균은 K이다.
        • 1-1-2. 모분산을 모르는 경우
          • 일(1) 표본 T 검정 (One-sample T test) → ex) 귀무가설(\(H_{0}\)): 한국의 평균은 K이다.
      • 1-2. 비교하는 집단이 둘일 때
        • 1-2-1. 모분산을 알고 있는 경우 & 표본이 클 때
          • 이(2)표본 Z 검정 (Two-sample Z test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다.
        • 1-2-2. 모분산을 모르는 경우 & 표본이 작을 때
          • 1-2-2-1. 독립표본 T 검정 (Independent Sample T test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다.
          • 1-2-2-2. 대응표본 T 검정 (Paired Sample T test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다 & 해당 차이를 반복해서 검증 (한 달간 간격을 두고 측정: 1개윌 뒤, 2개윌 뒤, 3개윌 뒤, ....)  
      • 1-3. 비교하는 집단이 셋 이상일 때
        • 1-3-1. ANOVA (분산분석)
          • 1-3-1-1. 일원 분산분석 (One-way ANOVA) → ex) 귀무가설(\(H_{0}\)): 한국, 미국, 독일의 평균에 차이가 없다
          • 1-3-1-2. 반복측정 분산분석 (Repeated Measures ANOVA) → ex) 귀무가설(\(H_{0}\)): 한국, 미국, 독일의 평균에 차이가 없다 & 해당 차이를 반복해서 검증 (한 달간 간격을 두고 측정: 1개윌 뒤, 2개윌 뒤, 3개윌 뒤, ....)  
          • 1-3-1-3. 이원 분산분석 (Two-way ANOVA) → ex) 
          • 1-3-1-4. 이원반복측정 분산분석 (Two-way Repeated Measures ANOVA) → ex)

 

 

 

1. 일(1)표본 T검정 (One-sample T-test) = Student T-test

  • 일(1)표본 T검정은 다음 아래와 같은 상황에서 진행되는 가설검정 방식입니다.
    • 한 집단의 평균을 검정(test)하고 싶은 경우
    • 해당 집단의 (모)평균은 알고 있지만, (모)분산을 모르고 있다고 가정할 경우
      • 귀무가설(\(H_{0}\)): 표본평균과 모집단 평균을 같다.
      • 대립가설(\(H_{1}\)): 표본평균하고 모집단 평균은 차이가 있다.
      • ex) 전국학교의 평균성적과 우리학교의 평균성적은 같은가?
  • 또한, 일(1)표본 T검정은 정규분포를 가정하기 때문에, 표본크기가 30개 이상있을 때를 전제하고 있습니다 (By 중심극한 정리)
  • 일표본 T검정은 william이라는 사람이 발명했는데 당시 william의 필명이 student라고 해서, student T검정이라고도 부릅니다.

 

1-1. 표준오차

  • 일표본 T검정을 이해하기 위해 반드시 알고 있어야 할 개념이 표준오차입니다.
  • 그렇기 때문에 표준오차에 대한 설명을 조금 해보도록 하겠습니다.
  • 표준오차
    • 표본평균의 분산에 루트를 씌워준 것
    • 의미상으로 표본오차를 접근할 때는 표본평균의 분산의 의미로 생각하면 됨 
    • 표본평균의 분산: 표본평균들이 표본평균들이 표본평균들의 평균으로부터 얼마나 떨어져 있는지 알려주는 척도

(↓↓↓표본평균의 평균, 표본평균의 분산과 관련된 설명↓↓↓)

https://89douner.tistory.com/188?category=985452 

 

[통계학]2-1.표본 통계량(표본평균, 표본분산, 자유도, 표본분포)

표안녕하세요. 지난 글에서 통계학에 대한 제 개인적인 정의를 내린바 있습니다. "나의 주장(가설)을 보편 타당하게 증명하는 과정"  가설설정(Statistical hypothesis setting) = 내가 주장하려고 하는

89douner.tistory.com

 

 

 

1-2. Z분포와 T분포의 차이

(↓↓↓Z분포, Z검정 설명↓↓↓)

https://89douner.tistory.com/202?category=985452 

 

[통계학]4-1-1. 한 집단의 평균을 검정(test)할 때 (Feat. 일표본(단일표본) Z검정, 신뢰구간, 단측검정

안녕하세요. 이번 글에서는 한 집단의 평균을 검정(test)하는 두 가지 가설검정 방식중 하나인 일(1)표본(=단일표본) Z검정에 대해 알아보도록 하겠습니다. 일(1)표본(=단일표본) Z검정 (One-sample Z tes

89douner.tistory.com

 

(↓↓↓표본평균의 (확률)분포↓↓↓)

https://89douner.tistory.com/188

 

[통계학]2-1.표본 통계량(표본평균, 표본분산, 자유도, 표본분포)

표안녕하세요. 지난 글에서 통계학에 대한 제 개인적인 정의를 내린바 있습니다. "나의 주장(가설)을 보편 타당하게 증명하는 과정"  가설설정(Statistical hypothesis setting) = 내가 주장하려고 하는

89douner.tistory.com

 

 

 

 

  • 양측검정을 해야하는 경우라면 해당분포 양측 5%에 해당하는 critical value(임계값)을 설정해주어야 합니다.
  • 주의해야 할 점은, t분포는 자유도에 따라 양측 5%에 해당하는 critical value 값들이 다르다는것을 유의해야 합니다.

이미지 출처: https://enook.jbnu.ac.kr/contents/44/#!/p/17
이미지 출처: https://bioinformaticsandme.tistory.com/186

 

 

 

 

 

2. 일(1)표본 T검정 (One-sample T-test) 예시

  • 전국 대학교 대학생 평균 키 = 178.5
  • 우리 대학교 대학생 평균 키 = 179.9
    • 귀무가설: 전국 대학교의 대학생 평균 키와 우리 대학교 대학생 평균 키는 (통계적으로) 같다고 할 수 있다.
    • 대립가설: 전국 대학교의 대학생 평균 키와 우리 대학교 대학생 평균 키는 (통계적으로) 다르다고 할 수 있다.
  • 우리 대학교 대학생 키 표준편차(s) = 표본표준편차(s) = 7.05
  • 표본크기(n) = 101
  • 자유도 = n-1 = 100
  • 임계값 = 1.984 ← T분포의 임계값은 아래 그림처럼 T-table을 참고하면 됩니다. 아래 그림에서 95%신뢰수준, 자유도 100, 양측검정일 경우 임계값은 1.984 입니다.

(↓↓↓신뢰수준과 기각역에 대한 설명↓↓↓)

https://89douner.tistory.com/202

 

[통계학]4-1-1. 한 집단의 평균을 검정(test)할 때 (Feat. 일표본(단일표본) Z검정, 신뢰구간, 단측검정

안녕하세요. 이번 글에서는 한 집단의 평균을 검정(test)하는 두 가지 가설검정 방식중 하나인 일(1)표본(=단일표본) Z검정에 대해 알아보도록 하겠습니다. 일(1)표본(=단일표본) Z검정 (One-sample Z tes

89douner.tistory.com

 

 

  • t-value는 기각역에 포함하므로 대립가설을 채택합니다. → 즉, T검정 결과 "전국 대학교의 대학생 평균 키와 우리 대학교 대학생 평균 키는 (통계적으로) 다르다"고 할 수 있습니다.

 

 

 

(↓↓↓위의 예제 유튜브 링크↓↓↓)

https://www.youtube.com/watch?v=EzH5n31Com0&list=PLalb9l0_6WArHh18Plrn8uIGBUKalqsf-&index=5 

 

 

 

 

 

 

3. 일(1)표본 T검정 (One-sample T-test) 엑셀적용 예시

 

  • 아래 영상에서 Dummy sample을 두는 이유는 아래와 같습니다.
    • T검정의 귀무가설은 "표본평균=모평균" 설정한 상태이다.
    • 또한 모집단의 분산 (모분산)을 모른다고 가정한다.
    • 즉, 모집단에 대한 데이터들이 없어도 되기 때문에, 모집단에 대한 데이터가 없어도 된다. → 그래서 아래 영상에서 dummy column을 만든다.
    • 결과적으로, 표본데이터들만 있어도 T검정이 가능하다.

https://www.youtube.com/watch?v=v-ZcqrdTcIQ 

 

안녕하세요. 

이번 글에서는 한 집단의 평균을 검정(test)하는 두 가지 가설검정 방식중 하나인 일(1)표본(=단일표본) Z검정에 대해 알아보도록 하겠습니다.

  1. 일(1)표본(=단일표본) Z검정 (One-sample Z test)
  2. 일(1)표본 T검정(=단일표본) (One-sample T test) 

 

[가설검정의 종류]

  • '차이'와 관련된 검정
    1. '평균'의 차이를 검정 하고 싶을 때
      • 1-1. 비교하는 집단이 하나일 때 
        • 1-1-1. 모분산을 알고 있는 경우 & 표본이 클 때
          • 일(1)표본 Z 검정 (One-sample Z test) → ex) 귀무가설(\(H_{0}\)): 한국의 평균은 K이다.
        • 1-1-2. 모분산을 모르는 경우 & 표본이 작을 때
          • 일(1) 표본 T 검정 (One-sample T test) → ex) 귀무가설(\(H_{0}\)): 한국의 평균은 K이다.
      • 1-2. 비교하는 집단이 둘일 때
        • 1-2-1. 모분산을 알고 있는 경우 & 표본이 클 때
          • 이(2)표본 Z 검정 (Two-sample Z test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다.
        • 1-2-2. 모분산을 모르는 경우 & 표본이 작을 때
          • 1-2-2-1. 독립표본 T 검정 (Independent Sample T test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다.
          • 1-2-2-2. 대응표본 T 검정 (Paired Sample T test) → ex) 귀무가설(\(H_{0}\)): 남, 녀간의 평균에 차이가 없다 & 해당 차이를 반복해서 검증 (한 달간 간격을 두고 측정: 1개윌 뒤, 2개윌 뒤, 3개윌 뒤, ....)  
      • 1-3. 비교하는 집단이 셋 이상일 때
        • 1-3-1. ANOVA (분산분석)
          • 1-3-1-1. 일원 분산분석 (One-way ANOVA) → ex) 귀무가설(\(H_{0}\)): 한국, 미국, 독일의 평균에 차이가 없다
          • 1-3-1-2. 반복측정 분산분석 (Repeated Measures ANOVA) → ex) 귀무가설(\(H_{0}\)): 한국, 미국, 독일의 평균에 차이가 없다 & 해당 차이를 반복해서 검증 (한 달간 간격을 두고 측정: 1개윌 뒤, 2개윌 뒤, 3개윌 뒤, ....)  
          • 1-3-1-3. 이원 분산분석 (Two-way ANOVA) → ex) 
          • 1-3-1-4. 이원반복측정 분산분석 (Two-way Repeated Measures ANOVA) → ex)

 

 

 

1. 일(1)표본 Z검정 (One-sample Z test)

  • 일(1)표본 Z검정은 다음 아래와 같은 상황에서 진행되는 가설검정 방식입니다.
    • 한 집단의 평균을 검정(test)하고 싶은 경우
    • 해당 집단의 (모)평균과 (모)분산을 알고 있다고 가정할 경우
  • 일(1)표본 Z검정이라 불리는 이유는 모집단으로부터 추출한 하나의 표본과 표준화된 표준분포(→X축을 Z라고 표현)를 기준으로 가설검정을 하기 때문입니다 (자세한건 천천히 설명을 통해 알아보도록 하겠습니다)
  • 일(1)표본 Z검정이 어떤 철학을 기준으로 하고 있고, 어떤 순서로 검정이 이루어지는지 알아보겠습니다. 
    • Hint: 모평균 신뢰구간, 유의수준, 유의확률(p-value)

 

1-1. 양측검정 (Two-tailed test) 기준으로 설명

(↓↓↓중심극한정리 내용 참고↓↓↓)

https://89douner.tistory.com/198

 

[통계학]3.정규분포를 따른다는 의미 (Feat. 중심극한정리)

안녕하세요. 이번 글에서는 정규분포에 대해서 설명하도록 하겠습니다. 본래 정규분포는 연속확률분포이기 때문에 확률편에서 설명하는 것이 맞지만, 통계편에서 설명드리는 이유는 아래와 같

89douner.tistory.com

 

(↓↓↓신뢰도 관련 개념 설명 사이트↓↓↓)

https://www.youtube.com/watch?v=1WSTBVFeQ-4 

 

(↓↓↓양측검정 관련 예시 사이트↓↓↓)

https://www.youtube.com/watch?v=xBINhrCQB-g 

 

 

 

1-2. 단측검정 (One-tailed test) 예시

  • 단측검정도 양측검정과 같은 철학을 기반으로 합니다.
  • 다만, 표준화된 표본평균분포 기준으로 유의수준 5%가 오른쪽에 모두 할당되거나, 왼쪽에 모두 할당되는 것이 양측검정과의 차이라고 볼 수 있습니다.

[예시] K제과 회사는 자신들이 생산하는 젤리의 표본을 무수히 많이 추출한 결과 (표본크기≥30이상, 표본개수=多), (중심극한정리에 의해) 무게는 평균60g 이고 5g정도의 표준편차를 갖는 정규분포를 형성한다고 발표했습니다. 하지만, K회사의 경쟁회사인 S회사는 K회사에서 제시한 평균이 잘 못 됐다고 생각하여 허위과장이 아닌지 의심하고 있습니다. S회사는 어떻게 K회사가 제시한 평균을 어떻게 검정할 수 있을까요?

 

 

(↓↓↓일(1)표본 Z검정 (단측검정)예시↓↓↓)

https://www.youtube.com/watch?v=DxOct8A-BXU 

 

 

 

[Q. 언제 양측검정을 사용하고, 언제 단측검정을 사용하나요?]

두 집단의 평균이 같은지 다른지 검정할 때는 양측검정 한쪽이 다른쪽보다 큰지 아닌지 검정할 때는 단측검정

 

 

[생각해보기]

딥러닝을 이용한 행동인지 프로그램을 개발했다. 해당 프로그램은 치매환자의 행동패턴을 분석하고, 특정패턴이 발견되면 치매환자라고 분류한다. 이러한 특정패턴은 특정 수치값 이상이면 치매와 관련된 패턴이라고 인식되는데, 실제 치매환자들 기준으로 측정한 결과 치매환자로 분류하는 특정 수치 값은 평균50, 분산1 인 정규분포 범위를 갖는다고 한다. 이때, 다른 연구자들이 이 수치 값이 맞는지 100개의 sample을 추출해 Z검정을 실시하고, 해당 프로그램이 통계적으로 참인지 아닌지 구분할 수 있다. 

 

 

 

 

(↓↓↓일(1)표본 Z검정을 엑셀로 하는 방법 (단측검정, 양측검정 모두 포함)↓↓↓)

https://www.youtube.com/watch?v=LnaXcz2GoAo 

 

+ Recent posts