Data Science|Learning

【t検定】t分布を用いた母平均の検定|概要・やり方を分かりやすく解説

前のページ|次のページ

連載講座「0から学ぶ確率統計」では、中学数学の基本的な内容から大学レベルの確率統計を解説しています。

統計やデータサイエンスに興味がある方はぜひご覧ください。

第14章では、「t検定」について解説します。

仮説検定の具体的な例題を解いていきましょう。

初学者も理解しやすいように丁寧に解説しているので、ぜひ最後までご覧ください。

必要な知識は「区間推定」「仮説検定」で解説しているので、まだ学習していない方は先にそちらの記事をご覧ください。

本連載講座「0から始める確率・統計講座」では、中学・高校レベルの数学から大学レベルの「確率・統計」を解説しています。

確率・統計を始めて学ぶ方が理解できるよう、丁寧に解説しています。

この講座の内容は統計検定2級レベルの知識を習得すること」を目標としています。

・中学、高校の数学の内容を覚えてないけど
「確率・統計」を学習したい

・統計検定の対策をしたい

このような考えを持っている方は、Tech Teacherが運営する「0から始める確率・統計講座」を用いて、「確率・統計」の学習をすすめましょう。

<目次>
1章:平均・分散などの基本統計量
2章:相関関係
3章:確率の基本
4章:条件付き確率・ベイズの定理
5章:期待値
6章:代表的な確率分布
7章:母集団と標本
8章:標本平均・不偏分散
9章:中心極限定理
10章:母平均の推定(分散既知)
11章:母平均の推定(分散未知)
12章:仮説検定
13章:正規分布を用いた検定
14章:【t検定】母平均を検定
15章:【F検定】分散に差があるか?
16章:ウェルチの検定
17章:カイ2乗検定
18章:分散分析
19章:回帰分析

母分散が未知の場合の区間推定

まず、母分散が未知の場合の区間推定について復習しましょう。

詳しくは以下の記事で解説しているため、不安がある方は合わせてご覧ください。

【t分布】母平均の区間推定|分散が未知の場合を解説前のページ|次のページ 連載講座「0から学ぶ確率統計」では、中学数学の基本的な内容から大学レベルの確率統計を解説しています...

母平均の区間推定(母平均が未知の場合)

母平均がu、母分散が未知である正規母集団に対する信頼度mの信頼区間は

$$
\bar{X} – k\times \frac{U}{\sqrt{n}} \leq u \leq \bar{X} +  k\times \frac{U}{\sqrt{n}}
$$

で得られる。

kは自由度「n-1」t分布の両側100(1-m)%点である。

仮説検定

次に「仮説検定の手順」を復習しましょう。

以下の記事では、「仮説検定とは何か」から「仮設検定を理解する上で必要な用語」「仮説検定の手順」を解説しています。

仮説検定の理解に不安がある方はぜひご覧ください。

仮説検定とは|帰無仮説や対立仮説から検定の方法を分かりやすく解説前のページ|次のページ 連載講座「0から学ぶ確率統計」では、中学数学の基本的な内容から大学レベルの確率統計を解説しています...

仮説検定は、「母集団についての仮説を標本に基づいて検証すること」です。

例えば、「このコインは歪んでおらず、表と裏の出る確率が等しいか?」を標本データと確率の計算に基づいて検証します。

仮説検定は以下の手順で進めます。

仮説検定の手順

  1. 帰無仮説\(H_0\)、対立仮説\(H_1\)を設定する
  2. 帰無仮説\(H_0\)を真として、統計量の分布を求める
  3. 有意水準を決める
  4. 有意水準と統計量の分布から、棄却域を設定する
  5. 標本から得られた結果が確率的に起こり得るなら帰無仮説\(H_0\)を受容・対立仮説\(H_1\)を棄却
  6. 標本から得られた結果が確率的に起こり得ないなら、帰無仮説\(H_0\)を棄却・対立仮説\(H_1\)を採択

「帰無仮説を真とする」気持ちは

帰無仮説は間違っていると思うけど、その仮説を一旦認めて計算してみるね

→(帰無仮説を棄却し)、やっぱり対立仮説が正しかったね

という展開を狙っています。

正規分布を用いた母平均の検定

では実際に、母平均の検定をやってみましょう。

問題

ある溶液に含まれる物質の濃度 (%) を測定して次のデータを得た。

12.6 13.4 14.1 12.4 11.2 12.5 10.9 11.8 11.6 13.1

真の濃度の平均を「u」として,

$$ u = 12 $$

であるか、検定をしてください。

なお、有意水準「\(\alpha\)」は

$$ \alpha = 0.05 $$

とします。

引用:Lecture 9 母平均の検定 (一部修正)

「仮説検定の手順」に従って、進めていきます。

①:帰無仮説\(H_0\)、対立仮説\(H_1\)を設定する

問題文で「u = 12」であるか、検定するように求められているので、

  • 帰無仮説\(H_0\):u = 12
  • 対立仮説\(H_1\):u ≠ 12

と設定します。

帰無仮説と対立仮説の設定から、今回は「両側検定」を行います。

両側検定のイメージ図

帰無仮説\(H_0\)を真として、統計量の分布を求める

帰無仮説を真とするため、

$$ u = 12 $$

の元で進めていきます。

まず、標本平均\(\bar{x}\)を求めましょう。

$$ \bar{x} = \frac{12.6 + 13.4 + \dots + 13.1}{10} =  12.36 $$

母分散が未知なので、代わりに利用する不偏分散\(U^{\scriptsize 2}\)を求めます。

$$
\begin{align*}
U^2 &= \frac{1}{9}\left\{(12.6 – 12.36)^2 + \dots + (13.1 – 12.36)^2\right\}\\
&= 1.0116\\
&= 1.006^2
\end{align*}
$$

③:有意水準を決める

今回は問題文で、有意水準αが

$$ \alpha = 0.05 $$

と定められています。

実際の業務や研究で行う場合は、データ数や状況に応じて適切に設定しましょう。

④:有意水準と統計量の分布から、棄却域を設定する

今回は両側5%検定を行うため、上側2.5%点と下側2.5%を求めます。

母分散が未知であるため、t分布を用いて推定できますね。

標本のデータ数が「10」なので、自由度「9」t分布を利用します。

計算サイトやt分布表を用いると

$$ k = 2.262 $$

と分かります。

t検定の棄却域

よって、棄却域

 

$$
u \leq  12 \, – 2.262 \times \frac{1.006}{\sqrt{10}} \quad   12 +  2.262 \times \frac{1.006}{\sqrt{10}} \leq u
$$

計算すると

$$ u \leq  11.28 \quad  12.72 \leq u $$

となります。

$$
\bar{X} – k\times \frac{U}{\sqrt{n}} \leq u \leq \bar{X} +  k\times \frac{U}{\sqrt{n}}
$$

⑤:標本から得られた結果が確率的に起こり得るなら帰無仮説\(H_0\)を受容・対立仮説\(H_1\)を棄却

⑥:標本から得られた結果が確率的に起こり得ないなら、帰無仮説\(H_0\)を棄却・対立仮説\(H_1\)を採択

標本データより、「濃度の平均」の実現値\(\bar{x}\)は「12.36」でした。

t検定の棄却域

これが、棄却域

$$ u \leq  11.28 \quad    12.72 \leq u$$

にあるため、「標本から得られた結果が確率的に起こり得る」と解釈できます。

したがって、帰無仮説\(H_0\)を受容・対立仮説\(H_1\)を棄却します。

すなわち、「u ≠ 12」とは言えないという結論が得られました。

【F検定】母分散は等しい?|F検定の概要・やり方を分かりやすく解説前のページ|次のページ 連載講座「0から学ぶ確率統計」では、中学数学の基本的な内容から大学レベルの確率統計を解説しています...