Excelによる統計解析講座

【仮説検定】カイ二乗検定とF検定をExcelで一瞬で解く!

【Excelによる統計解析講座 第11章】カイ二乗検定とF検定をExcelで一瞬で解く!

前ページ次ページ

第11章では、仮説検定の、カイ(\( \chi^{2}\))二乗検定F検定について解説していきます!

カイ二乗検定はABテストなどに、F検定は母分散の比の検定に用いる事が出来ます。

前章と流れは似ているので、頑張っていきましょう!

また、本章で用いるExcelファイルは以下からダウンロードして下さい!

ファイルをダウンロード

本連載講座【Excelによる統計解析講座】では、Excel未経験の方、自身の無い方でも順を追って学習でき、基礎からデータ分析に必要なスキルまでを身に付ける事が出来ます。

画像が多く、ビジュアルで理解しやすくなっておりますので、読み物が得意ではないという方も大丈夫です!

また、第7章からは、統計学の分野も扱う為、様々な方に役立つ講座となっております。

そのため、

  • Excelを仕事で使う可能性のある方
  • Excelに自信のない方
  • データ分析をExcelでやりたい方

等は是非、TechTeacherが運営する【Excelによる統計解析講座】を使って学習していって下さい!

〈目次〉

第1章:【テーブル】Excelのテーブル(フィルター)を解説!

第2章:【SUM,AVERAGEExcelの基本的な関数を解説!

第3章:【XLOOKUP,COUNTIF】データ分析の為のExcel関数を解説!

第4章:【棒,折れ線,散布図】Excelの基本的なグラフを解説!

第5章:【ピボットテーブル】Excelの便利機能ピボットテーブルを紹介!

第6章:【プレゼン資料】Excelグラフの体裁の整え方について解説!

第7章:【相関分析】相関係数と共分散をExcelを用いて解説!

第8章:【確率変数・正規分布】確率変数や正規分布をExcelで解説!

第9章:【t検定・z検定】母平均と母分散の仮説検定について解説!

第10章:【t検定・z検定】2つの集団の母平均・母比率の仮説検定を解説!

第11章:【仮説検定】カイ二乗検定とF検定をExcelで一瞬で解く!

第12章:【一元配置・二元配置】分散分析についてExcelを用いて解説!

第13章:【回帰分析】Excelを使って単回帰分析と重回帰分析を解説!

カイ二乗分布

カイ二乗分布とは

\( Z_{1},\cdots,Z_{n} \)を、互いに独立で標準正規分布に従う確率変数とします。

この時、\( Z_{1},\cdots,Z_{n} \)の二乗和、つまり、\( Z^{2}_{1},\cdots,Z^{2}_{n} \)の従う確率分布を自由度nのカイ二乗分布(\( \chi^{2} \)分布)といいます。

この定義が分からなくても、「ABテストなどの際にはカイ二乗分布(\( \chi^{2} \)分布)を使う」と覚えていただければOKです!

前述した様に、カイ二乗分布(\( \chi^{2} \)分布)はABテスト(本当に有意な差であるかの検定)に用いる事が出来ます

これは、非常に使い勝手の良い検定です。

カイ二乗分布(\( \chi^{2} \)分布)の概形は以下の様になります。

ただし、fは自由度です。

標準正規分布とt分布及びカイ二乗分布

カイ二乗分布のExcel関数

では、カイ二乗検定に用いるための、Excel関数について解説していきます。

まず、カイ二乗分布の確率密度関数値は以下の関数で計算できます。

=CHISQ.DIST(x,自由度,FALSE)

次に、カイ二乗分布の左側確率点は以下の関数で計算できます。

=CHISQ.INV(左側確率,自由度)

続いて、カイ二乗分布の右側確率点は以下の関数で計算できます。

=CHISQ.INV.RT(右側確率,自由度)

これらの指す内容が分からない方は、第9章の【t検定・z検定】母平均と母分散の仮説検定について解説!内の「Excel関数によるt分布の値の算出方法」をご覧ください!

ここで、今回はカイ二乗検定の方法のみを解説していくため、実際に使うのは以下の関数だけです。

=CHISQ.TEST(実測値範囲,期待値範囲)

この関数では、カイ二乗検定を行った際のp値を求める事が出来て、このp値が有意水準を超えたら、有意差はないと判断できます。

このCHISQ.TESTに関しては、この後の例題で詳しく解説します。

F分布

F分布とは

\( X_{1},\cdots, X_{n} \)、\( Y_{1},\cdots, Y_{n} \)を互いに独立で、各々が自由度m、nのカイ二乗分布(\( \chi^{2} \)分布)に従う確率変数とします。

この時、

\[ \frac{\frac{X}{m}}{\frac{Y}{n}} \]

の従う確率分布を自由度(m,n)のF分布と言います。

カイ二乗分布と同様に、「母分散の比の検定にはF分布を使う」と覚えていただければOKです!

この母分散の比の検定は、2つの母分散が等しいかどうかの検定です。

つまり、対応のない母平均の検定における、母標準偏差[母分散]が等しいかの判断に用いる事が出来ます。

F分布の概形は以下の様になります。

標準正規分布、t分布、カイ二乗分布及びF分布

F検定のExcel関数

では、F検定に用いるための、Excel関数について解説していきます。

まず、F分布の確率密度関数値は以下の関数で計算できます。

=F.DIST(x,自由度1,自由度2,FALSE)

次に、F分布の左側確率点は以下の関数で計算できます。

=F.INV(左側確率,自由度1,自由度2)

続いて、F分布の右側確率点は以下の関数で計算できます。

=F.INV.RT(右側確率,自由度1,自由度2)

これらの指す内容が分からない方は、第9章の【t検定・z検定】母平均と母分散の仮説検定について解説!内の「Excel関数によるt分布の値の算出方法」をご覧ください!

ここで、カイ二乗検定と同様に、今回はFの方法のみを解説していくため、実際に使うのは以下の関数だけです。

=F.TEST(配列1,配列2)

この関数では、F検定を行った際のp値を求める事が出来て、このp値が有意水準を超えたら、母分散は等しい(=等分散である)と判断できます。

このF.TESTに関しては、この後の例題で詳しく解説します。

カイ二乗検定

では、早速、カイ二乗検定をやっていきましょう!

例題1(カイ二乗検定)

R社では、デジタル広告の文章に絵文字を付けるかどうかについて、検討されています。そこで、絵文字ありの広告と絵文字なしの広告をランダムに表示して、それぞれのクリック率を調べる事にしました。その結果は、Excelファイル1ページ目の様になりました。クリック割合から、”絵文字あり”の方が良い様に見えます。
この時、有意水準5%でこの差が有意であるかを検定してみましょう。

まず、各値から、全体のクリック割合を計算します。

クリック割合算出の様子

次に、「絵文字あり」でも、「絵文字なし」でも、全体のクリック割合に等しかった場合の期待値を計算します。

期待値の算出の様子

最後に、実測値と期待値を選択して、CHISQ.TEST関数でカイ二乗検定を行います。

CHISQ.TEST関数の使用例

この結果から、カイ二乗検定のp値は約0.48であり、これは有意水準5%より大きいため、この差は有意ではないと判断できます。

F検定

続いて、F検定の例題もやってみましょう!

例題2(F検定)

C病院は、効果の高い解熱剤を求めて、A社とB社の解熱剤を比較しています。Excelファイル2ページ目のA社とB社の解熱剤の効果試験の結果から、2つの母分散が等しいかについて有意水準1%で仮説検定してみましょう。

F検定は、F.TESTを使ってしまえば、以下の様に非常に簡単です。

F.TEST関数の使用例

この結果から、F検定におけるp値が有意水準の0.05を超えている為、この2つの母分散は等しい(=等分散)とみなせます。

ちなみに、今回の問題は、第10章の対応のない場合の母平均の差の検定の問題です。

せっかく母分散[母標準偏差]が同じであると分かったので、これを使って母平均の検定を簡単に行ってみましょう!

例題2-1(対応のない場合の母平均の差の検定)

C病院は、効果の高い解熱剤を求めて、A社とB社の解熱剤を比較しています。Excelファイル1ページ目のA社とB社の解熱剤の効果試験の結果から、A社とB社の解熱剤の効果に違いがあるかについて有意水準1%で、母標準偏差が等しい場合と等しくない場合両方について仮説検定してみましょう。
ただし、母集団正規性は不明とします。

ここで、T.TEST関数を紹介します。

この関数の引数は以下の様になります。

=T.TEST(配列1,配列2,検定の指定,検定の種類)

まず、検定の指定に関して、以下の様に割り振られています。

引数 検定の指定
1 片側検定
2 両側検定

次に、検定の種類に関しては、以下の様に割り振られています。

引数 検定の種類
1 対応がある場合の母平均の差の検定
2 対応のない場合の母平均の差の検定(等分散)
3 対応のない場合の母平均の差の検定(異分散)

これを使って、例題2-1について、t検定を行っていきます。

まず、「A社とB社の解熱剤の効果に違いがあるか」なので、帰無仮説と対立仮説は

帰無仮説:A社とB社の解熱剤の効果に違いはない

対立仮説:A社とB社の解熱剤の効果には違いがある

となり、今回行う検定は両側検定です。

また、F検定の結果から、対応のない場合の母平均の差の検定(等分散)である事が分かります。

よって、t検定の結果は以下の様になります。

T.TEST関数の使用例

これより、t検定のp値が有意水準の0.05を超えていないので、この帰無仮説は棄却出来て、A社とB社の解熱剤の効果には違いがあると判断できます。

仮説検定方法まとめ

最後に、第8章から本第10章までの仮説検定の簡単なまとめとして、各種検定とその検定方法についてまとめておきます。

実際に検定を行う際に是非参考にしてください!

検定 検定方法
母平均の検定(1つの母平均と比較値が異なるかについての検定) z検定 or t検定
母平均の検定(2つの母平均が異なるかについての検定) (z検定) or t検定
母比率の検定(1つの母割合と比較値が異なるかについての検定) z検定
母比率の検定(2つの母割合が異なるかについての検定) z検定
母分散の比の検定(2つの母分散が異なるかについての検定) F検定
本当に有意な差であるかの検定 カイ二乗検定

まとめ

今回のExcelによる統計解析講座第10章では、カイ(\( \chi^{2}\))二乗検定F検定について解説しました!

正規性の検定(カイ二乗検定)母分散の比の検定(F検定)は、非常に重要な検定で、

特にz検定は、t検定と並んで、頻出する検定ですので、理解しておきましょう!

次章では、複数のデータについて分析する、分散分析について解説していきます。

非常に実用的な分野なので、是非読んでいってください!

【Excelによる統計解析講座 第12章】分散分析についてExcelを用いて解説!
【一元配置・二元配置】分散分析についてExcelを用いて解説! 前ページ|次ページ 第12章では、分散分析について解説していきます! 第9章及び第10章で、2つまでの母集団の母平均...