対応のないt検定：2つの母平均に差があるかを検定

↑勉強中のテキスト。第4章「どちらの商品がウケていますか？ - t検定（対応なし）」

ワクワクバーガーとモグモグバーガーの味を評価した結果を以下に示す。

f:id:yuinomi:20200904165734p:plain

標本平均の差は81.88-76.88=5.0で、モグモグバーガーの方が5点高い結果となった。

この5点の差に意味があるのか、それともデータのばらつきの範囲内であり5点の差に意味はないのか、どちらの考えが正しいのかをt検定で確認する。

今回の例ではワクワクバーガーとモグモグバーガーの味の評価を別々の人が行ったので、対応のないt検定を用いる。対応のないとは、独立した別個の母集団であることを意味する。

母集団Aから抽出した標本平均Aと、母集団Bから抽出した標本平均Bの差の分布は、正規分布に従うので、母平均の信頼区間を求める式をそのまま使うことができる。

平均の差の信頼区間は以下の式で計算する。

平均の差の信頼区間＝（標本平均A-標本平均B）±t x 差の標準誤差

また、差の標準誤差については以下の式で計算する。

差の標準誤差＝ $\sqrt{ \dfrac{不偏分散A}{サンプルサイズA} + \dfrac{不偏分散B}{サンプルサイズB} }$

注）テキストでは、ここからさらに式を発展させて推定母分散を用いているが、本ページでは推定母分散は使わずに以降も上記の式で計算を行っていく。

自由度は（8-1）+（8-1）=14である。

t分布表より自由度14のときの有意水準5%(α=0.05)は、表からクロスするところを読み取ってt=2.145となる。

f:id:yuinomi:20200904133400p:plain

ここまでわかったので、平均の差の信頼区間を計算する。結果を以下に示す。

「差の標準誤差」の計算で、標本分散ではなく、不偏分散をサンプルサイズで割ることに注意したい。セルに入力した計算式をオレンジ色の文字にしている。

f:id:yuinomi:20200904172730p:plain

差の信頼区間はt=2.145を用いて、-13.33から3.33の範囲ということがわかった。

つまり、この範囲内に母集団の平均の差が含まれる確率は95%だということだ。

2つ店の味の評価に差があるかを検定する。

帰無仮説は、「ワクワクバーガーとモグモグバーガーの味の評価に差はない」となる。

tは以下の計算式で求める。

t = 標本平均の差 ÷ 標本平均の差の標準誤差

f:id:yuinomi:20200904173908p:plain

赤枠で示したところの数値を使って計算すると、

t=-5.00 ÷ 3.88=-1.29となる。

あとはこの「-1.29」をt分布表と見比べて、統計的に差があるといえるかどうかを確認すれば良い。自由度は今回の場合、2つの店のサンプルサイズが8だったので、

(8-1)+(8-1)=14である。

f:id:yuinomi:20200904133400p:plain

t分布表から、自由度14と有意水準5%(α0.05)がクロスするところを読むと、

2.145となる。これは次のことを意味している。

自由度14のとき、tが2.145よりも大きい、または-2.145よりも小さいことが起こる確率は5%未満である。

上の計算例では、標本平均の差の計算をワクワクバーガー - モグモグバーガーで行ったが、これを逆にして計算すると、t=1.29と符号が反転するためt分布表から読み取った値と比較するときは、-2.145から+2.145の範囲より外にあるか、内にあるか、で考えるようにするとミスをなくせる。

さて、いよいよ今回の結果だが、計算したt=-1.29は5%有意水準（-2.145〜+2.145の範囲内にあり）での棄却域に入らない。よって、帰無仮説は棄却できず、「ワクワクバーガーとモグモグバーガーの味の評価に差はない」と結論付けられる。

Instant Engineering