Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするブログ/QC統計手法/公差設計・解析/TPS(トヨタ生産方式)

カイ2乗検定:期待度数の観測度数の計算方法がポイント

 

統計学がわかる ファーストブック

統計学がわかる ファーストブック

 

↑勉強中のテキスト。第3章「ライバル店と売り上げを比較 - カイ2乗検定」

 

検定で調査する内容:

モグモグバーガーに比べて、ワクワクバーガーのチキンの売り上げは少ないのか?

表:ワクワクバーガーとモグモグバーガー ポテトとチキンの売り上げ個数

f:id:yuinomi:20200904143056p:plain

 

帰無仮説として売り上げの割合に差はないという仮説を立てる。

両方の店でポテトとチキンがまったく同じ割合で売れるとした場合の個数を計算する。

 

同じ割合で売れるとしたときの売り上げ個数(=期待度数)

f:id:yuinomi:20200904144049p:plain

実際の売り上げ個数(=観測度数)

f:id:yuinomi:20200904144044p:plain

これら期待度数と観測度数を見比べて、売り上げの割合に差があるかどうかを検定していく。

 

カイ2乗値を計算する

カイ2乗値は以下の式で計算する。

 

カイ2乗値=( \dfrac{(観測度数-期待度数)^2}{ 期待度数 } )   の総和

 

オレンジ色の文字でセルに入力した計算式を示した。

f:id:yuinomi:20200904145410p:plain

よって、カイ2乗値は0.54+0.80+1.25+1.88 = 4.46になる。

この4.46という数値が統計学上、有意な差があるといえるかを検定にて確認する。

カイ2乗分布は、横軸にカイ2乗値を取り、縦軸に確率密度を取る。

 

f:id:yuinomi:20200904145714p:plain

(Wikipedia)

カイ2乗分布は、自由度kによって分布が異なる。

自由度は、行と列がある二次元の表の場合の以下のようにして計算する。

自由度=(行の数-1)x(列の数-1)

今回の例では、お店の種類2つ、商品の種類2つなので

自由度=(2-1)x(2-1)=1 となる。

 

カイ2乗値が観測度数と期待度数から計算し4.46。自由度は1。

あとはカイ2乗分布表と見比べて有意な差があるといえるかどうか検定する。

 

f:id:yuinomi:20200904150744p:plain

http://www3.u-toyama.ac.jp/kkarato/2016/statistics/handout/chisqdist.pdf

 

カイ2乗分布表は統計学テキストの巻末には大体載っているし、ネット検索すれば出てくる。検証したいものの自由度と上側有意確率がクロスするところのカイ2乗値を読み取る。

例えば自由度1、確率0.05(5%)の時にカイ2乗値は上の分布表から3.84となるが、これは検定したい内容のカイ2乗値が3.84より小さくなる確率が95%で、3.84より大きくなる確率が5%という意味だ。

f:id:yuinomi:20200904152037p:plain

今回検定したいワクワクバーガーとモグモグバーガーの売り上げの割合の差についてのカイ2乗値は4.46であり、有意水準5%の3.84より大きい。

つまり、カイ2乗値4.46が起こるのは5%より小さい確率であるということで、

「めったに起こらないこと」といえる。

よって帰無仮説は棄却され、対立仮説が採択される。

 

帰無仮説は、「ワクワクバーガーとモグモグバーガーの間で、ポテトとチキンの売り上げの割合に差はない」であり、これが棄却され対立仮説が採択されるということは、

「ワクワクバーガーとモグモグバーガーの間で、ポテトとチキンの売り上げの割合に差がある」ということが検定の結果、わかった。

 

統計学がわかる ファーストブック

統計学がわかる ファーストブック