Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするブログ/QC統計手法/公差設計・解析/TPS(トヨタ生産方式)

分散分析(2要因)エクセル解析:新教材による算数の教育効果

 

統計学がわかる ファーストブック

統計学がわかる ファーストブック

 

↑勉強中のテキスト。第7章「新メニューで差をつけろ - 分散分析(2要因)」

p163 確認テスト

 

◆問題

ある小学校で、算数の分数の計算を教えるためのマンガを使った新しい教材を開発した。この教材の効果は従来のものと比べ、効果があるようだということはわかっているが、さらにその効果が子どもの算数に対する好みによってどう違うのかを調べたい。

この効果を調べるために、あるクラスでは従来の教材で教え(統制群)、別のクラスではマンガ教材で教えた(マンガ群)。一日おいて分数の計算テストをした。

 

このとき、各クラスで算数が好きか嫌いかというアンケートをあらかじめ取っておき、算数が好きな子ども10人と嫌いな子ども10人とで比較することにした。

テストの点数データ(10点満点)は以下のようになった。これを分散分析したい。 

f:id:yuinomi:20200912113111p:plain

1.この検定での帰無仮説、対立仮説をいいなさい

2.4つの条件におけるそれぞれの平均と標準偏差を計算しなさい(小数点第3位を四捨五入)

3.4つの条件の平均を1つのグラフに描き、それを見て交互作用がありそうかどうかについて予想しなさい。

4.分散分析表を作りなさい(小数点第3位を四捨五入)

5.有意水準を1%としたとき、この分散分析表から言えることを書きなさい

 

◆回答

帰無仮説:「統制群とマンガ群(要因1)の間に平均点の差がなく、算数の好きな群と嫌いな群(要因2)の間にも平均点の差がなく、交互作用にも平均点の差がない」

対立仮説:「統制群とマンガ群(要因1)の間か、算数の好きな群と嫌いな群(要因2)の間か、交互作用にか、少なくともいずれか1つの組み合わせに平均点の差がある」

 

4つの組み合わせにおける標本平均と標準偏差はそれぞれ便利なエクセル関数AVERAGEとSTDEV.Pで一発で計算できる。

 

4つの組み合わせの標本平均を散布図にプロットしたグラフを以下に示す。

(*余談だが、エクセルはOneDrive無料版をMacで使っているのでグラフを描くのに四苦八苦した。まず「系列の追加」の方法が分からなかった。行列入れ替えボタンでなんとか突破できたけど、それに辿りつくまでにかなり時間がかかった。)

f:id:yuinomi:20200914055703p:plain

 

系列は2つで算数が好きと算数が嫌いに分けた。横軸が要因1で「1」が統制群、「2」がマンガ群となる。ここでは1や2といった数字は量的変数を意味するのではなく、ただの便宜上のラベルである。

グラフを見ると、算数の好き嫌いに関わらずマンガ教材で学習をするとテストの点数が伸びていることがわかるが、その伸び率が算数が嫌いな子どもほど大きい。(=算数がもともと好きな子どもはマンガ教材を使っても伸びが小さい)

よって、マンガ教材の教育効果は算数が嫌いな子どもほど有効に作用する可能性が示唆され、交互作用がありそうということがわかる。

 

次は分散分析表をつくっていく。だが、ダイレクトに分散分析表を完成させることはできないので、まずは4つの組み合わせの要因1・要因2ごとに標本平均と標本分散を計算する。結果を以下に示す。

f:id:yuinomi:20200914061619p:plain

表の右側の5列分が追加で計算を行った部分になる。細かなフローは省略するが、それぞれをどのように計算するか分からない場合は、以下の記事を参照いただきたい。

instant.engineer

 

2要因の分散分析では全体のずれは以下の式で求める。

全体のずれ=要因1によるずれ+要因2によるずれ+交互作用によるずれ+残りのずれ(残差)

 

要因1によるずれ

=(要因1の水準1-全体の平均)2xサンプルサイズ+(要因1の水準2-全体の平均)2xサンプルサイズ

=(6.35-7.33)2x20+(8.30-7.33)2x20

=38.03

 

要因2によるずれも同様に計算し、34.23となる。

また、交互作用によるずれは以下の式で求める。

 

交互作用のずれ=各群の平均のずれの総和ー要因1によるずれー要因2によるずれ

 

ここでいう各群の平均のずれとは、例えば統制群の算数が好きな子どもの群の平均(7.80)と全体の平均との差の2乗であり、これら4つの組み合わせの総和である。

計算した結果を以下に示した。

f:id:yuinomi:20200914061758p:plain

オレンジ色の文字はセルに入力した計算式だ。

交互作用によるずれは、各群のずれの総和(D23セル)ー要因1によるずれー要因2によるずれ=83.28-38.03-34.23=11.02となる。

 

残りのずれ(残差)は、4つの組み合わせの平方和の総和である。平方和は標本分散xサンプルサイズで求める。 

ずれの計算を一通り終えたので分散分析表を埋めていく。

f:id:yuinomi:20200914061946p:plain

 

一気にF値まで完成したが、簡単にそれぞれの計算だけ記載しておく。

平方和は事前に計算したずれのことだ。要因1、2、交互作用はそれぞれのずれとして分散分析表に着手する前に計算した通りだ。

残りのずれ(残差)は、エクセル表のC~F列の4つの組み合わせの平方和を足し合わせたものだ。平方和は、標本分散xサンプルサイズで計算しているが、手順は多少面倒だが分散の基本的な計算でもまったく問題ない。(各群の平均と個別の各サンプルの差の2乗を合計した値=分散)

全体のずれはそれ以外の4つをただ足しただけだ。

 

自由度については、要因1は水準数が統制群とマンガ群の2つなので、2-1=1。

要因2も水準数が算数が好きと嫌いの2つなので、2-1=1。

交互作用は要因1の自由度x要因2の自由度なので、1x1=1

全体の自由度は、全サンプル数-1=40-1=39

よって、残った「残差の自由度」は、全体の自由度ー要因1、要因2、交互作用の自由度で36となる。

 

平均平方は平方和÷自由度となる。今回の例題では、要因1、2、交互作用の自由度が「1」なので、割り算をする意味がなく、平方和と同じ数字がそのままスライドで平均平方にも代入されている。

最後のF値は、それぞれ有意かどうかを検定したい因子が、残差に対してどれだけの大きさかを見るものなので、個別の平均平方÷残差の平均平方となる。

 

分散分析表が完成し、それぞれF値は次のようになった。

要因1  30.09

要因2  27.08

交互作用 8.72

 

F分布表から、これらのF値はどのくらいの確率で起こるのかを確認し、果たして有意な差があるといえるのかを検定する。

 

f:id:yuinomi:20200912102501p:plain

 

まずは要因1の主効果について検定する。

要因1のF値は「要因1の平均平方」÷「残差の平均平方」で計算したので、自由度は分子が要因1の1、分母は残差の36となる。

問題文は有意水準1%で検定を求められているので、表の赤字を見る。(黒字は有意水準5%)

よって、横軸1、縦軸36がクロスするところを読み取ると、F値は7.40である。

 

要因1のF値 30.09>7.40であり、棄却域に入り帰無仮説は棄却される。(=有意差が”ある”)

さらに、要因2と交互作用についても同様に検定し、両方とも>7.40であるので棄却域に入り、帰無仮説は棄却される。

 

よって、要因1(教材)の主効果、要因2の主効果(算数の好き嫌い)、交互作用において有意な差が認められた。

さらに詳しく言うと、

要因1の主効果・・・マンガ教材で教える方が分数テストの点数が上がる

要因2の主効果・・・算数が好きな子どもの方が分数テストの点数が高い

交互作用・・・算数が嫌いな子どもの方が、算数が好きな子どもよりも、マンガ教材で学習した時のテストの点数の上がり方が大きい

ということである。

 

統計学がわかる ファーストブック

統計学がわかる ファーストブック