繰返しのない二元配置実験
[例2.3:監視用カメラの放熱効率に関する繰返しのない二元配置実験]
V社では、監視用カメラを製造している。小型化にともない、カメラ内部の空隙が減少し、内部の温度上昇が問題となった。そこで電源回路の一部を変更し、温度上昇が抑えられる条件を見出すことにした。
因子Aとして回路上のある抵抗を取り上げ、A1=33Ω、A2=66Ω、A3=99Ω、A1=132Ωを水準とした。また因子Bは、やはり回路上の整流ブリッジダイオードでB1、B2、B3社製の3水準を取った。
これまでの実験から、今回取り上げた因子間には交互作用がないことがわかっているので、繰返しのない二元配置で実験を行った。
特性値は従来機種を基準とした温度上昇値(単位:℃)で、値は低い方が良い。これを解析せよ。
*これから繰返しのない二元配置実験の解析をしていく。手順としては、繰返しがある場合とない場合で考え方の異なる部分を比較しながら、まずはエクセルで分散分析と推定まで行う。その後、スタットワークスにデータを入力し解析ソフトの扱い方と両者の結果が同じになることを確認する。
「繰返しのない」とは?
各水準組み合わせで1回だけ実験を行う二元配置法を、繰返しがない場合の二元配置法という。要因AとBの交互作用の有無を見極めるためには、必ず繰返しが入れる必要がある。
繰返しがないと、交互作用と誤差が交絡するので交互作用を検出することができない。
したがって、繰返しのない二元配置法は、過去の情報や固有技術的な知見による、あらかじめ交互作用がないことがわかっている場合に用いることができる。
繰返しのない二元配置実験をエクセルを使ってデータプロットをする
まずは実験データを散布図グラフにプロットする。因子A:4水準x因子B:3水準=12通りの組み合わせのデータを「因子A」「因子B」「交互作用」の3種類のグラフを作成する。
プロット[A]・・・Aの水準を横軸に取り、生データと各A水準の平均値をプロット。因子Aの主効果を有無を把握するために活用する。平均値を結んだ線が平行であれば因子Aの主効果がないとみなす。
今回の例では、因子Aの水準効果はありそうである。
プロット[B]・・・Bの水準を横軸に取り、生データと各B水準の平均値をプロット。因子Bの主効果を有無を把握するために活用する。平均値を結んだ線が平行であれば因子Bの主効果がないとみなす。
今回の例では、B2水準の温度上昇値が若干高いが、実験誤差の範囲と予測され水準効果はなさそうである。
プロット[AxB]・・・因子Aの水準を横軸に取り、因子Bの各水準ごとに実験繰返しの平均値をプロット。交互作用(因子Aと因子Bの組み合わせによる効果)の有無をこの平均値を結んだそれぞれの線が平行か否かで判断する。実験は誤差と伴うので厳密に平行になることはないが、近い折れ線を示すかで判断する。
今回の例では、因子B各水準のグラフが平行に近く、交互作用はなさそうである。
(プロット[BxA]は[AxB]を逆にしただけで活用方法は同じなので省略する)
さて、データプロットから因子Aについては主効果がありそうだが、因子Bと交互作用については効果がなさそうとわかった。また、交互作用がなさそうということから、従来の知見にもとづいて繰返しのない二元配置で実験を計画したことも問題なさそうである。
分散分析をして、F分布表から有意かどうかを検定する。
エクセルを使って分散分析をする
繰返しのない二元配置実験の分散分析表
繰返しのない二元配置実験では、全データのばらつきを因子Aの平方和、因子Bの平方和、誤差平方和の3つに分解する。数式で示すと以下の通り。
ST = SA + SB + Se
繰返しのない場合の二元配置実験では、誤差平方和を交互作用効果として計算している。
では、エクセルを使ってまずは平方和から計算していく。
因子A,Bごとに分けて標本平均を計算した。A1の標本平均とは、A1B1,A1B2,A1B3の3つのデータの平均値を意味する。
因子Aによる効果は以下の赤枠の数値を使って計算する。
因子Aによる効果
=(A1水準の平均-全体平均)2xサンプルサイズ + ・・・
=(3.63-5.92)2x3 + (5.17-5.92)2x3 + (7.00-5.92)2x3 + (7.87-5.92)2x3
=15.64+1.69+3.52+11.41
=32.26
因子Bによる効果は以下の赤枠の数値を使って同様に計算する。
因子Bによる効果(計算は省略)
=0.72
次に誤差平方和Seの計算をする。繰返しのない二元配置実験の誤差平方和は、繰返しのある二元配置実験の交互作用SAxBと同じであるので、
各群の平均の効果-因子Aによる効果-因子Bによる効果 で計算できる。
「各群の平均の効果」とは、因子A:4水準x因子B:3水準=12通りの組み合わせの各データ-全体平均の2乗の総和である。
実験データは上記の表であるので、具体的な計算は
(A1B1の平均-全体平均)2+(A1B2の平均-全体平均)2+・・・(A4B3の平均-全体平均)2
となる。なお、各水準組み合わせの平均といっても、繰返しがなくn=1データであるので実際には平均値ではなくそのまま実験生データである。
計算すると、各群の平均の効果は35.04となる。
よって、誤差平方和Seは
各群の平均の効果-因子Aによる効果-因子Bによる効果
=35.04 - 32.36 - 0.72=2.06となる。
これで平方和はすべて計算完了だ。
次に自由度について求める。
因子Aの自由度=因子Aの水準数-1=4-1=3
因子Bの自由度=因子Bの水準数-1=3-1=2
誤差の自由度=因子Aの自由度x因子Bの自由度=3x2=6
全体の自由度=全データ数-1=12-1=11
自由度についてもすべて計算できたので、ここまでを分散分析表に反映させる。
分散は、各要因ごとに平方和÷自由度で計算する。
分散比については、各要因の分散÷誤差分散で計算する。
計算の結果、分散分析表は以下のようになる。
これで分散分析表は完成だ。あとは、ここで得られた要因AとBの分散比(F値)をF分布表と比較し、どの程度の確率で起きることなのか(=すなわち有意であるか)を見積もれば良い。
検定では要因AはF(φA,φe; α)=F(3,6; α)、要因BはF(φB,φe; α)=F(2,6; α)の部分をF分布表から読み取る。αは確率で通常0.05(5%)、もしくは0.01(1%)で任意である。
F分布表を上図に示す。要因Aの検定は分子3・分母6がクロスするところ、要因Bの検定は分子2・分母6がクロスするところを読み取る。
その結果、因子Aは分散比31.34 > 9.78(α=0.01)であり、1%で有意。
因子Bは分散比1.06 < 5.14(α=0.05)で有意でないと結論付けられる。
エクセルで分散分析後の信頼区間・予測区間を推定する
繰返しのない二元配置実験の区間推定は、繰返しのある二元配置実験の交互作用を含まない場合の区間推定と考え方はまったく同じである。
最適水準の母平均の点推定値
今回の例題では、先の分散分析で因子Bは有意ではないことがわかっているため、因子Aについてのみ検討する。
因子Aで最も水準効果が高いのはA1であり、因子Bは考慮しなくて良いので、そのままA4が最適水準となる。(※今回の例題は特性値が温度上昇値で、値は低いほど良い)
よって、最適水準の母平均の点推定値
=全体平均+(A1水準の平均ー全体平均)
=5.92+(3.63-5.92)=5.92-2.28=3.63
最適水準の母平均の95%信頼区間
繰返しのない二元配置実験の「母平均の信頼区間」は以下の式で計算する。
信頼区間=母平均の点推定値 ± t(φe,0.05) x
Ve・・・誤差分散 *分散分析表で計算済みの「誤差e(残差)」の分散値
ne・・・有効反復数 *点推定値が何個分のデータから計算されたものと等価であるかを示す
有効反復数neは以下の式で計算する。
ne=全データ数÷(1+推定に用いた要因の自由度の和)
今回の例では、推定に用いる要因は、Aのみであるので
ne=12÷(1+3)=3 となる。
信頼区間
=母平均の点推定値 ± t(φe, 0.05) x √(Ve/ne)
=3.63 ± t(6, 0.05) x √(0.34/3)
=3.63 ± 2.447 x 0.34
=3.63 ± 0.83の範囲
最適水準でデータをさらに取得した時に特性値が取り得る範囲(=予測区間)
最適水準A4でさらに製造した時に、製品の特性値がどの範囲に入るかを予測区間といい、計算式は以下となる。
予測区間=母平均の点推定値 ± t(φe,0.05) x
計算をすると以下のようになる。
予測区間
=母平均の点推定値 ± t(φe, 0.05) x √( (1+1/ne) x Ve )
=3.63 ± t(6, 0.05) x √( (1+1/3) x 0.34)
=3.63 ± 2.447 x 0.676
=3.63 ± 1.65の範囲
これでエクセルを活用した「繰返しのない二元配置実験」の分散分析と区間推定は完了だ。
スタットワークスによる解析でも同様の結果になることを確認する
↑今回の練習で用いた例題 p36[例2.3:監視用カメラの放熱効率に関する繰返しのない二元配置法]
先ほどエクセルで計算をした監視用カメラの放熱効率に関する例題を、今後はスタットワークスを用いて解析してみる。
まずはスタットワークスを立ち上げてワークシート上に実験データを入力する。
(別途エクセルファイルで入力した表をインポートでも良いが、今回は数が少ないのでち直接打ち込んだ)
ちなみにデータの表の構成には複数の表し方がある。1つ目のパターンは以下のような「行」に因子A、「列」に因子Bを配置して各セルに特性値を入力する方法。
2つ目のパターンは2列目に因子A、3列目に因子B、4列目に特性値を配置する以下のようなパターンである。どちらであっても解析上、支障はないので好みで良いかと思う。ちなみに私は、三元配置実験や特性値が複数ある場合にもアレンジしやすいパターン2の方が扱いやすいと思っている。
(以降はパターン2のワークシートで解析を実行した手順を示す)
ワークシート上にデータ入力が完了したら、メニューバー「手法選択」→「実験計画法」→「二元配置分散分析」を選択
変数の指定は因子A,Bを「実験条件」、温度上昇値を「特性値」に配置する。
因子A,Bの2,3列目は質的変数にしている。
「次へ進む」をクリックすると解析が実行される。
各種データをみていく。まずは「実験データ」→「データプロット」を確認する。
因子Aの主効果はありそうだが、因子Bと交互作用による効果はなさそうである。
例えばプロット[A]のグラフで、横軸が因子Aの各水準(A1~A4)、「×」印が実験の生データで、「●」印が各水準の平均値を示す。各水準の平均を破線で結んでいる。
グラフ中央の赤線は、全データの平均を意味する。
「実験データ」→「分散分析表」で各因子の分散比と統計的有意差を確認できる。
エクセルで計算した分散分析表とまったく同じであることが確認できる。
区間推定は「推定値」をクリックして、「推定使用要因の指定」を行う。
これは任意であるが、今回の例題では分散分析の結果、因子Bは有意でなかったので排除し、因子Aのみを取り込んで区間推定を行う。
推定値一覧を以下に示す。
最適水準(特性値が最も低い)はA1で、母平均の点推定値3.633、母平均の95%信頼区間と予測区間が示されており、いずれもエクセル計算と同じ結果であることが確認できた。
さらに追加で「残差一覧表」と「正規確率プロット」を示す。実験データに外れ値や実験の間違いがなかったかを簡易に見積もるために活用する。
これで「繰返しのない二元配置実験」のエクセル計算とスタットワークスによる解析が完了だ。