↑例題を参考にしたテキスト。p29 例2.1:樹脂成形部品の繰返しのある二元配置法
以前の記事で、「実験計画法入門」の二元配置実験の例題をエクセルのみを用いて分散分析と区間推定を行った。
どのような計算手順/方法で解析を行っているかが理解できたので、今度は統計解析ソフトのスタットワークスを使って同じ例題の解析を実施する。
先に結論を言ってしまうと、得られる結果は当然ながらエクセルの時と同じである。
エクセルで実施した複雑な手順が省略(=時短化)するだけでアウトプットは同じなのだが、統計解析ソフトがどのような処理をして結果を算出しているかについてまったく無知だと、解析結果の吟味を誤る可能性もあるので当ブログではツールの扱い以上にそれらの結果がどのような過程で計算されているかに比重を置いている。
解析ソフトはJUSE-StatWorks/V5を用いている。
二元配置実験のスタットワークスを用いた解析方法
それではさっそく例題と同じ樹脂成型品の引っ張り強度問題についてソフトを用いた解析を実施していく。まずは問題文を以下に再掲する。
◆[例2.1:樹脂成形部品の引っ張り強度]
金属部品を樹脂成形部品で置き換え、コストダウンを図ることを計画している。この部品では引っ張り強度が重要な特性であり、樹脂成型品で十分な引っ張り強度が確保できるかどうかを実験で確認することにした。
樹脂成型時の射出圧力(因子A)と射出温度(因子B)を取り上げ、繰返しのある二元配置実験を行った結果が以下の表である。特性値は引っ張り強度(kg/cm^2)で高い方が良い。これを解析せよ。
まずは因子A、B、交互作用AxBについての分散分析から行う。
スタットワークスのソフトを立ち上げる。
実験データを以下のように入力する。
私は別途エクセルで入力したファイルをCSVインポートで読み込んだが、スタットワークス上で入力しても差し支えない。
この時、3列目:射出圧力と4列目:射出温度の列表示を「C」にしておく。
デフォルトで「N」が選択されている場合は、変数属性をクリックして変更する。
ちなみにCは質的変数、Nは量的変数を意味する。
因子の各水準は基本、質的変数を選んでおけば問題ない。
ワークシート上にデータ入力が完了したら、メニューバー「手法選択」→「実験計画法」→「二元配置分散分析」をクリックする。今回はワークシート上に既に解析をしたいデータがあるので、ワークシートの解析を選ぶ。
下記のような「変数の指定」画面が表示される。
左側の「ワークシート上のデータ」に一覧が表示されているが、これは解析対象のシートの「列」一覧である。ここから「特性値」と「実験条件(=要因)」を選択して右側のボックスに移す作業を行う。
今回の例題では特性値は「引っ張り強度」(量的変数)で、実験条件は「射出圧力」と「射出温度」なので2個(どちらも質的変数)を選択して移動させる。
移動が完了すると下記のような画面になる。
「次へ進む」をクリックすると解析が実行される。
データ数も少ないので解析は瞬時に完了し、結果が表示される。
「実験データ」の「実験データ」で解析処理をしたデータ一覧が表示される。
因子A:射出圧力、因子B:射出温度、繰返しr:2回の二元配置実験である。
「実験データ」の「データプロット」をクリックすると、以下のような4つの二次元プロットが表示される。
それぞれの散布図グラフの意味は以下の通りである。
・プロット[A]・・・因子A:射出圧力の各水準を横軸に取り、生データと因子A各水準の平均値をプロットしたグラフ。生データを「×」印、平均値を「●」印で、平均値を線で結ぶことで水準による効果が視覚的にわかりやすい。グラフの中央付近の赤色の横線は、全データの平均値を意味する。
・プロット[B]・・・因子B:射出温度の各水準を横軸に取り、生データと因子B各水準の平均値をプロットしたグラフ。その他の考えはAと同じ。
・プロット[AxB]・・・因子Aの水準を横軸に取り、因子Bの各水準ごとに実験繰返しの平均値をプロット。交互作用(因子Aと因子Bの組み合わせによる効果)の有無をこの平均値を結んだそれぞれの線が平行か否かで判断する。実験は誤差と伴うので厳密に平行になることはないが、近い折れ線を示すかで判断する。
・プロット[BxA]・・・プロット[AxB]のAとBを入れ替えたもので活用目的は同じである。
「実験データ」の「統計量」をクリックすると、先ほどのデータプロットで示されていた平均値の計算結果が一覧で確認できる。
いちばん上の総平均29.89は今回試験した24個の全データの平均値を示す。
次に「実験データ」の分散分析表をクリックする。
エクセルでは計算が大変だった二元配置実験の分散分析表の結果を即座に確認できる。
「分散比」が各要因のアウトプットで、それらをF分布表と比較した結果が「検定」である。
検定列には「**」と「*」があるが、それぞれ1%有意と5%有意を意味する。
今回の分散分析結果では、因子AとB主効果は1%有意で、交互作用AxBには有意差は認められないという結果である。
交互作用の有無による区間推定を行う(母平均の95%信頼区間と、データが入る予測区間)
分散分析を実施した結果、要因によって特性値が変わることがわかった。
次は各因子の最適な水準組み合わせとその時の母平均がいくつであるか、追加で実験をしてデータを取得した時にそのデータが取り得る範囲について”推定”を行う。
「因子名・水準名」をクリックする。今回の例題は特性値が引っ張り強度で、因子はA:射出圧力(3水準)とB:射出温度(4水準)の解析であった。
交互作用を含む場合(交互作用が有意な場合)の推定
タブの「推定値」をクリックすると、以下のような確認メッセージが表示される。
今回の例題では、交互作用AxBが分散分析の結果、5%有意ではないため、本来であれば区間推定の計算に交互作用は取り入れなくて良いのだが、いまは練習のため交互作用を含める。「いいえ」を選択すると、交互作用を推定式に取り入れてくれる。
以下のような推定値プロットと推定値一覧が表示される。
推定値プロットの12点は因子A:3水準x因子B:4水準=12通りの実験データの平均値である。交互作用を含む場合は、常にすべての水準組み合わせを比較評価する必要があり、今回の組み合わせの中では、A3B4水準のピンク色プロットが最も特性値が高いことがわかる。
推定値一覧で、No12のA3B4の行を確認する。
母平均の点推定値31.75、母平均の95%信頼区間31.187 ~ 32.313、予測区間の範囲などがわかる。
ちなみに、交互作用を含む場合の母平均の点推定値は12通りの水準組み合わせの繰返し2回実験データの平均値である。分散分析の前で確認した「実験データ」の「統計量」で以下の赤枠で示された数値である。
交互作用を含まない場合(交互作用が有意ではない場合)の推定
交互作用を含まないようにして「推定値」をクリックすると、以下のような「推定値プロット」が表示される。
因子A、Bの各水準による効果を示したものである。
ちなみにこれは、「実験データ」→「統計量」の下図に赤枠で示した部分をグラフプロットしたものである。
散布図グラフから、因子AについてはA2が最も特性値が高く、因子BについてはB4が良いことがわかる。よって最適水準はこれらを組み合わせたA2B4である。
推定値一覧で確認すると、A2B4に最適水準を示すmax表記がされ、ピンク色に塗られていることがわかる。
母平均の点推定値は31.42である。
交互作用を含めない場合の母平均は、全体の平均にA2による水準効果とB4による水準効果を加算したものだが、これをエクセルで計算すると手間なので、スタットワークス(解析ソフト)による恩恵は大きい。
母平均の95%信頼区間と予測区間についても推定値一覧表を見れば把握できる。
以上の手順で繰返しのある二元配置実験について、エクセル計算とスタットワークスによる解析処理が完了だ。
同じ例題をエクセルのみを使って解析した過去の記事がこちら。