繰り返しのある場合の単回帰分析とは
同じ値のxに対してyの値が複数あるとき、繰り返しのある単回帰分析を適用する。
単回帰モデルは、を目的変数、
を説明変数とすると
と表される。
繰り返しがない場合は、で説明できない部分から誤差を推定していくが、
繰り返しがある場合は、誤差を級内変動と級間変動に分解し、同一水準内の変動から純粋な誤差を推定することができる。
一般に、単回帰分析において同一水準内の繰り返しがあると、より多くの情報を得ることができる。それは、xの一次式(単回帰式)をあてはめれば十分なのか、あるいは二次以上の式をあてはめるべきなのかを判断できるということである。
繰り返しのある単回帰分析の分散分析表を以下に示す。
級内変動を、級間変動を
、残差平方和を
、回帰による平方和を
とすると、総平方和
は次のように分解できる。
または
上記式のまたは
を当てはまりの悪さ(lack of fit)の平方和
という。
これは級間変動、すなわちyの各水準平均のばらつきのうちで、直線関係では説明のつかないばらつきであり、xの2次以上の項による変動を表す。
分散分析の進め方としては、まず最初に、級間変動が有意であることを確認する。
級間変動が有意でなければ、xの水準間に差があるとはいえず、直線回帰の有意性を検討する意味がなくなる。
当てはまりの悪さ(高次回帰)が有意でなく、分散比が小さければを
にプールする。
以降は、繰り返しのない場合と同様になる。
Statworksを用いて繰り返しのある単回帰分析を解析する
【例題】化学製品の強度向上
ある化学製品の強度を高める目的で製造温度を100℃、120℃、140℃、160℃と変え、それぞれの温度で3回ずつ製造して強度を測定した結果を示す。強度に単位はなく、値は高い方が良いとする。
例題の12個のデータをStatworksのワークシートに入力する。
メニューから手法選択→多変量解析→単回帰分析と進む。
目的変数にy:製品の強度、説明変数にx:製造温度を選択する。
変数の指定が完了すると、解析が実行され、結果を確認できる。
散布図プロットと統計量を確認する。正の相関があり、回帰式も確認できる。
次に分散分析表を確認する。
まず、級間変動は「**」で1%有意であることが読み取れる。
当てはまりの悪さは分散比が0.4861と小さく有意でないため、級内変動にプールして残差とする。プール後の分散分析表を以下に示す。
分散分析表から、直線回帰は高度に有意(検定「**」で1%有意)である。
推定された回帰式は
である。
JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)