単回帰分析における残差の検討
単回帰分析で得られた単回帰モデルを当てはめてよいかどうかは、統計量による検討のみでは不十分であり、残差の検討によってモデルの妥当性を確認することが大切である。
残差の検討では、以下のようなことを検討するとよい。
①残差が正規分布に従っているか
②残差と説明変数は無関係か
③残差と目的変数の予測値は無関係か
④残差の時間的変化に傾向はないか
⑤残差の中に外れ値はないか
次に例題を用いて単回帰分析における残差の検討を行う。
【例題】ある製品の強度yと、製造工程における熱処理時間xのデータを用いて、xに対するyの回帰式を求める。データは以下の10個がある。
以前の記事で、本例題の回帰式 y=a+bx は算出済みなので回帰式の計算は省略する。
回帰式は、 y = 4.786 + 2.237x となる。
上記の回帰式から予測される値と実際との値との差(残差)を以下の表に示す。
今回は10個のデータであり、残差eは
最大値は、実際の値62に対して予測値53.994で、8.006
最小値は、実際の値35に対して予測値40.574で、-5.574
である。
ヒストグラムは以下のようになる。(※サンプルサイズが10と小さいので参考程度)
残差の平均値は0である。
また、残差の標準偏差は、 である。
正規確率プロット
残差の検討において、残差が正規分布に従っているかは、正規確率プロットを作成して検討を行う。
横軸に残差e、縦軸に期待累積確率を取って散布図を作成する。
期待累積確率関数は、=NORM.DIST(値,平均,標準偏差,関数形式) でエクセル計算できる。
関数形式はFALSE:確率密度関数、TRUE:累積分布関数であり、今回の場合はTRUEを指定する。
作成したグラフが以下である。
正確確率プロットがほぼ直線上に並んでいるので、残差は正規分布に従っていると判断できる。
ちなみに、Statworks5で同じ例題データを使って正確確率プロットをした結果を以下に示す。こちらもエクセル同様、直線上にプロットが並んでいることが確認できる。
JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)