Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするブログ/QC統計手法/公差設計・解析/TPS(トヨタ生産方式)

【単回帰分析】残差の検討と正規確率プロット

単回帰分析における残差の検討

単回帰分析で得られた単回帰モデルを当てはめてよいかどうかは、統計量による検討のみでは不十分であり、残差の検討によってモデルの妥当性を確認することが大切である。

 

残差の検討では、以下のようなことを検討するとよい。

①残差が正規分布に従っているか

②残差と説明変数は無関係か

③残差と目的変数の予測値は無関係か

④残差の時間的変化に傾向はないか

⑤残差の中に外れ値はないか

 

次に例題を用いて単回帰分析における残差の検討を行う。

 

【例題】ある製品の強度yと、製造工程における熱処理時間xのデータを用いて、xに対するyの回帰式を求める。データは以下の10個がある。

以前の記事で、本例題の回帰式 y=a+bx  は算出済みなので回帰式の計算は省略する。

instant.engineer

 

回帰式は、 y = 4.786 + 2.237x となる。

上記の回帰式から予測される値\hat{y}と実際との値との差(残差)を以下の表に示す。

今回は10個のデータであり、残差eは

最大値は、実際の値62に対して予測値53.994で、8.006

最小値は、実際の値35に対して予測値40.574で、-5.574

である。

 

ヒストグラムは以下のようになる。(※サンプルサイズが10と小さいので参考程度)

残差の平均値は0である。

また、残差の標準偏差は、\sqrt{\dfrac{残差の2乗の合計値}{n-2}} = \sqrt{\dfrac{139.950}{8}} = 4.18255 である。

 

正規確率プロット

残差の検討において、残差が正規分布に従っているかは、正規確率プロットを作成して検討を行う。

横軸に残差e、縦軸に期待累積確率を取って散布図を作成する。

期待累積確率関数は、=NORM.DIST(値,平均,標準偏差,関数形式) でエクセル計算できる。

関数形式はFALSE:確率密度関数、TRUE:累積分布関数であり、今回の場合はTRUEを指定する。

support.microsoft.com

 

作成したグラフが以下である。

正確確率プロットがほぼ直線上に並んでいるので、残差は正規分布に従っていると判断できる。

 

ちなみに、Statworks5で同じ例題データを使って正確確率プロットをした結果を以下に示す。こちらもエクセル同様、直線上にプロットが並んでいることが確認できる。

 

JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)