Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするブログ/QC統計手法/公差設計・解析/TPS(トヨタ生産方式)

【単回帰分析】回帰に関する検定

回帰に関する検定

データから得られた回帰式に意味があるか否かを検定するには、回帰に関する分散分析表を作成する。分散分析表は次のようになる。

 

単回帰分析の自由度Φ_Rは必ず1である。(単回帰分析とは、説明変数が1つであるため)

各平方和の自由度は以下のようになる。

S_Rの自由度 Φ_R = 1

S_Tの自由度 Φ_T = n - 1

S_eの自由度 Φ_e = Φ_T - Φ_R = n - 2

 

自由度を置き換えると分散分析表は以下のようになる。

※nはサンプル数を示す。

 

では、実際に例題を使って検定を行ってみる。

 

【例題】ある製品の強度yと、製造工程における熱処理時間xのデータを用いて、xに対するyの回帰式を求める。データは以下の10個がある。

 

問題で提示された表について、xとyそれぞれの2乗と積を右側に列追加し、さらに各列の合計を行追加する。

 

①偏差平方和S(xx),S(yy)と偏差積和S(xy)を求める

 S_{xx} = \sum\limits_{i=1}^n  (x_i - \bar{x})^2 = \sum\limits_{i=1}^n x_{i}^2 - \dfrac{\left(\sum\limits_{i=1}^n x_i \right)^2}{n}=3312 - \dfrac{178^2}{10} = 3312 - 3168.4 = 143.6

 

 S_{yy} = \sum\limits_{i=1}^n  (y_i - \bar{y})^2 = \sum\limits_{i=1}^n y_{i}^2 - \dfrac{\left(\sum\limits_{i=1}^n y_i \right)^2}{n}=20750 - \dfrac{446^2}{10} = 20750 - 19891.6 = 858.4

 

 S_{xy} = \sum\limits_{i=1}^n  (x_i - \bar{x})(y_i - \bar{y}) = \sum\limits_{i=1}^n x_iy_i - \dfrac{\left(\sum\limits_{i=1}^n x_i \sum\limits_{i=1}^n y_i \right)}{n}=8260 - \dfrac{178×446}{10} = 8260 - 7938.8 = 321.2

 

②各平方和S_R,S_e,S_Tを求める

S_R = \dfrac{S(xy)^2}{S(xx)} = \dfrac{321.2^2}{143.6} = 718.5

 

S_T = S(yy) = 858.4

 

S_e = S_T - S_R = 858.4 - 718.5 = 139.9

 

③各自由度Φ_R,Φ_e,Φ_Tを求める

Φ_R = 1

Φ_T = n-1 = 9

Φ_e = n-2 = 8

 

ここまでで一旦、計算できた部分を分散分析表に当てはめてみる。

残りの計算を続ける。

 

④各分散V_R,V_eを求める

V_R = \dfrac{S_R}{Φ_R} = \dfrac{718.5}{1} = 718.5

 

V_e = \dfrac{S_e}{Φ_e} = \dfrac{139.9}{8} = 17.5

 

⑤分散比V_R/V_eを求める

分散比 = \dfrac{V_R}{V_e} = \dfrac{718.5}{17.5} = 41.1

 

⑥F表(α=0.05)から限界値を確認する

F(Φ_R,Φ_e ; 0.05) = F(1,8 ; 0.05) = 5.32

 

すべての項目を計算できたので、改めて分散分析表に反映する。

 

ここから検定は、

分散比=\dfrac{V_R}{V_e}=41.1 > F(1,8 ; 0.05)=5.32 なので、有意である。

よって、回帰式には意味があるといえる。

 

Statworksで単回帰分析をする

さて、ここまではエクセルを用いて分散比を順次計算してきたが、Statworks5を用いて解析を行ってみる。

まずはワークシートを開いて例題のxとy、10個のデータを入力する。

メニューの多変量解析から回帰分析→単回帰分析を選択する。

変数指定のウィンドウが立ち上がるので、2列目のxを説明変数、3列目のyを目的変数に振り分ける。

散布図プロットと回帰式、回帰直線の95%信頼区間が表示される。

グラフの下から回帰式が確認できるが、先ほどエクセルで順次計算で求めた結果と一致することが確認できる。

さらに「分散分析表」タブに切り替えることで、検定結果も確認できる。

検定結果が「**」であり、1%有意であることが確認できる。

このように、(当然ではあるが)解析ソフトを使えば簡単に単回帰分析の検討をすることができる。

さらにStatworksでは、残差の検討として以下のような正規確率プロットも簡単な手順で作成、確認をすることができる。

 

JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)