Instant Engineering

エンジニアの仕事効率を上げる知識をシェアするブログ/QC統計手法/公差設計・解析/TPS(トヨタ生産方式)

【相関分析】無相関の検定

無相関の検定

母集団における相関係数、すなわち、母相関係数ρが0か否かの検定を無相関の検定という。仮説は以下のようになる。

 帰無仮説H_0:ρ=0

 対立仮説H_1:ρ≠0

一般的にデータ数が少ない時、統計量の信頼性は低い。得られたデータから求めた相関係数rに意味があるのか、誤差の範囲なのかを評価するために無相関の検定を行う。

この検定にはr表を用いる検定t表を用いる検定がある。

 

r表による検定

r表を用いる場合、自由度はn-2となり、r表の数値はr(n-2,α)と表現する。

有意水準αにおける検定では、次のような規則となる。

|r| ≧ r(n-2,α)ならばH_0を棄却する

|r| < r(n-2,α)ならばH_0を棄却しない

 

検定の概要としては以上だが、例題を使って実際に検定してみたい。

ある製造条件xと品質特性yの関係を考える。品質特性yは値が大きいほど望ましいとする。サンプルサイズはn=12で以下のデータを得た。

製造条件xと品質特性yに相関関係があるかを考えていく。はじめに散布図を作成して、グラフから視覚的にデータの関係性を確認する。

データプロットから正の相関がありそうということがわかる。

 

次に相関係数rを検討する。相関係数とは、相関関係の強さを示す尺度で次式により求められる。

 r = \dfrac{S_{xy}}{\sqrt{S_{xx} × S_{yy}}}

 

xの偏差平方和 S_{xx}、yの偏差平方和 S_{yy}、xとyの偏差積和 S_{xy}を求めるために、以下のような表を作成する。

与えられたデータxとyの二乗と積、合計をそれぞれ計算した。さらにここから以下の式で偏差平方和、偏差積和を求める。

 S_{xx} = \sum\limits_{i=1}^n  (x_i - \bar{x})^2 = \sum\limits_{i=1}^n x_{i}^2 - \dfrac{\left(\sum\limits_{i=1}^n x_i \right)^2}{n}=1121.3 - \dfrac{108.9^2}{12} = 1121.3 - 988.3 = 133.0

 

 S_{yy} = \sum\limits_{i=1}^n  (y_i - \bar{y})^2 = \sum\limits_{i=1}^n y_{i}^2 - \dfrac{\left(\sum\limits_{i=1}^n y_i \right)^2}{n}=5315.0 - \dfrac{245.6^2}{12} = 5315.0 - 5026.6 = 288.3

 

 S_{xy} = \sum\limits_{i=1}^n  (x_i - \bar{x})(y_i - \bar{y}) = \sum\limits_{i=1}^n x_iy_i - \dfrac{\left(\sum\limits_{i=1}^n x_i \sum\limits_{i=1}^n y_i \right)}{n}=2389.7 - \dfrac{108.9×245.6}{12} = 2389.7 - 2228.8 = 160.9

 

さて、ここまで計算できれば上記の相関係数rの式に代入し、

 r = \dfrac{S_{xy}}{\sqrt{S_{xx} × S_{yy}}} = \dfrac{160.9}{\sqrt{133.0×288.3}} = \dfrac{160.9}{195.8} = 0.822

を求めることができた。

 

r表による検定の場合は、統計量は改めて計算する必要はなく、そのまま相関係数rを用いる。標本から計算した相関係数rがr表のr(n-2,α)より大きいかどうかを見る。

有意水準α=0.05とすると、今回の例題ではサンプルサイズは12なのでr(10,0.05)となる。

r表を以下に示す。

この表から自由度φ10、確率P 0.05を読み取ると、0.5760である

すなわち、先の計算で求めた相関係数r0.822 > r(10,0.05)=0.5760であるためH_0はa棄却され、有意水準5%で有意であることがわかる。

 

t表による検定

また、母相関係数の検定はt表を用いて行うこともできる。

t表による検定は、以下のt_0が自由度n-2のt分布に従うことを用いて計算する。

 t_0 = \dfrac{r\sqrt{n-2}}{\sqrt{1-r^2}}

 

相関係数r=0.822までは上記と同じ計算で求められたとして、t_0を計算する。

 t_0 = \dfrac{r\sqrt{n-2}}{\sqrt{1-r^2}}  = \dfrac{0.822\sqrt{12-2}}{\sqrt{1-0.822^2}} = \dfrac{0.822 × 3.162}{0.569} = 4.564

 

t表よりt(n-2,P)=t(10,0.05)=2.228<4.564のため、t表で検定しても結果は同じく有意であることが確認できた。

 

余談

r表による検定で今回の例題ではサンプルサイズn=12で、自由度としてはφ=10を用いた。一方、r表には自由度が100までのr値が規定されている。

自由度が大きくなるほど、つまりサンプルサイズが大きいほど判定基準となるr値はより小さくなる傾向がr表の数字の並びから分かるが、それを視覚的に理解するためグラフにプロットしたものを示す。

確率Pが0.10~0.01までいずれのグラフでも同じような曲線であることがわかる。またグラフの傾きは後半ほど緩やかになってくるので、サンプルサイズを増やした時のr値への影響があるところから減衰してくることも分かる。

 

JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)