無相関の検定
母集団における相関係数、すなわち、母相関係数ρが0か否かの検定を無相関の検定という。仮説は以下のようになる。
帰無仮説:ρ=0
対立仮説:ρ≠0
一般的にデータ数が少ない時、統計量の信頼性は低い。得られたデータから求めた相関係数rに意味があるのか、誤差の範囲なのかを評価するために無相関の検定を行う。
この検定にはr表を用いる検定とt表を用いる検定がある。
r表による検定
r表を用いる場合、自由度はn-2となり、r表の数値はr(n-2,α)と表現する。
有意水準αにおける検定では、次のような規則となる。
|r| ≧ r(n-2,α)ならばを棄却する
|r| < r(n-2,α)ならばを棄却しない
検定の概要としては以上だが、例題を使って実際に検定してみたい。
ある製造条件xと品質特性yの関係を考える。品質特性yは値が大きいほど望ましいとする。サンプルサイズはn=12で以下のデータを得た。
製造条件xと品質特性yに相関関係があるかを考えていく。はじめに散布図を作成して、グラフから視覚的にデータの関係性を確認する。
データプロットから正の相関がありそうということがわかる。
次に相関係数rを検討する。相関係数とは、相関関係の強さを示す尺度で次式により求められる。
xの偏差平方和、yの偏差平方和
、xとyの偏差積和
を求めるために、以下のような表を作成する。
与えられたデータxとyの二乗と積、合計をそれぞれ計算した。さらにここから以下の式で偏差平方和、偏差積和を求める。
さて、ここまで計算できれば上記の相関係数rの式に代入し、
を求めることができた。
r表による検定の場合は、統計量は改めて計算する必要はなく、そのまま相関係数rを用いる。標本から計算した相関係数rがr表のr(n-2,α)より大きいかどうかを見る。
有意水準α=0.05とすると、今回の例題ではサンプルサイズは12なのでr(10,0.05)となる。
r表を以下に示す。
この表から自由度φ10、確率P 0.05を読み取ると、0.5760である
すなわち、先の計算で求めた相関係数r0.822 > r(10,0.05)=0.5760であるためはa棄却され、有意水準5%で有意であることがわかる。
t表による検定
また、母相関係数の検定はt表を用いて行うこともできる。
t表による検定は、以下のが自由度n-2のt分布に従うことを用いて計算する。
相関係数r=0.822までは上記と同じ計算で求められたとして、を計算する。
t表よりt(n-2,P)=t(10,0.05)=2.228<4.564のため、t表で検定しても結果は同じく有意であることが確認できた。
余談
r表による検定で今回の例題ではサンプルサイズn=12で、自由度としてはφ=10を用いた。一方、r表には自由度が100までのr値が規定されている。
自由度が大きくなるほど、つまりサンプルサイズが大きいほど判定基準となるr値はより小さくなる傾向がr表の数字の並びから分かるが、それを視覚的に理解するためグラフにプロットしたものを示す。
確率Pが0.10~0.01までいずれのグラフでも同じような曲線であることがわかる。またグラフの傾きは後半ほど緩やかになってくるので、サンプルサイズを増やした時のr値への影響があるところから減衰してくることも分かる。
JUSE‐StatWorksによる回帰分析入門 (StatWorksによる新品質管理入門シリーズ)