統計について(正規性の検定&関連二群の差の検定)
たまには研究関連の内容を、、、
といってもただの検定方法に関するメモ。
(計算方法ではないです。SPSSの使い方と検定の種類についての備忘録)
やり方忘れちゃうので、、、(笑)
私はよく関連二群(pairedとかrelated と呼ばれる)でなんかしらの値に差がないかを検定することが多い。同一被験者で条件Aと条件Bのときで比較、みたいなそんな状況です。
コントロールとかの問題はあるけれど、
取りあえずその辺の問題はクリアしていて関連二群として比較できるデータであるとします。
まずは正規性の検定。
いわゆるt検定は正規分布を仮定した検定方法なので、データが正規分布であることのチェックが必要。サンプル数が多いと正規分布であるとみなすこともできるのですが、生体での実験の場合は被験者数をNとするとせいぜい多くても20~30人。となると小標本になるので、正規性のチェックが必要です。(「バイオサイエンスの統計学」によるとN>25で大標本だそうです。)
<SPSSにおける正規性の検定手順>
1.メニューから「分析」を選択
2.「記述統計」を選択
3.「探索的」を選択 ダイヤログが出てくる
4.「従属変数」に検定したいデータを入れる
5.「作図」ボタンをクリック
6.「正規性の検定とプロット」にチェックを入れて、「続行」
7.「OK」をクリック。
8.「Kolmogorov-Smirnov の正規性の検定」とか「Shapiro-Wilk」の有意確率をチェック
※注意点としては
関連二群の場合、群間の差について検定をすることになるので、正規性の確認も「差」について行う必要があります。
個人差が大きくデータそのものに正規性がない場合ても、差の分布が正規分布であるとみなせれば、パラメトリックな検定が使えます。
正規性の検定の結果、帰無仮説が棄却された場合
有意確率が低い(通常は0.05未満)だと帰無仮説が棄却されて、「正規分布とはいえない」となります。なので潔くノンパラメトリック検定を用いる!(関連二群の場合は、ウィルコクソン!)
しかし、棄却できない場合は?
パラメトリックな手法を使って良いのでしょうか?
棄却されたとしても「正規分布である」と積極的に言えるわけではなく、「正規分布でないとは言えない」というだけ。。。
有意確率が十分高ければ(0.95より大きい??)、パラメトリックな手法使えるのかなぁ...
ジャーナルとかに出すとt検定が嫌われるのもこの辺が問題。
結局、、、
サンプル少なければ、ノンパラを使っとけ!
ということだろうか。。。
正規性の検定の方法のための備忘録と思って書き始めたけど、必要なかったかもしれない。
といってもただの検定方法に関するメモ。
(計算方法ではないです。SPSSの使い方と検定の種類についての備忘録)
やり方忘れちゃうので、、、(笑)
私はよく関連二群(pairedとかrelated と呼ばれる)でなんかしらの値に差がないかを検定することが多い。同一被験者で条件Aと条件Bのときで比較、みたいなそんな状況です。
コントロールとかの問題はあるけれど、
取りあえずその辺の問題はクリアしていて関連二群として比較できるデータであるとします。
まずは正規性の検定。
いわゆるt検定は正規分布を仮定した検定方法なので、データが正規分布であることのチェックが必要。サンプル数が多いと正規分布であるとみなすこともできるのですが、生体での実験の場合は被験者数をNとするとせいぜい多くても20~30人。となると小標本になるので、正規性のチェックが必要です。(「バイオサイエンスの統計学」によるとN>25で大標本だそうです。)
<SPSSにおける正規性の検定手順>
1.メニューから「分析」を選択
2.「記述統計」を選択
3.「探索的」を選択 ダイヤログが出てくる
4.「従属変数」に検定したいデータを入れる
5.「作図」ボタンをクリック
6.「正規性の検定とプロット」にチェックを入れて、「続行」
7.「OK」をクリック。
8.「Kolmogorov-Smirnov の正規性の検定」とか「Shapiro-Wilk」の有意確率をチェック
※注意点としては
関連二群の場合、群間の差について検定をすることになるので、正規性の確認も「差」について行う必要があります。
個人差が大きくデータそのものに正規性がない場合ても、差の分布が正規分布であるとみなせれば、パラメトリックな検定が使えます。
正規性の検定の結果、帰無仮説が棄却された場合
有意確率が低い(通常は0.05未満)だと帰無仮説が棄却されて、「正規分布とはいえない」となります。なので潔くノンパラメトリック検定を用いる!(関連二群の場合は、ウィルコクソン!)
しかし、棄却できない場合は?
パラメトリックな手法を使って良いのでしょうか?
棄却されたとしても「正規分布である」と積極的に言えるわけではなく、「正規分布でないとは言えない」というだけ。。。
有意確率が十分高ければ(0.95より大きい??)、パラメトリックな手法使えるのかなぁ...
ジャーナルとかに出すとt検定が嫌われるのもこの辺が問題。
結局、、、
サンプル少なければ、ノンパラを使っとけ!
ということだろうか。。。
正規性の検定の方法のための備忘録と思って書き始めたけど、必要なかったかもしれない。
コメント
コメントを投稿