2018年6月21日木曜日

統計処理 ー基礎解説ーANOVA

 

[基本解説→多群比較のためのANOVA; analysis of variance 分散分析法]
          →[検定-1要因多群-2要因多群] ←→[基本解説-多重比較検定]

 分散分析:ANOVAとは

 2つの平均値の相違を検討するにはt検定を用いるが、 3つ以上の平均値の相違を検討する場合にはANOVAを用いる。
分散分析には2つ以上の変数間の相違を、全体的または同時に、さらに変数を組み合わせて検討する。
全体的な相違が認められた場合、どこに相違があるのかも検討する。

 ↓

すべての群を比較するのではなく、要因による効果を検定する。
 従って、どの群とどの群の平均値が有意差があるかはわからない。→多重比較検定

 ↓

分散を分析するのではなく、分散を用いて、多群の平均値を分析する検定法である。

 

分散分析には、要因分散分析反復測定分散分析とがある。

 

要因が2つ以上ある場合は、主効果だけではなく、複数の要因による交互作用を検定する。

 

個々のデータを変動させている要因を分解し、分散分析表を作成して検定する。

 

要因変動誤差変動から、F値をもとめる。

 ↓

F値は、フィッシャーのイニシャルである。




要因配置

分散分析には、独立変数従属変数を設定する。
*独立変数はあらかじめ設定する条件を意味する。
*従属変数は測定されるものや独立変数の影響を受けて変化するものを意味する。
control群とMS群のimmobilizing (%)に差がない」という帰無仮説において、グループが独立変数、immobilizing (%)は従属変数となる。
独立変数1つのとき「 1要因」 2つのとき「 2要因」 3つのとき「 3要因」という。
 1つの独立変数の中にカテゴリーが2つある時に「 2水準」 3つある時に3水準」という。

主効果 main effect

それぞれの独立変数がそれぞれ「独自」に従属変数へ与える単純効果

交互作用 interaction

独立変数を組み合わせた場合の複合効果
特定のセルにおいて要因A主効果と要因Bの主効果だけでは説明できない組み合わせ特有な効果がみられること

 



 なぜ3群以上を比較するときに、2群間の検定ではいけないか? A, B, Cの3群がある時、

 A-B間、A-C間、B-C間で、p=0.05としてStudent's t-testを行った場合、
  「少なくとも一つが有意差あり」となる確率は、
   1-(1-0.05)*(1-0.05)*(1-0.05)で計算され、p=0.14となってしまう。
   5%の危険率で検定したつもりだが、危険率が上昇し、甘く評価してしまうことになる。

 

 

比較したい群が3群以上ある場合

1. 要因によって分類される群が、異なる群であるかを検定する。
 parametric-ANOVA Analysis of variance 分散分析

  

要因分散分析---factorial ANOVA

  

1要因---One-way factrial ANOVA

  

2要因---Two-way factrial ANOVA

  

反復測定分散分析---repeated measures ANOVA

  

1要因---One-way repeated measures ANOVA

  

2要因---Two-way repeated measures ANOVA

 non-parametric

  

要因分散分析-1要因---Kruskal-Wallis test

  

反復測定分散分析-1要因---Friedman test

2. 「有意差」が認められれば、多重比較

ANOVAの前提条件

  1. nが十分である。
  2. 分散が等しい。
  3. 正規分布である。
  4. 極端に分布に偏りがある場合は、
    non-parametric
    検定



 要因分散分析と反復測定分散分析

分散分析は、要因で分類された群を比較する検定法。

要因
 分散分析

対応のないt検定3群以上に拡張したもの。
=データ間に対応がない場合に行う検定。
 データ間に対応がある場合でも、対応は考慮せずに行う検定。
=群間変動と群内変動のを比較する。
  [要因による変動] > [誤差変動]----有意差あり!

反復測定
 分散分析

対応のあるt検定3群以上に拡張したもの。
=データの対応を考慮して行う検定。
=同一群に加えられた、処理(反復測定要因)によって生じる変動を検定する。
  [反復測定要因変動] > [実験個体誤差変動]----有意差あり!

 ↓対応したデータに対する考慮

*「対応のある・・・・検定」は、データの対応を考慮して行う検定。

対応のあるt検定は、2群を比較するのではなく、群に加わった処理により差が生じたかを、データの対応を考慮して検定する。

  • 処理前の群内のデータは均一かもしれないが、個体差が大きいかもしれない。
    →元々個体差が大きい場合には、処理後の個体のばらつきは、処理前のばらつきの範囲内かもしれない。
     
    しかし、一定量、一定方向に変化が生じた場合には、その変化量=差を比較すれば、差を検定できる 。

[処理前群の平均値] [処理後群の平均値] の2標本t検ではない。

[(処理後の値)(処理前の値)]の平均値=「差」の平均値の1標本t検定

  • 差を比較するので、個体差は無視できる
  • 従って「対応のないt検定」ではとらえられない変化を、「対応のないt検定」でとらえることができる。
    =「対応のないt検定」は、「対応のないt検定」より有意差が出やすい。

反復測定分散分析

  • 1標本に加わった処理の効果を、データの対応を考慮して、経時的に評価する。
  • 標本の個体差が大きく、処理の効果が小さい場合に、要因分散分析では有意差がでない場合でも、反復測定分散分析で、有意差が出る場合がある。
  • 1標本中のデータがばらついていても、変化に一定の傾向があれば、反復測定分散分析で、その「差」が検出できる。
  • 比較のための誤差変動は、要因分散分析のものよりも、反復測定分散分析のものは小さい。
    →群内のデータのばらつきを差し引いているので、変化をとらえるとことができる。
  • 各群の群内のデータのばらつきが小さい場合には、2つの検定方法の差はなくなる。
     ---要因分散分析のほうが検出力は弱いので、多重比較検定で第1種の過誤をおかす心配はない。

多重比較検定

  • 反復測定分散分析後のポストホックテストとして、通常の多重比較検定は行えないということになっている。
     ---通常の多重比較検定は、対応したデータを配慮しない検定であるからである。

    →データのばらつきが大きい場合には、対応したデータを考慮しないポストホックテストでは、差が充分検出できにくいのだろう。
    →データのばらつきが小さい場合には、要因分散分析との差も小さいので、通常の多重比較検定も行っても、正しい評価かもしれない。
  • StatViewの最終版では、Factorial ANOVARepeated measures ANOVAの多重比較検定の結果が異なる。
     StatViewでは、多重比較検定でも、データの対応を考慮した計算になっているのだろうか?

*「対応のあるデータ」は、単に同一個体のデータということではない。
 「反復測定した各データ」から「コントロール値」を差し引いた「変化量」は、
  個体差によるばらつきが取り除かれているので、データは独立していると考えられる。
  「同一データの反復測定」→反復測定分散分析
  「同一データの変化量の検定」→要因分散分析


 群を分ける要因が2つ以上ある場合には

 主効果だけではなく、複数の因子に「交互作用」があるかどうかも検定する。
   主効果:各要因の単独の効果
   交互作用:要因が組み合わさって生じる効果---相乗作用、相殺作用
    要因Aの効果が、要因Bの効果に影響するかどうか?

交互

作用なし

---

各群が同様に変動傾向を持つ。→→→要因ごとの多重検定 注)

交互

作用あり

---

各群の変動が異なる。→→→→→→すべての群の多重検定

 

相乗作用

---

右上がりまたは右下がりの度合いが群によって異なる。

 

相殺作用

---

右上がりの群と右下がり群が存在する。

注)交互作用がない場合には、多の要因によって分類される群と比較する必要が生じない。


 分散分析は、データを変動させる要因を分析する検定法である。

  • データを変動させる要因を分解し、「分散分析表」を作成する。

1要因

[全体変動][要因変動]+[誤差変動]
[
全体変動][群間変動]+[群内変動]

2要因

[全体変動][要因変動]+[交互作用による変動]+[誤差変動]

 

[要因変動]

要因の効果による変動

[誤差変動]

誤差による変動

  •  

群を分ける因子factor
 独立変数 independent variable
測定された値:
 従属変数 dependent variable

 

要因:factor 水準
 被験者間要因:between-subjects factor 
 被験者内要因:within-subject factor 
 ブロック内要因:within-block factor 
 固定効果:fixed effect 
 変量効果:random effect

F=

[要因変動]の平均平方和
--------------------
[
誤差変動]の平均平方和

  • F値は大きいほど、p値が小さくなる。
  • 統計のためのソフトを利用しない場合は、教科書巻末のF統計量から、p値がもとめられる。


  分散分析表 (計算例は下

One-factor factorial ANOVA

 

自由度

平方和

平均平方和

F

p

ラムダ

検出力

 

[要因A]

A

A/R

要因Ap

残差

R

 

 

 

 

 



Two factor factorial ANOVA

 

自由度

平方和

平均平方和

F

p

ラムダ

検出力

 

[要因A]

A

A/R

要因Ap

[要因B]

B

B/R

要因Bp

[要因A][要因B]

A-B

A-B/R

交互作用p

残差

R

 

 

 

 

 



One -factor repeatd measures ANOVA

 

自由度

平方和

平均平方和

F

p

ラムダ

検出力

 

[対照]

R1

 

 

 

 

 

カテゴリー[反復測定因子B]

B

B/R2

反復測定のp

カテゴリー[反復測定因子B][対照(群)]

R2

 

 

 

 

 



Two-factor repeatd measures ANOVA

 

自由度

平方和

平均平方和

F

p

ラムダ

検出力

 

[群間因子A]

A

A/R1

群間のp

[対照(群)]

R1

 

 

 

 

 

カテゴリー[反復測定因子B]

B

B/R2

反復測定のp

カテゴリー[反復測定因子B][群間要因A]

B-A

B-A/R2

交互作用p

カテゴリー[反復測定因子B][対照(群)]

R2

 

 

 

 

 


 誤差=(同一群内に、)偶然によって生じたばらつき
  残差(Residual)

  • ANOVAは、[要因変動][誤差変動]を比較する。
  • 反復因子のための[誤差変動]は、要因因子のための[誤差変動]から[実験個体誤差変動=群内のばらつき]を引いたもの。
  • 反復因子の比較のためには、
    • 群内のばらつきが大きい場合には、反復測定分散分析の[誤差変動]が小さくなるので、有意差が出やすくなる
    • 群内のばらつきが小さい場合には、2つの検定方法の差はなくなる。

 

要因分散分析

反復測定分散分析

2要因

要因A

群間因子

群間因子

要因B)

群間因子

反復測定因子

[全体変動]
 観測値全体の
 ばらつき

[群間変動]
 [群内変動]

[個体間変動]
 [実験個体変動]

[要因A変動]+ [要因B変動]
 + [交互作用変動] + [誤差変動]

[個体間変動]
 [実験個体要因変動] + [実験個体誤差変動]+ [交互作用変動]

[要因A変動]

[要因A変動]
One factorの場合は[群間変動]

[個体間変動]

[要因B変動]

[要因B変動]

[実験個体要因変動][反復測定変動]

要因A)のための
 [誤差変動]

[群内変動][誤差変動]

[実験個体誤差変動]

要因B)のための
 [誤差変動]

[群内変動][誤差変動]

[実験個体変動][実験個体誤差変動]

交互作用変動のための
 [誤差変動]

[群内変動][誤差変動]

[実験個体変動][実験個体誤差変動]



 1要因の分散分析のための実際例

  • 暗算で計算できるような架空データ。
  • Repeated measures様のデータであるが、FactorialRepeated measuresの計算方法を比較するための例である。

データ

経 過

処理前

処理中

処理後

平 均

個体A

3

7

11

 7 

個体B

2

4

6

 4 

個体C

2

1

6

 3 

個体D

5

4

9

 6 

平 均

 3 

 4 

 8 

 5 

 

基本統計量

n

平均値

標準誤差

標準偏差

処理前

4

3

0.707

11

処理中

4

4

1.255

4

処理後

4

8

1.255

3



  • Factorial ANOVAの分散分析表

 

自由度

平方和

平均平方

F

p

ラムダ

検出力

時間経過

2

56

28

6

0.0221

12

0.746

残差

9

42

4.667

 

 

 

 

·        

    • 群間比較:[群間変動][群内変動]の比較 (列間比較)
    • [群間変動][処理前]-[処理中]-[処理後]間の変動
    • [群内変動]=残差:個体A〜個体Dの個体差
    • 群数=3
    • 各群の個体の観測値n=4 

時間経過
=群間変動

自由度

[群数]-1

3-1=2

平方和

{([群間平均]-[全平均])2の和}x各群のn

{(3-5)2+(4-5)2+(8-5)2}x4=56

平均平方

[平方和]/[自由度]

56/2=28

F

[時間経過の平均平方]/[残差の平均平方]

28/4.667=6

残差
=群内変動

自由度

[群数]x(n-1)

3x(4-1)=9

平方和

([個体の観測値]-[群平均])2の和

{(3-3)2+(7-4)2+(11-8)2=18
{(2-3)2+(4-4)2+(6-8)2=5
{(2-3)2+(1-4)2+(6-8)2=14
{(5-3)2+(4-4)2+(9-8)2=5
18+5+14+5=42

平均平方

[平方和]/[自由度]

42/9=4.667


  • Repeated Measures ANOVAの分散分析表

 

自由度

平方和

平均平方

F

p

ラムダ

検出力

対照

3

30

10

 

 

 

 

カテゴリー時間経過

2

56

28

14

0.0055

28

0.958

カテゴリー時間経過*対照

6

12

2

 

 

 

 

·        

    • Factorial [群間変動]は、Repeated Measures[群内変動]
    • [群内変動]Repeated Measures[誤差変動]の比較
    • [群内変動][処理前]-[処理中]-[処理後]間の変動
    • [対照]=それぞれの観測個体内の誤差・・・これを差し引く!
    • Repeated Measuresのための誤差は、Factorialのための誤差から[対照]の誤差を差し引く 

対照
[実験個体変動]

自由度

[各群のn]-1

4-1=3

平方和

{([群内平均]-[全平均])2の和}x群数

{(7-5)2+(4-5)2+(3-5)2+(6-5)2}x3=30

平均平方

[平方和]/[自由度]

30/3=10

カテゴリー
 時間経過
[実験個体要因変動]

自由度

[群数]-1

3-1=2

平方和

{([群間平均]-[全平均])2の和}x各群のn

{(3-5)2+(4-5)2+(8-5)2}x4=56

平均平方

[平方和]/[自由度]

56/2=28

F

[時間経過の平均平方]/[残差の平均平方]

28/2=14

カテゴリー
 時間経過
 *対照

自由度

[残差の自由度]-[対照の自由度]

9-6=3

平方和

[残差の平方和]-[対照の平方和]

42-30=12

平均平方

[平方和]/[自由度]

12/2=6



 2要因の分散分析のための実際例

  • 暗算で計算できるような架空データ。
  • Repeated measures様のデータであるが、FactorialRepeated measuresの計算方法を比較するための例である。

データ

MEL

処理前

処理中

処理後

平 均

個体A

3

7

11

 7 

個体B

2

4

6

 4 

個体C

2

1

6

 3 

個体D

5

4

9

 6 

平 均

8

CAP

処理前

処理中

処理後

平 均

個体A

2

4

12

 6 

個体B

3

5

13

 7 

個体C

3

7

11

 7 

個体D

4

8

12

 8 

平 均

 3 

 6 

 12 

 7 

 

時間

時間

処理前

処理中

処理後

M
E
L

3

7

11

2

4

6

2

1

6

5

4

9

C
A
P

2

4

12

3

5

13

3

7

11

4

8

12

 3 

 5 

 10 

薬物

薬物

MEL

CAP



3

2

2

3

2

3

5

4



7

4

4

5

1

7

4

8



11

12

6

13

5

11

9

11

5

7

 

基本統計量

例数

n

平均値

標準誤差

標準偏差

処理前MEL

4

3

1.414

0.707

処理前CAP

4

3

0.816

0.408

処理中MEL

4

4

2.449

1.225

処理中CAP

4

6

1.826

0.913

処理後MEL

4

8

2.449

1.225

処理後CAP

4

12

0.816

0.408


  • Factorial ANOVAの分散分析表

 

自由度

平方和

平均平方

F

p

ラムダ

検出力

時間

2

208

104

33.429

<0.0001

66.856

1

薬物

1

24

24

7.714

0.0124

7.714

0.755

時間*薬物

2

16

8

2.571

0.1042

5.143

0.438

残差

18

56

3.111

 

 

 

 

·        

時間
(列間変動)

自由度

[時間の群数]-1

3-1=2

平方和

{([群間平均]-[全平均])2の和}xn

{(3-6)2+(5-6)2+(10-6)2}x8=208

平均平方

[平方和]/[自由度]

208/2=104

F

[時間の平均平方]/[残差の平均平方]

104/3.111=33.429

薬物
(行間変動)

自由度

[薬物の群数]-1

2-1=1

平方和

{([群間平均]-[全平均])2の和}xn

{(5-6)2+(7-6)2}x12=24

平均平方

[平方和]/[自由度]

24/1=24

F

[時間の平均平方]/[残差の平均平方]

24/3.111=7.714

時間*薬物

自由度

([時間の群数]-1)x([薬物の群数]-1)

2x1=2

平方和

[総変動]-[時間変動]-[薬物変動]-[誤差変動]

304-208-24-56=16

平均平方

[平方和]/[自由度]

16/2=8

F

[時間の平均平方]/[残差の平均平方]

8/3.111=2.572

残差
=群内変動

自由度

[群数]x(n-1)

6x(4-1)=18

平方和

([個体の観測値]-[群平均])2の和

{(3-3)2+(7-4)2+(11-8)2=18
{(2-3)2+(4-4)2+(6-8)2=5
{(2-3)2+(1-4)2+(6-8)2=14
{(5-3)2+(4-4)2+(9-8)2=5
{(2-3)2+(4-6)2+(12-12)2=5
{(3-3)2+(5-6)2+(13-12)2=2
{(3-3)2+(7-6)2+(11-12)2=2
{(4-3)2+(8-6)2+(12-12)2=5
18+5+14+5+5+2+2+5=56

平均平方

[平方和]/[自由度]

56/18=3.111

総和

平方和

([個体の観測値]-[群平均])2の和

{(3-6)2+(7-6)2+(11-6)2=35
{(2-6)2+(4-6)2+(6-6)2=20
{(2-6)2+(1-6)2+(6-6)2=41
{(5-6)2+(4-6)2+(9-6)2=14
{(2-6)2+(4-6)2+(12-6)2=56
{(3-6)2+(5-6)2+(13-6)2=59
{(3-6)2+(7-6)2+(11-6)2=35
{(4-6)2+(8-6)2+(12-6)2=44
18+5+14+5+5+2+2+5=304




  • Repeated Measures ANOVAの分散分析表

 

自由度

平方和

平均平方

F

p

ラムダ

検出力

薬物

1

20.167

20.167

3.524

0.1096

3.524

0.345

対照(群)

6

34.333

5.722

 

 

 

 

カテゴリー時間

2

212.333

106.167

76.440

0<0.0001

152.880

0.958

カテゴリー時間*薬物

2

16.333

8.167

5.880

0.0166

11.760

0.778

カテゴリー時間*対照(群)

12

16.333

1.389

 

 

 

 



薬物

自由度

[薬物の群数]-1

2-1=1

平方和

{([群内平均]-[全平均])2の和}x群数

20.167

平均平方

[平方和]/[自由度]

20.167/1=20.167

F

[薬物の平均平方]/[対照(群)の平均平方]

20.167/5.722=3.524

対照(群)

自由度

 

6

平方和

{([群内平均]-[全平均])2の和}x群数

34.333

平均平方

[平方和]/[自由度]

34.333/6=5.722

カテゴリー時間

自由度

[時間の群数]-1

3-1=2

平方和

{([群間平均]-[全平均])2の和}x各群のn

212.333

平均平方

[平方和]/[自由度]

212.333/2=106.167

F

[時間の平均平方]/[カテゴリー時間*対照(群)の平均平方]

106.167/1.389=76.440

カテゴリー時間
 *薬物

自由度

([時間の群数]-1)x([薬物の群数]-1)

2x1=2

平方和

 

16.333

平均平方

[平方和]/[自由度]

16.333/2=8.167

F

[カテゴリー時間*薬物の平均平方]
/[
カテゴリー時間*対照(群)の平均平方]

8.167/1.389=5.880

カテゴリー時間
 *対照(群)

自由度

([時間の群数]-1)x([薬物の群数]-1)

12

平方和

 

16.333

平均平方

[平方和]/[自由度]

16.333/12=1.389

 

私のための統計処理

 

http://www.shiga-med.ac.jp/~koyama/stat/com-anova.html

 

0 件のコメント:

コメントを投稿