医学統計学習塾

変動の分解と分散分析法

 2処理の観測値(計量値)の平均値を比較する代表的な方法として,t検定がよく知られている.比較すべき処理の個数(水準数)をkで表すと,t検定がk=2の場合に用いられるのに対して,k=2を含む多処理の比較に用いられる一般的な手法が分散分析法である.もちろん,k=2のとき,t検定と分散分析の結果は一致する.分散分析法は,観測値の全体の変動をいくつかの変動要因に基づいて分解する方法で,この変動の分解は各要因の「平方和」に基づいて行われる.ここでは,(予め規定した)要因が一つである場合の分散分析法について述べる.

 いま,3種の成長ホルモン剤A1,A2,A3があり,各ホルモン剤の効果をラットの体重増加量を指標として評価することを考える.実際には,3種の成長ホルモン剤にそれぞれ5匹ずつのラットが供試され,各ホルモン剤がラットに一定の期間にわたって投与されたとする.投与前後に観測された15匹のラットの体重から求めた増加量(g)を薬剤別に表示1に示す.

表示1 ラットの体重増加量(g)

ラットNo.

A1

A2

A3

1

2

3

4

5

8.0

7.0

6.0

6.0

8.0

5.0

5.0

7.0

7.0

6.0

1.0

4.0

2.0

2.0

1.0

このとき,体重増加量の総和と平均は表示2のようになる.

表示2 体重増加量の総和と平均

 

A1

A2

A3

総計

総和

平均

35

7

30

6

10

2

75

5

表示2の結果は次のように解釈できる.

(1)全平均5は全体の母平均に対する推定値である.

(2)ホルモン剤Aは7-5=2だけ平均を上げる効果(処理効果)をもっていると推定される.同様に,ホルモン剤A2,A3の効果の推定値はそれぞれ1,-3である.

(3)同一のホルモン剤を投与しても,ラットの体重増加量は一定でない.それは,ホルモン剤以外の要因による誤差が加わっているからである.それらの推定値(残差)は,たとえばホルモン剤A1では8-7=1,7-7=0,6-7=-1,6-7=-1,8-7=1である.

すなわち,表示1のデータは次のような3個の成分からなっていると見做すことができる.

(データ)=(全平均)+(処理効果の推定値)+(残差).

このことを数字で表すと,表示3のようになる.


 

ところで,データ全体の変動は表示3の変動部分の平方和に反映される.これを総平方和といい,次のように計算される.

    ST=32­­+22+12++(-1)2+(-3)2+(-3)2+(-3)2+(-4)2=84

同様に,処理効果を反映する平方和と残差の大きさを反映する平方和は次のように求められる.

    SA=5(22+12+(-3)2)=70

    SE=12+02+(-1)2++02+02+(-1)2=14

すなわち

総平方和(ST=処理間平方和(SA+残差平方和(SE

である.このとき,分散分析による処理効果の有意性はSASEに対する相対量の大きさで評価される.

 一般に,これらの平方和は表示4の「分散分析表」の形式に要約され,処理効果の有意性が検定される.ここに,表示4でのp値とは,処理効果に差がないとする帰無仮説のもとで,自由度(φA,φE)のF分布のF0=VA/VEに対応する上側確率を示す.体重増加量のデータに対する分散分析表を表示5に示す.このとき,k=3n=5である.


表示4 分散分析

変動因

平方和

自由度

平均平方

F値

p値

処理

残差

SA

SE

φA=k-1

φ=k(n-1)

VA=SA/φA

VE­=SE/φE

VA/VE

p

全体

ST

φT=kn-1

 

 

 

 

表示5 体重増加量のデータに対する分散分析

変動因

平方和

自由度

平均平方

F値

p値

処理

残差

70.0

14.0

2

12

35.0

1.2

30.0

near 0

全体

84.0

14

 

 

 

 

表示5より,自由度(2,12)のF値に対するp値“near0”と非常に小さいことから,処理間変動が高度に有意であり,体重増加量がホルモン剤間で異なるといえる.  次に,この差異の大きさを相対的に評価するために,各ホルモン剤での平均体重増加量に対する100(1-α)%信頼区間を推定する.これは次式であたえられる.

ここに,xiは第iホルモン剤での平均増加量,および は自由度k(n-1)のt分布での100(1-α)%点である.各ホルモン剤での95%信頼区間は,t12,0.05=2.179および

0.483より,A1で(5.95,8.05),A2で(4.95,7.05),A3で(0.95,3.05)と推定される.すなわち,A1とA2の平均増加量はA3のそれに比して高いといえる.一般に,3種のホルモン剤の平均増加量の差を定量的に評価するためには,「多重比較」が行われる(多重比較については別途に紹介する).  なお,表示1のような変動分解の背後にある分散分析のモデルと理論では,いくつかの仮定が設けられている.すなわち,①観測値が個体の間で独立であること(独立性),②観測値が正規分布に従うこと(正規性),③観測値の分散が処理群間で等しいこと(等分散性). である.一般に,医学・生物学での研究分野で対象とされるものは「もの」でなく「生体」であり,生体からとられた観測値が上記の仮定を完全に満たすことは滅多にない.したがって,分散分析法を実地に適用する場合には,事前に正規性と等分散性の仮定を点検することが必要である.観測値についてのこれらの仮定からのずれが非常に大きい場合には別の方法で対処することが必要である.また,制御因子が1個の場合は1元配置分散分析,個体が2個の制御因子で完全に確率化されている場合は2元配置分散分析の方法がある.さらに,降圧剤の効果を血圧の経時変動に基づいて評価する場合などで用いられる繰り返し測定値の分散分析や製剤の生物学的同等性試験などで利用されるクロスオーバ・デザインの分散分析法など,実験(試験)の計画(デザイン)に応じて数多くの型の分散分析法が考案されている.