

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
群内平方和・とは?
群内平方和 はデータ分析の用語であり、各グループの内部で生じるばらつきを表す指標です。英語で Sum of Squares Within と呼ばれ、分析の目的は全体のばらつきを「グループ間のばらつき」と「グループ内のばらつき」に分けて考えることです。そのうちの 群内平方和 はグループ内のばらつきを表します。
計算の基本はとてもシンプルです。まず各グループの平均を求めます。その後、各データからそのグループの平均を引き、差を二乗して足します。全てのデータについてこれを繰り返し、合計したものが 群内平方和 SSE です。公式で書くと次のようになります。SSE = sum_{グループ j} sum_{i in group j} (x_{ij} - x̄_j)^2
この考え方を理解するコツは、まず「同じグループ内でのばらつきが測れる」点を押さえることです。グループ間の差を測る指標とは別に、グループ内のばらつきが小さければデータ全体の一貫性が高いと判断できます。
計算の流れの具体例
以下は9つのデータを3つのグループに分けた例です。各グループの平均と偏差を計算し、偏差の二乗を合計して群内平方和を求めます。
| グループ | 値 | グループ平均 x̄_j | 偏差 (x - x̄_j) | 偏差の2乗 |
|---|---|---|---|---|
| Group 1 | 5 | 6 | -1 | 1 |
| Group 1 | 7 | 6 | 1 | 1 |
| Group 1 | 6 | 6 | 0 | 0 |
| Group 2 | 8 | 8 | 0 | 0 |
| Group 2 | 9 | 8 | 1 | 1 |
| Group 2 | 7 | 8 | -1 | 1 |
| Group 3 | 4 | 5 | -1 | 1 |
| Group 3 | 5 | 5 | 0 | 0 |
| Group 3 | 6 | 5 | 1 | 1 |
この例では各グループの偏差の二乗を足し合わせると 群内平方和 SSE は合計で 6 となります。なお同じデータから全体のばらつき SSt を計算すると 20、グループ間のばらつきとなる SS Between は 14 になります。これらは関係式 SSt = SSE + SS Between によりつながっています。
現場での使い道としては 2つの要素を比較する際に役立ちます。たとえば薬の効果を3つの投与量グループで比べるような研究では、グループ内のばらつきを小さく保ちながらグループ間の差を大きくすることが理想です。群内平方和が小さいほどデータのばらつきが少なく、分析結果の信頼性が高まることを理解できます。
要点をもう一度まとめます。群内平方和は各グループ内のデータがそのグループの平均からどれだけ散らばっているかを示す指標です。計算は xij − x̄j の二乗を各データについて足し合わせるだけ。これを理解すれば、ANOVA の基本的な考え方にも自然に近づけます。
まとめのポイント
群内平方和はデータの内側のばらつきを測る指標。SSE として表現され、グループ間のばらつきと合わせて全体のばらつきに関係します。中学生にも理解できるよう、まずは自分の身の回りのデータを 3 グループ程度に分けて、各値とグループ平均の差を計算してみると感覚がつかめます。
この記事のポイントを覚えておくと、統計学の基礎である分散分析の理解が深まります。
群内平方和の同意語
- 群内平方和
- 各群内のデータ点と、その群の平均値との差を二乗して合計した値。ANOVAで用いられる群内のばらつき(誤差成分)を表す指標。
- グループ内平方和
- 群内平方和と同義の表現。グループという語を用いた表記のバリエーション。
- 各群内平方和
- 各群ごとにデータの差の二乗を合計し、それらを全群分合計した平方和。群内のばらつきを表す。
- 群内変動の平方和
- 群内のばらつきを二乗和として表したもの。群内データの散らばりを示す指標。
- 内部平方和
- 群内のばらつきを表す平方和の別表現。群内平方和と同義として使われることがある。
- 誤差平方和
- ANOVAにおける残差の平方和。群内平方和としばしば同義で用いられる用語。
- 残差平方和
- 誤差平方和の別表現。モデルの残差(データ点と予測値の差)の二乗和を指す。
群内平方和の対義語・反対語
- 群間平方和
- 群内平方和の対になり、群の間で生じる変動を表す平方和。各群の平均値の差によって説明される変動を合計したもので、ANOVAの変動分解で SS B と呼ばれる。
- 総平方和
- データ全体のばらつきを表す平方和。全データが全体の平均からどれだけ離れているかを表し、群内平方和と群間平方和の和として SST = SSB + SSW が成り立つ。
- 群間変動
- 群間の差によって生じる変動を指す概念。群間平方和の別名として使われることが多い。
- 全体変動
- データ全体のばらつきを表す総変動のこと。群間変動と群内変動の和として理解される。
- 群間分散
- 群間の差を表す分散の概念。群間平方和を自由度で割った値に相当する指標として扱われることがある。
群内平方和の共起語
- 群間平方和
- 総変動のうち、群と群の間の差で説明できる部分を表す平方和。SSBとも呼ばれる。
- 総平方和
- データ全体の変動を表す平方和。群内平方和と群間平方和の和に等しい。
- 自由度
- データや推定量が取り得る独立な値の数。ANOVAでは群間自由度と群内自由度がある。
- 平均平方
- 平方和を対応する自由度で割った指標。MS = SS/df。
- MS群間
- 群間平方和を群間自由度で割った平均平方。群間のばらつきの指標。
- MS誤差
- 誤差平方和を誤差自由度で割った平均平方。説明変動の基準として用いる。
- 誤差平方和
- データの誤差(群内のばらつき)による平方和。
- 残差平方和
- 観測値とモデル予測値との差の平方和。SSresとも表記される。
- F値
- 群間平均平方と誤差平均平方の比。統計的有意性を判断する検定統計量。
- 分散分析
- データのばらつきを要因ごとに分解して分析する統計手法。ANOVAの別名。
- 要因
- 実験条件や分類変数。例えば薬剤の種類や温度など。
- 因子
- 要因と同義。複数のレベルを持つ変数。
- 因子レベル
- 要因が取り得る水準やカテゴリー。例: AとBの2水準。
- 群内変動
- 各群内で生じるデータのばらつき。SSWの一部。
- 群間変動
- 群と群の間に現れるばらつき。SSBの一部。
- 交互作用
- 複数の要因が組み合わさって生じる効果。要因間の相互作用。
- 二元分散分析
- 2つ以上の要因を同時に扱うANOVAの形式。
- 正規性検定
- データが正規分布に従うかを検定する検定。
- 等分散性検定
- 各群の分散が等しいかを検定する統計。
- 効果量
- 要因の効果の大きさを表す指標。例: η²、部分η²、Cohen's dなど。
- 偏η二乗
- 要因ごとの効果量を示す指標。ANOVAでよく用いられる。
- 部分η二乗
- 要因の効果量を分解して評価する指標。
群内平方和の関連用語
- 群内平方和
- 群内平方和は、各群のデータとその群の平均値との差の平方を全群について足し合わせたもの。群内のばらつきを表します(SSEに相当することも多い)。
- 群間平方和
- 群間平方和は、各群の平均値と全体平均との差の平方を、各群のデータ数で重み付けして足し合わせたもの。群間のばらつきを表します。
- 全平方和
- 全平方和は、全データの値と全体平均の差の平方を合計したもので、データの総変動を表します。
- 自由度
- 自由度は、統計量を構成する独立な情報の数。ANOVAでは df_T(総自由度), df_B(群間自由度), df_W(群内自由度)などがあり、 df_T = df_B + df_W となります。
- 一元分散分析
- 1つの因子のみを考える分散分析。群間と群内のばらつきを分解して、因子効果を検定します。
- 二要因分散分析
- 因子が2つある場合の分散分析。個々の因子の効果と相互作用効果を同時に検討します。
- 多因子分散分析
- 3つ以上の因子を同時に扱う分散分析。各因子の主効果と相互作用を評価します。
- 反復測定分散分析
- 同一対象を複数回測定するデータを対象とした分散分析。群内変動がデータ内の反復に関連します。
- 分散分析表
- ANOVA表は SST(全平方和), SSB(群間平方和), SSW(群内平方和), df, MS, F値, p値 などをまとめた表です。
- SST
- 総平方和の英語略称。全データの変動量を表します。
- SSB
- 群間平方和の英語略称。群間の変動量を表します。
- SSW
- 群内平方和の英語略称。群内の変動量を表します。
- SSTの計算式
- SST = ∑_{i,j} (X_{ij} - X̄)^2
- SSBの計算式
- SSB = ∑_j n_j (X̄_j - X̄)^2
- SSWの計算式
- SSW = ∑_j ∑_i (X_{ij} - X̄_j)^2
- 全体平均
- 全データの平均値。X̄。
- 群平均
- 各群の平均値。X̄_j。
- 水準数
- 因子の水準の数(k)
- 総サンプルサイズ
- 全データ数(N)
- n_j
- 各群のサンプルサイズ(群ごとのデータ数)
- 平均平方
- 平方和を自由度で割った値。MS_W = SSW/df_W, MS_B = SSB/df_B
- 群内平均平方
- MS_W。群内の平均平方は、群内のばらつきを表します。
- 群間平均平方
- MS_B。群間の平均平方は、群間のばらつきを表します。
- F値
- F = MS_B / MS_W。帰無仮説が正しいときの統計量です。
- p値
- F値が得られる確率。小さいほど有意と判断され、帰無仮説を棄却します。
- η²
- 効果量の一つ。全変動に対する因子の寄与を表す指標(η² = SSB / SST など)。
- 部分η²
- 特定の因子の効果量を示す補正済みのη²。多因子設計で用いられます。
- ω²
- Omega squared。バイアス補正された効果量の一つで、実務上解釈されやすい値です。
- 全体平均 X̄
- 全データの平均値の別表現
- 相互作用効果
- 複数の因子が同時に影響を与え、効果が相互に依存する現象。



















