kruskal-wallis検定・とは？中学生にも分かる統計の基本共起語・同意語・対義語も併せて解説！

この記事を書いた人

高岡智則

年齢：33歳性別：男性職業：Webディレクター（兼ライティング・SNS運用担当）居住地：東京都杉並区・永福町の1LDKマンション出身地：神奈川県川崎市身長：176cm 体系：細身〜普通（最近ちょっとお腹が気になる）血液型：A型誕生日：1992年11月20日最終学歴：明治大学・情報コミュニケーション学部卒通勤：京王井の頭線で渋谷まで（通勤20分）家族構成：一人暮らし、実家には両親と2歳下の妹恋愛事情：独身。彼女は2年いない（本人は「忙しいだけ」と言い張る）

kruskal-wallis検定・とは？中学生にも分かる統計の基本

このページでは、kruskal-wallis検定の基本を、初心者でも分かるように丁寧に解説します。kruskal-wallis検定は、2つ以上の独立したグループの分布を比較する非パラメトリック検定の一つです。データが正規分布していない場合や、少ないサンプル数しかない場合でも適用できます。

この検定の目的は、母集団の分布が「同じかどうか」を判定することです。具体的には、{グループA,グループB,グループC}のいずれかに、他のグループと比べて特徴が異なる要素が存在するかを調べます。

なぜ非パラメトリックなのかを理解することも大切です。通常の分散分析（ANOVA）はデータが正規分布することを前提にしますが、kruskal-wallis検定は分布の形に対する厳密な前提が少なく、データを「順位」に置き換えて比較します。これにより、外れ値の影響を受けにくく、より頑健な判断ができます。

使い方のイメージと仮定

前提としては、独立した観測、尺度が少なくとも順序尺度であることが挙げられます。仮説は次の通りです。帰無仮説は「全グループの分布が同じ」で、対立仮説は「少なくとも1つのグループの分布が異なる」です。

実務では、データを排他的に3つ以上のグループに分け、全データを一括で順位付けします。各グループについて「そのグループの順位の和 Ri」を計算し、それを用いて検定統計量を求めます。以下に、計算のイメージと簡単な例を示します。

計算の考え方と式のイメージ

全体の観測数を N、各グループのデータ数を ni、グループ i の順位和を Ri とすると、検定統計量 H は次のようなイメージで求めます。

H 値の概略式：H = (12/(N(N+1))) × Σ(Ri^2 / ni) - 3(N+1)。

この式は グループ間の順位の差を取り出して、全体としてどのくらい分布が異なるかを示します。実際には同点（ties）がある場合には補正項が入ることがありますが、基本的な考え方は同じです。

具体的な例と解釈

以下は、3つのグループ A, B, C それぞれに 4 件ずつデータがあるときの簡易的な例です。データは次のとおりです。

グループ	データ	順位の和 Ri	データ数 ni
A	10, 12, 11, 9	26	4
B	7, 8, 7, 9	10.5	4
C	12, 13, 14, 15	41.5	4

このデータの全体の観測数は N = 12 です。Riの二乗をniで割った値を合計して、先ほどの式に当てはめると H の値が得られます。計算を簡略化すると、おおよそ H ≈ 9.2 となる場合が多く、自由度はグループの数 - 1 で 2 です。自由度が 2、H が約 9.2 以上なら p 値は約 0.01 程度となり、有意水準 0.05 より小さくなりやすいです。実際には、厳密な p 値を求めるために、統計ソフトで補正をかけて計算します。

結論の読み方としては、p値があらかじめ定めた有意水準（多くは 0.05）より小さければ、帰無仮説を棄却します。つまり「3つ以上のグループの分布は同じでない」と判断できます。複数のグループ間でどの組み合わせが差があるかを知るには、 Dunn検定などの事後検定を用いてグループ間の差を詳しく調べます。

実務での注意点と補足

・データに多くの同点があると補正が必要です。同点が多いと H の推定が少しずれてしまうことがあるため、補正をかけて p 値を算出します。

・サンプル数が極端に偏ると検定力が落ちるので、グループ間のサンプル数はなるべく揃えると良いです。

・kruskal-wallis検定は「どのグループがどのグループと差があるか」までは教えてくれません。差を把握したい場合は、事後検定を別途実施します。

まとめ

kruskal-wallis検定は、非パラメトリックな多群比較の基礎となる手法として、データが正規分布しているか不安な場面で活躍します。データを順位化してグループ間の違いを検出する考え方を覚え、必要に応じて事後検定を組み合わせると、現場のデータ分析がぐっと強くなります。

kruskal-wallis検定の同意語

クラスカル・ウォリス検定: Kruskal-Wallis検定の日本語表記の一つ。3グループ以上の独立したサンプルの中央値の差を、順位を用いて検定する非パラメトリック検定。
クラスカル-ウォリス検定: 同上。ハイフン表記の別表記。
Kruskal-Wallis検定: 英語名のままの表記。3群以上の独立サンプルの中央値の差を検定する非パラメトリック検定。
K-W検定: Kruskal-Wallis検定の略称。多群の順位和を比較する検定。
クラスカル・ウォリスの検定: クラスカル・ウォリス検定という名称の別表現。
順位和検定: 順位和に基づく検定の総称で、K-W検定として使われることが多い表現。
順位和に基づく検定: データの順位和に基づいて群間の差を検出する非パラメトリック検定の一つ。
順位和に基づく1要因分散分析: Kruskal-Wallis検定は“順位和に基づく1要因分散分析”として解釈されることがある表現。
非パラメトリック1要因分散分析: K-W検定を1要因の非パラメトリックな分散分析とみなす表現。
非パラメトリック検定で多群比較: 複数群を比較する非パラメトリック検定の代表例としてK-W検定を指す表現。

kruskal-wallis検定の対義語・反対語

パラメトリック検定: データが正規分布など特定の分布形状を前提として母集団のパラメータを推定して検定を行う手法の総称。Kruskal-Wallis検定の対義語として使われ、分布前提を満たすデータに対してはKWよりも効率的に検出力が高い場合が多いです。
一元配置分散分析（One-way ANOVA）: 3群以上のグループの平均値の差を検定する代表的なパラメトリック検定。正規性と等分散性の前提を満たす場合に使用します。KWの対になる検定として最もよく挙げられます。
独立標本t検定: 2つの独立したグループの平均値の差を検定するパラメトリック検定。データが近似的に正規分布し、分散が等しい前提を満たすときに適用します。KWの非パラメトリック版の対比として理解されます。
対応のあるt検定: 同じ対象を2条件で測定するなど、対応したデータ同士の平均差を検定するパラメトリック検定。正規性の前提を満たす必要があり、KWの対となるパラメトリック手法の代表例です。
Welchのt検定: 等分散性を仮定せずに2群間の平均差を検定するパラメトリック検定。分散が等しくない場合にも信頼性を保てる特徴があり、KWの対になるパラメトリック手法として参照されます。

kruskal-wallis検定の共起語

非パラメトリック検定: 分布の形を仮定せず、順位やスケールを用いて差を検出する検定の総称。
ウィルコクソン検定: 非パラメトリック検定の総称。2群間の差を順位で評価する検定の一つ。
Mann-Whitney U検定: 2群間の中央値の差を順位で検出する非パラメトリック検定。
順位データ: データを順位に変換して検定を行う際のデータの型。
順位和: 各群のデータの順位の合計。H統計量の計算に使われる。
データの独立性: 各サンプルは他の群から独立して収集される必要がある前提。
Kruskal-Wallis検定: 3群以上の独立したサンプルの中央値差を順位で検出する非パラメトリック検定。
群間比較: Kruskal-Wallis の結果が有意な場合、群間の差を個別に検定する作業。
Dunn検定: Kruskal-Wallis の事後検定として用いられる群間比較法の一つ。
事後検定: 検定結果が有意な場合に、どの群が差をつけるかを特定する検定。
ボンフェローニ補正: 複数比較を行う際の偽陽性を抑える補正法の代表例。
Holm補正: Bonferroniより検出力が高い段階的補正法。
検定統計量 H: Kruskal-Wallisで用いられる、群間の差を示す統計量。
自由度: 統計分布に対応する自由度。K-W検定では通常 k-1。
p値: 帰無仮説が正しいとしたときに、観測データが得られる確率。
有意水準: 棄却する閾値。多くは0.05が用いられる。
帰無仮説: 全ての群の中央値は等しい、という仮説。
対立仮説: 少なくとも1つの群の中央値が他と異なる、という仮説。
群数: 比較対象となるグループの数（k）。
k-1自由度: K-W検定の自由度。群数 minus 1。
効果量 ε²: 検定結果の実質的な大きさを表す指標。
η² (η-squared): 効果量の一つ。総変動に対する群間変動の割合を示す。
結合（ties）補正: 同値データがある場合にHの分布を補正する処理。
分布の形が同じ前提: 各群の分布の形が概ね等しいことを前提とする。
R言語の実装: kruskal.test関数など、統計ソフトRでの実装が一般的。
Pythonの実装: scipy.stats.kruskal など、Pythonでの実装が一般的。

kruskal-wallis検定の関連用語

kruskal-wallis検定: 3つ以上の独立した群の分布を比較する非パラメトリック検定。データを順位に変換して検定統計量Hを算出し、自由度k-1のカイ二乗分布でp値を求める。帰無仮説は「全ての群の分布が同じ」で、対立仮説は「少なくとも1群が他と異なる分布を持つ」。
Mann-Whitney U検定: 2つの独立した群を比較する非パラメトリック検定。データを順位付けしてU統計量を計算し、p値で群間の差を判定する。正規性の仮定は不要だが独立性が前提。
Wilcoxon順位和検定: Mann-Whitney検定と同様の2群比較の非パラメトリック法。順位和に基づく検定統計量を用い、p値を算出。
一元配置分散分析（ANOVA）: 正規分布と等分散を前提とする3つ以上の群の平均を比較するパラメトリック検定。F統計量を用い、p値で差の有無を判断する。
Friedman検定: 反復測定デザインなど、同一対象の3つ以上の条件を比較する非パラメトリック検定。順位付けをして検定を行う。
順位付け: データの大小関係を順位に置き換えること。Kruskal-Wallisでは全観測値を1からNまでの順位に置き換える。
順位和（R_i）: 各群ごとにその群のデータの順位の総和。H統計量の算出に使われる。
H統計量: Kruskal-Wallis検定の検定統計量。式は H = (12/(N(N+1))) Σ (R_i^2 / n_i) - 3(N+1)。Nは全データ数、n_iは群iのサンプル数、R_iは群iの順位和。
自由度: Kruskal-Wallisの自由度はk-1。kは比較する群の数。
p値: 帰無仮説が正しいと仮定したときに、観測データと同等以下の極端さになる確率。小さいほど有意とみなされる。
帰無仮説: 全ての群の分布が同じである、という仮説。
対立仮説: 少なくとも1つの群の分布が他と異なる、という仮説。
データの尺度: Kruskal-Wallisは順位付けが可能なデータ（順序尺度）なら適用可能。連続データでも正規性が不十分な場合に有効。
独立性の仮定: 各観測は独立していること。群間でデータの重複や依存がないこと。
同一分布の形状仮定: 分布の形状が各群でほぼ同じであるとき、KW検定は中央値の差を反映しやすい。形状が著しく異なると解釈が難しくなる。
有意水準（α）: 有意性を決める閾値。一般的には0.05が用いられる。
効果量: Kruskal-Wallisの効果量としてη^2やε^2を用いる。Hが大きいほど群間差が大きいと解釈できるが、効果量で実質的な大きさを示す。
η^2（エータ二乗）: KW検定の効果量の指標の一つ。分散の比率として表す。
ε^2（エプシロン二乗）: 小さなサンプルでも安定して解釈できる補正済みの効果量。
Dunn検定: Kruskal-Wallisの多群比較後に、どの群がどの群と異なるかを個別に検出するための事後検定。BonferroniやHolm補正と組み合わせる。
Bonferroni補正: 多重比較時のp値を単純にn倍して有意性を保つ補正法。検出力が下がることがある。
Holm–Bonferroni補正: 多重比較の誤検出を抑える、順序付きの段階的補正法。Bonferroniより検出力が高いことが多い。
多重比較問題: 複数の比較を同時に行うと全体の第一種過誤率が上がる問題。補正が必要。
欠損データの扱い: 欠損値がある場合は対応する群を除外するか、適切な方法で欠損を扱う必要がある。
ティー補正（Tie correction）: データ中に同じ値（結び）がある場合、H統計量を補正して分布を近似させる処理。
近似方法: 自由度k-1のカイ二乗分布を用いてp値を近似する方法。
ソフトウェア実装—R: R言語にはkruskal.testやdunnTestなどの実装があり、KW検定と事後検定を簡単に実行できる。
ソフトウェア実装—Python: scipy.stats.kruskalやpingouin.kruskalがKW検定を実行可能。データ可視化や補助検定も併用できる。
データ前処理: データの欠損・外れ値・欠測データの処理を行ってから検定を実施することが推奨される。