

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
はじめに
このページではフィッシャーの正確検定について、初心者にも分かるようにやさしく解説します。統計の話は難しそうに見えますが、基本を押さえれば誰でも理解できます。
フィッシャーの正確検定とは
フィッシャーの正確検定は、2つのカテゴリ変数が独立かどうかを判定する検定です。とくにデータの母集団が小さいときに信頼できる検定として用いられます。観測データをもとに、「観測値が偶然起こる確率(p値)」を計算して、独立かどうかを判断します。この検定の名前は、統計学者のフィッシャーにちなんでいますが、ここでの目的は「データの関係を正確に評価する方法」を知ることです。表の形を理解したうえで、いよいよ計算の仕組みに入っていきます。
データの形と前提
使うデータは2×2 の表です。横軸と縦軸にカテゴリがあり、4つのセルに数値が入ります。例えば次の表を考えます。
| 曝露あり | 曝露なし | 合計 | |
|---|---|---|---|
| 病気あり | 2 | 1 | 3 |
| 病気なし | 8 | 9 | 17 |
| 合計 | 10 | 10 | 20 |
検定の考え方
この検定では、固定された行と列の合計のもとで、観測された値が生まれる確率をすべて数え上げます。観測データと同じかそれより「極端」とみなせる表の確率をP値として足し合わせます。
実際の計算の流れ
手計算は難しいので、通常は統計ソフトを使います。概略は次の通りです。
1) 観測データから 2×2 表を決めます。a、b、c、d と表します。
2) a の取りうる値は、行と列の合計を保った範囲で変化します。
3) 各場合の確率は 超幾何分布 の式を使って計算します。これらの確率を足し合わせ、p値を決めます。
4) 得られた p値が、設定した有意水準より小さければ「差がある」と判断します。小さなデータでは、近似検定(例: カイ二乗検定)は適さないことがあります。
例題
次の表を使って考えます。以下は使いやすい例です。
| 曝露あり | 曝露なし | 合計 | |
|---|---|---|---|
| 病気あり | 2 | 1 | 3 |
| 病気なし | 8 | 9 | 17 |
| 合計 | 10 | 10 | 20 |
この例では、p値を正確に計算するには統計ソフトが必要です。ここでは考え方を中心に説明します。
注意点
・サンプルサイズが小さい場合に有効… 2×2 のデータで、期待度が小さくなると、カイ二乗検定は近似精度が落ちます。
・名目データの独立性… 項目の関連性を測る検定です。因果関係を直接示すものではありません。
よくある誤解
・フィッシャーの正確検定は「計算が単純」なわけではない。ソフトを使うのが普通。
・「大きいデータにも適用できる」わけではない。データが大きい場合は近似検定を使うことが多い。
まとめ
フィッシャーの正確検定は、2×2 の表を用いて、独立かどうかを“正確に”検定する方法です。データが小さいときに力を発揮します。使い方や解釈のコツを押さえ、ソフトで計算することを前提に理解を深めましょう。
フィッシャーの正確検定の同意語
- フィッシャーの正確検定
- 2x2分割表の独立性を、観測値が取り得る全ての場合の確率を厳密に計算して検定する方法。サンプルサイズが小さく、カイ二乗検定の近似が適さない場合に用いられる代表的な厳密検定。
- フィッシャーの厳密検定
- フィッシャーの正確検定と同義。検定の厳密性を強調する日本語表現で、2x2分割表の独立性を厳密に評価します。
- フィッシャーの正確確率検定
- Fisher's exact test の別称。検定における確率の計算を“正確”に行うことを強調した表現。
- フィッシャー厳密検定
- フィッシャーの正確検定の別表現。2x2表の独立性を厳密に評価する検定を指します。
- フィッシャー検定
- Fisher's exact test の略称的表現として用いられることがあり、文脈次第でこの検定を指すことが多い名称。
- 2x2分割表の厳密検定
- 2×2の分割表に対して行う厳密検定。小サンプル時にFisher検定が使われることを示します。
- 2x2分割表のフィッシャー検定
- 2×2表に適用するFisher's exact test の表現。検定の具体名としてよく用いられます。
- Fisher's exact test
- 英語名称。そのまま文献やデータ分析ソースで用いられる正式名称。小サンプルでの独立性検定を指します。
- Fisher exact probability test
- 英語の別表現。検定の根拠となる確率を厳密に算出する点を強調する言い方。
フィッシャーの正確検定の対義語・反対語
- カイ二乗検定
- 2x2表を含むカテゴリデータを大標本近似のカイ二乗分布で検定する方法。サンプルサイズが大きい場合に、フィッシャーの正確検定の代替としてよく用いられる。
- Yatesの連続性補正付きカイ二乗検定
- 2x2表に対するカイ二乗検定で、観測値の連続性の偏りを補正して近似精度を高める方法。小規模データでは近似精度の改善を狙うが、厳密には近似検定。
- 尤度比検定(G検定)
- カテゴリデータの独立性や適合度を検定する、尤度比に基づく検定。Fisherの正確検定の代替案として使われることがある。
- 大標本近似検定
- サンプルサイズが十分大きい場合に、正確検定の代わりに近似分布(主にカイ二乗分布)を用いて検定する総称。Fisherの正確検定とは異なる近似法。
- 二項検定(割合の検定)
- 1つの母比率について仮説検定を行う方法。2x2表の独立性検定とは別の状況で使われることが多いが、場合によって比較対象として挙げられることもある。
フィッシャーの正確検定の共起語
- p値
- 検定の結果として得られる有意性を示す確率。観測データが帰無仮説の下でこの程度以上に極端になる確率です。
- 有意水準
- 検定で帰無仮説を棄却するための閾値。通常は0.05が用いられます。
- 2x2表
- 二つのカテゴリを縦横に並べた表。フィッシャーの正確検定の基本データ形式です。
- 2x2分割表
- 2x2表と同義。データを2つのカテゴリで分けた表です。
- 厳密検定
- データ全組み合わせを列挙して正確なp値を算出する検定。小標本で用いられます。
- 超幾何分布
- 観測データが条件付きで従う分布。フィッシャー検定の理論背景となる分布です。
- 帰無仮説
- 差がない、効果がない、偶然だけで説明できるとする仮説です。
- 対立仮説
- 帰無仮説に対立する仮説。差がある、効果がある、などを主張します。
- 仮説検定
- 帰無仮説と対立仮説を検証する統計的手法の総称です。
- オッズ比
- 2x2表における効果の指標。治療の効果や関連性の強さを示します。
- 信頼区間
- 推定値の不確実性を表す区間。オッズ比の信頼区間などが報告されます。
- 検定統計量
- Fisher検定で使われる統計量の総称。具体的にはp値計算の基礎となる量です。
- R
- 統計解析用のプログラミング言語。fisher.test などで実装できます。
- fisher.test
- Rでフィッシャーの正確検定を実行する関数。2x2表を入力してp値とオッズ比を返します。
- SPSS
- 統計解析ソフト。Fisherの正確検定を実行可能。
- Python
- Pythonでも統計処理が可能。scipy.stats.fisher_exact などで実装します。
- scipy.stats.fisher_exact
- SciPyの関数。2x2表からp値とオッズ比を算出します。
- 両尾検定
- フィッシャー検定は通常、両尾検定として解釈されます。
- 小標本
- サンプルサイズが小さいデータ。フィッシャーの正確検定が適している場合が多いです。
- 連続性補正
- カイ二乗検定で使われる補正。Fisher検定と比較されることがあります。
フィッシャーの正確検定の関連用語
- フィッシャーの正確検定
- 2x2分割表の独立性を厳密に検定する統計検定。小標本でも正確なp値を算出できる。
- 2x2分割表
- 二つのカテゴリを行と列で区切って並べた表。検定対象となるデータの基本形。
- 超幾何分布
- 固定された行・列の合計の下での成功数の分布。フィッシャー検定の確率計算の基盤。
- 条件付き確率
- 行と列の合計を固定した条件付きでの確率分布に基づく検定の考え方。
- 帰無仮説
- 「2つのカテゴリ間に関連がない(独立である)」という仮説。
- 対立仮説
- 「2つのカテゴリ間に関連がある(依存している)」という仮説。
- p値
- 観測データが帰無仮説の下で起こる確率を示す指標。小さいほど有意とされる。
- 片側検定
- 効果の方向性を一方に限定して検定する方法。
- 両側検定
- 効果の方向に関係なく極端さを評価する検定。
- 独立性の検定
- 二つの変数が独立かどうかを評価する検定の総称。フィッシャー検定はその一種。
- オッズ比
- 2x2表での効果の大きさを示す指標。1を中心に関連の有無が判断される。
- 信頼区間
- 推定値の不確実性を表す範囲。オッズ比や比率などの推定値にも適用される。
- 小標本
- サンプル数が少ない場合に殊に厳密検定が有効な状況。
- χ二乗検定との比較
- 大標本での近似検定で、フィッシャー検定は小標本で厳密なp値を提供。
- McNemar検定
- 対応のある2x2表の検定。場合によってはフィッシャー検定の代替として用いられる。
- 自由度
- 検定で用いられる分布の自由度。2x2表では通常1自由度。
- RxC分割表への適用
- 2x2以外のRxC表にも適用される場合があるが、計算が複雑になる。
- Haldane-Anscombe補正
- ゼロセルがある場合のオッズ比推定を安定させる補正手法。
- 有意水準(alpha)
- 帰無仮説を棄却する基準となる閾値。よく使われる値は0.05。
- 有意性の前提と注意点
- 検定はデータの独立性・無作為抽出などの前提に依存します。
- Rのfisher.test
- R言語でフィッシャーの正確検定を実行する関数。
- Pythonのscipy.stats.fisher_exact
- Pythonでフィッシャーの正確検定を実行する関数。
- Yatesの連続性補正
- 2x2表のχ二乗検定時に用いられる補正で、近似を改善する目的で使われる。



















