

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
尤度比検定・とは?初心者向けガイド
尤度比検定とはデータがある仮説の妥当性を検証するための統計的手法です。データを最も合理的に説明するモデルと、特定の仮説のモデルとを比較して、どちらがデータをよりよく説明しているかを判断します。ここでは中学生にも分かるように、難しい数式をできるだけ平易に、例え話を交えて解説します。
1 尤度比検定とは何か
統計にはよく 推定 と 検定 という二つの考え方があります。尤度比検定は検定の一つです。想定している仮説を H0 としましょう。例えば「新しい薬は従来薬と効果が同じだ」という仮説です。これに対して「新しい薬は従来薬より効果がある」という対立仮説 Ha を立てます。尤度比検定はデータがどちらの仮説のもとでより妥当かを、データから算出します。
ここでの「尤度」とは、観測されたデータが得られる確率のことです。データが得られる確率をパラメータとモデルの組み合わせで最大化した値を尤度と呼びます。
2 計算の基本アイデア
重要なアイデアは二つです。第一にデータを説明するモデルには パラメータ があり、H0 の下でのパラメータの取り方と、Ha の下での取り方を比べます。第二にデータがその仮説のもとで「どれだけうまく説明されるか」を、最大尤度で評価します。
Λ は次の定義です。
Λ = max_{θ が Θ0} L(θ) / max_{θ が Θ} L(θ)
ここで L(θ) はデータが θ というパラメータのもとで得られる尤度、Θ0 は仮説 H0 に対応するパラメータの集合、Θ はすべての可能なパラメータの集合です。
実務ではこの Λ から変換した 統計量 −2 log Λ を用います。-2 log Λ は大きくなるほど H0 から離れたデータであり、対立仮説 Ha のほうが適している可能性が高いと判断します。
3 判定の流れと自由度
計算の流れはシンプルです。手順として次を順に行います。
| 仮説を設定するH0とHaを決める | |
| 尤度の最大化 | データに最も適合するパラメータをH0とHaそれぞれで推定する |
| 統計量の算出 | Λ を計算し−2 log Λ を求める |
| 結論の判定 | 自由度 df に対する χ²分布を用いてp値を確認し、有意水準と比較する |
注意点として、サンプルサイズが大きいほど近似が正確になります。小さなデータではこの近似が崩れることがあるため、代替の検定やF検定などを検討することもあります。
4 具体的な例
例として、二項データの改善前後を比較する場合を考えます。治療前の成功率 p0 と治療後の成功率 p1 を同時に推定するモデルと、治療前の確率だけを用いるモデルを比較します。データがあるとき、H0 は「p0 と p1 は等しい」という仮定、Ha は「p0 と p1 は異なる」という仮定になります。データを使ってそれぞれのモデルの尤度を最大化し、-2 log Λ を求めます。自由度はパラメータの制約の差に等しく、この例では通常1次元の違いで df は1となることが多いです。得られた p値が小さい場合はH0を棄却し、Ha のほうがデータをよく説明していると判断します。
5 実務での活用とポイント
尤度比検定は、医療研究や社会科学、マーケティングのデータ分析など、さまざまな領域で使われます。モデルがネストしていること、大きなサンプルサイズ、仮定の適切性などが成立している場合に特に有効です。
要点をまとめると、尤度比検定はデータがどの仮説のもとで最も自然に説明されるかを、尤度と最大尤度推定を組み合わせて評価する検定です。適切に使えば、二つのモデルの妥当性を客観的に比較する強力なツールになります。
補足情報
実務ではRやPythonの統計ライブラリで簡単に実施できます。例えばRのlrtestやPythonのstatsmodels ライブラリを使えば、−2 log Λ の値とp値を自動計算できます。
尤度比検定の同意語
- 尤度比検定
- データが2つのモデルのうちどちらにより適合するかを、尤度の比を使って判定する検定。 nestされたモデルの比較などでよく用いられ、検定統計量は -2 × log(尤度比) で表され、χ²分布に近似して有意性を判断します。
- 最大尤度比検定
- 2つ以上のモデルの中で、尤度が最大になるモデルを基準としてその比を検定します。最も適合するモデルを選ぶ目的の検定です。
- 最尤比検定
- 最尤法に基づく尤度比検定の別称。2つの仮説を尤度比で比較して、有意性を判断します。
- 対数尤度比検定
- 尤度比の対数を用いて検定を行う方法。対数をとることで計算が安定し、-2 × log(Λ) が χ²分布に近似することが多いです。
- LRT
- Likelihood Ratio Test の略称。文献でよく使われる呼び方で、2つのモデルの適合度を比較する検定です。
尤度比検定の対義語・反対語
- 推定
- 尤度比検定が仮説の成否を判断する検定であるのに対し、推定は母集団パラメータの値そのものや不確実性を推し量る手法です。
- 区間推定
- パラメータの取りうる範囲を信頼区間として表す方法。検定の判定ではなく、値の不確実性を示します。
- 最尤推定
- データが最も尤もらしく説明されるパラメータを求める点推定の代表。検定の役割ではなく、パラメータの推定を目的とします。
- ベイズ推定
- 事前情報とデータから事後分布を算出し、パラメータの不確実性を確率的に表現する推定法。頻度主義の仮説検定とは異なる枠組みです。
- 記述統計
- データの要約・傾向を示す統計手法で、仮説検定やパラメトリック推定の結論を直接出すことは少ない。データの説明・要約が目的です。
- 探索的データ分析 (EDA)
- データを視覚化・要約してパターンを探る手法。仮説検定を前提とせず、データの特徴を把握する前処理的手法です。
尤度比検定の共起語
- 尤度比検定
- 2つのモデルの尤度を比較して、データにどちらがより適合しているかを検定する仮説検定。通常は入れ子関係(ネストしたモデル)で用いられる。
- 対数尤度
- データが観測されたときの尤度の対数。計算を安定させ、LR検定の基礎となる量。
- 最尤推定
- データが観測される確率を最大にするパラメータを推定する方法。LR検定ではこの推定値を用いる。
- 対数尤度比
- 2つのモデルの対数尤度の差。LR検定の核となる検定量を作る。
- 検定統計量
- 検定の結論を出すための数値指標。LR検定では対数尤度比やG^2が用いられる。
- G^2
- 尤度比検定で使われる検定統計量。式はG^2 = -2 log(L0/L1)の形。
- 自由度
- 2つのモデル間のパラメータ数の差。カイ二乗分布の分布形を決定する要素。
- カイ二乗分布
- 大標本近似において用いられる分布。LR検定の統計量は自由度dfのカイ二乗分布に従うと近似されることが多い。
- 大標本近似
- 標本サイズが十分大きいとき、検定統計量の分布を理論分布で近似できる性質。
- 帰無仮説
- 比較の基準となる仮説。LR検定では通常“制限のあるモデルが正しい”とする仮説を置く。
- 対立仮説
- 帰無仮説と対立する仮説。LR検定では“制限のないモデルがデータにより適合する”など。
- ネストモデル
- 一方のモデルが他方を制限・包含する入れ子構造のモデル。比較の対象となる。
- モデル比較
- 複数の統計モデルの適合度を比較し、データに最も適したモデルを選ぶ作業。
- 尤度関数
- データが観測された確率をパラメータの関数として表す関数。
- 尤度比
- 2つの尤度の比。LR検定の基本量として用いられる。
- p値
- 観測された検定統計量が、帰無仮説の下で得られる確率。小さいほど棄却しやすい。
- 有意水準
- 検定で棄却の基準となる閾値。例:0.05。
- Wald検定
- 推定量とその分散を使って検定する方法。LR検定とは別のアプローチ。
- Score検定
- 勾配(スコア)を用いて検定する方法。LR検定と並ぶ三大検定の一つとして扱われることがある。
- カイ二乗検定
- カイ二乗統計量を用いてデータとモデルの適合を評価する検定。LR検定の大標本近似として使われることがある。
- 適合度
- データがモデルにどれだけ適合しているかの程度。適合度が高いほどモデルがデータに近いと判断される。
尤度比検定の関連用語
- 尤度比検定
- データの尤度を、より簡単な帰無モデルと、それより複雑な代替モデルの2つで比較する統計検定です。二つのモデルはネストされている必要があり、検定統計量は -2 log(L0/L1) または 2(logL1 − logL0) となります。自由度は両モデルのパラメータ数の差に等し、大標本ではこの統計量が差分の自由度のカイ二乗分布に従うという近似が使われます。
- 尤度
- 観測データが得られる確率のこと。パラメータが固定されているときデータが起こる“適合の良さ”を表します。
- 尤度関数
- データとパラメータの組み合わせに対してデータが観測される確率(尤度)を返す関数です。一般に独立かつ同じ分布に従うデータでは L(θ) = ∏ f(x_i; θ) の形をとります。
- 対数尤度
- 尤度の対数をとった値。計算の安定性が高く、最尤推定や LR 検定などで広く用いられます。
- 最尤推定
- データが観測される確率(尤度)を最大にするパラメータを求める推定法です。モデル比較や信頼区間の基礎になります。
- 対数尤度の差
- 二つのモデルの logL の差。LRT ではこの差を用いてどのモデルがデータをよりよく説明するかを判断します。
- 逸脱度
- GLM などで用いられる、モデルの適合度を表す指標。通常は小さいほど良く、LR 検定の統計量として使われることが多いです。
- 自由度の差
- 比較対象の二つのモデルで増減するパラメータ数の差。カイ二乗分布の自由度としてLR検定の検定に用いられます。
- カイ二乗分布
- 検定統計量が従うことが多い確率分布。大標本近似の下で、自由度 df に対応する形で用いられます。
- ウィルクスの定理
- 大標本条件のもと、-2 log L0/L1 の分布が自由度 df のカイ二乗分布に近づく、という理論です。これが LR 検定の基本的な分布仮定になります。
- 検定統計量
- LR 検定で用いられる数値。一般には D = -2 log L0 + 2 log L1(または D = -2 log(L0/L1))として定義します。
- 棄却域
- 有意水準 α に基づき、検定統計量がこの域に入れば帰無仮説を棄却します。カイ二乗分布の臨界値や p値を用いて決定します。
- p値
- 観測された検定統計量以上に“極端”な値が見られる確率。小さいほど帰無仮説を否定する証拠が強いと判断します。
- 有意水準
- 棄却を決める閾値。一般的には 0.05 や 0.01 などが用いられます。
- 帰無仮説
- 単純な、ある制約を満たすモデルがデータを説明できる、という仮説です。LR検定ではこの仮説を検証します。
- 対立仮説
- より複雑なモデルがデータを説明できる、という仮説です。帰無仮説が偽であるとき成立します。
- ネストモデル
- より簡単なモデルが、より複雑なモデルの特殊ケースとして含まれる関係のこと。LR検定はネストモデル間の比較に適しています。
- 検定の前提条件
- 独立性・同分布・正規性など、LR検定の妥当性を保証する条件のこと。これらが崩れると分布近似の信頼性が低下します。
- 非ネストモデル比較
- 二つのモデルが互いにネストしていない場合の比較。LR 検定は原則適用できず、代わりの検定(Vuong 検定など)が使われます。
- Vuong検定
- 非ネストモデル間の比較を行う統計検定の一つ。LR検定が使えない場合の代替として利用されることがあります。
- 情報量規準(AIC/BIC)
- モデルの適合度とパラメータ数のトレードオフを数値化する指標。LR 検定と併せてモデル選択に用いられることがあります。
- ブートストラップによるLR検定
- 標本を再標本化してLR検定の分布を推定する方法。サンプルサイズが小さい場合や前提が厳密でない場合に有効です。
- 大標本近似
- サンプルサイズが十分大きいと、LR検定の統計量がカイ二乗分布に従うという近似が成立します。
尤度比検定のおすすめ参考サイト
- 尤度比検定とは?わかりやすく解説|カイ2乗分布との関わり
- 尤度比検定とは - Support - Minitab
- 尤度とは | リサーチ・市場調査ならクロス・マーケティング
- 尤度比検定とは - Support - Minitab



















