尤度比検定・とは?初心者のためのやさしい解説と使い方共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
尤度比検定・とは?初心者のためのやさしい解説と使い方共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


尤度比検定・とは?初心者向けガイド

尤度比検定とはデータがある仮説の妥当性を検証するための統計的手法です。データを最も合理的に説明するモデルと、特定の仮説のモデルとを比較して、どちらがデータをよりよく説明しているかを判断します。ここでは中学生にも分かるように、難しい数式をできるだけ平易に、例え話を交えて解説します。

1 尤度比検定とは何か

統計にはよく 推定検定 という二つの考え方があります。尤度比検定は検定の一つです。想定している仮説を H0 としましょう。例えば「新しい薬は従来薬と効果が同じだ」という仮説です。これに対して「新しい薬は従来薬より効果がある」という対立仮説 Ha を立てます。尤度比検定はデータがどちらの仮説のもとでより妥当かを、データから算出します。

ここでの「尤度」とは、観測されたデータが得られる確率のことです。データが得られる確率をパラメータとモデルの組み合わせで最大化した値を尤度と呼びます。

2 計算の基本アイデア

重要なアイデアは二つです。第一にデータを説明するモデルには パラメータ があり、H0 の下でのパラメータの取り方と、Ha の下での取り方を比べます。第二にデータがその仮説のもとで「どれだけうまく説明されるか」を、最大尤度で評価します。

Λ は次の定義です。

Λ = max_{θ が Θ0} L(θ) / max_{θ が Θ} L(θ)

ここで L(θ) はデータが θ というパラメータのもとで得られる尤度、Θ0 は仮説 H0 に対応するパラメータの集合、Θ はすべての可能なパラメータの集合です。

実務ではこの Λ から変換した 統計量 −2 log Λ を用います。-2 log Λ は大きくなるほど H0 から離れたデータであり、対立仮説 Ha のほうが適している可能性が高いと判断します。

3 判定の流れと自由度

計算の流れはシンプルです。手順として次を順に行います。

<th>手順
仮説を設定するH0とHaを決める
尤度の最大化データに最も適合するパラメータをH0とHaそれぞれで推定する
統計量の算出Λ を計算し−2 log Λ を求める
結論の判定自由度 df に対する χ²分布を用いてp値を確認し、有意水準と比較する

注意点として、サンプルサイズが大きいほど近似が正確になります。小さなデータではこの近似が崩れることがあるため、代替の検定やF検定などを検討することもあります。

4 具体的な例

例として、二項データの改善前後を比較する場合を考えます。治療前の成功率 p0 と治療後の成功率 p1 を同時に推定するモデルと、治療前の確率だけを用いるモデルを比較します。データがあるとき、H0 は「p0 と p1 は等しい」という仮定、Ha は「p0 と p1 は異なる」という仮定になります。データを使ってそれぞれのモデルの尤度を最大化し、-2 log Λ を求めます。自由度はパラメータの制約の差に等しく、この例では通常1次元の違いで df は1となることが多いです。得られた p値が小さい場合はH0を棄却し、Ha のほうがデータをよく説明していると判断します。

5 実務での活用とポイント

尤度比検定は、医療研究や社会科学、マーケティングのデータ分析など、さまざまな領域で使われます。モデルがネストしていること大きなサンプルサイズ仮定の適切性などが成立している場合に特に有効です。

要点をまとめると、尤度比検定はデータがどの仮説のもとで最も自然に説明されるかを、尤度最大尤度推定を組み合わせて評価する検定です。適切に使えば、二つのモデルの妥当性を客観的に比較する強力なツールになります。

補足情報

実務ではRやPythonの統計ライブラリで簡単に実施できます。例えばRのlrtestやPythonのstatsmodels ライブラリを使えば、−2 log Λ の値とp値を自動計算できます。


尤度比検定の同意語

尤度比検定
データが2つのモデルのうちどちらにより適合するかを、尤度の比を使って判定する検定。 nestされたモデルの比較などでよく用いられ、検定統計量は -2 × log(尤度比) で表され、χ²分布に近似して有意性を判断します。
最大尤度比検定
2つ以上のモデルの中で、尤度が最大になるモデルを基準としてその比を検定します。最も適合するモデルを選ぶ目的の検定です。
最尤比検定
最尤法に基づく尤度比検定の別称。2つの仮説を尤度比で比較して、有意性を判断します。
対数尤度比検定
尤度比の対数を用いて検定を行う方法。対数をとることで計算が安定し、-2 × log(Λ) が χ²分布に近似することが多いです。
LRT
Likelihood Ratio Test の略称。文献でよく使われる呼び方で、2つのモデルの適合度を比較する検定です。

尤度比検定の対義語・反対語

推定
尤度比検定が仮説の成否を判断する検定であるのに対し、推定は母集団パラメータの値そのものや不確実性を推し量る手法です。
区間推定
パラメータの取りうる範囲を信頼区間として表す方法。検定の判定ではなく、値の不確実性を示します。
最尤推定
データが最も尤もらしく説明されるパラメータを求める点推定の代表。検定の役割ではなく、パラメータの推定を目的とします。
ベイズ推定
事前情報とデータから事後分布を算出し、パラメータの不確実性を確率的に表現する推定法。頻度主義の仮説検定とは異なる枠組みです。
記述統計
データの要約・傾向を示す統計手法で、仮説検定やパラメトリック推定の結論を直接出すことは少ない。データの説明・要約が目的です。
探索的データ分析 (EDA)
データを視覚化・要約してパターンを探る手法。仮説検定を前提とせず、データの特徴を把握する前処理的手法です。

尤度比検定の共起語

尤度比検定
2つのモデルの尤度を比較して、データにどちらがより適合しているかを検定する仮説検定。通常は入れ子関係(ネストしたモデル)で用いられる。
対数尤度
データが観測されたときの尤度の対数。計算を安定させ、LR検定の基礎となる量。
最尤推定
データが観測される確率を最大にするパラメータを推定する方法。LR検定ではこの推定値を用いる。
対数尤度比
2つのモデルの対数尤度の差。LR検定の核となる検定量を作る。
検定統計量
検定の結論を出すための数値指標。LR検定では対数尤度比やG^2が用いられる。
G^2
尤度比検定で使われる検定統計量。式はG^2 = -2 log(L0/L1)の形。
自由度
2つのモデル間のパラメータ数の差。カイ二乗分布の分布形を決定する要素。
カイ二乗分布
大標本近似において用いられる分布。LR検定の統計量は自由度dfのカイ二乗分布に従うと近似されることが多い。
大標本近似
標本サイズが十分大きいとき、検定統計量の分布を理論分布で近似できる性質。
帰無仮説
比較の基準となる仮説。LR検定では通常“制限のあるモデルが正しい”とする仮説を置く。
対立仮説
帰無仮説と対立する仮説。LR検定では“制限のないモデルがデータにより適合する”など。
ネストモデル
一方のモデルが他方を制限・包含する入れ子構造のモデル。比較の対象となる。
モデル比較
複数の統計モデルの適合度を比較し、データに最も適したモデルを選ぶ作業。
尤度関数
データが観測された確率をパラメータの関数として表す関数。
尤度比
2つの尤度の比。LR検定の基本量として用いられる。
p値
観測された検定統計量が、帰無仮説の下で得られる確率。小さいほど棄却しやすい。
有意水準
検定で棄却の基準となる閾値。例:0.05。
Wald検定
推定量とその分散を使って検定する方法。LR検定とは別のアプローチ
Score検定
勾配(スコア)を用いて検定する方法。LR検定と並ぶ三大検定の一つとして扱われることがある。
カイ二乗検定
カイ二乗統計量を用いてデータとモデルの適合を評価する検定。LR検定の大標本近似として使われることがある。
適合度
データがモデルにどれだけ適合しているかの程度。適合度が高いほどモデルがデータに近いと判断される。

尤度比検定の関連用語

尤度比検定
データの尤度を、より簡単な帰無モデルと、それより複雑な代替モデルの2つで比較する統計検定です。二つのモデルはネストされている必要があり、検定統計量は -2 log(L0/L1) または 2(logL1 − logL0) となります。自由度は両モデルのパラメータ数の差に等し、大標本ではこの統計量が差分の自由度のカイ二乗分布に従うという近似が使われます。
尤度
観測データが得られる確率のこと。パラメータが固定されているときデータが起こる“適合の良さ”を表します。
尤度関数
データとパラメータの組み合わせに対してデータが観測される確率(尤度)を返す関数です。一般に独立かつ同じ分布に従うデータでは L(θ) = ∏ f(x_i; θ) の形をとります。
対数尤度
尤度の対数をとった値。計算の安定性が高く、最尤推定や LR 検定などで広く用いられます。
最尤推定
データが観測される確率(尤度)を最大にするパラメータを求める推定法です。モデル比較や信頼区間の基礎になります。
対数尤度の差
二つのモデルの logL の差。LRT ではこの差を用いてどのモデルがデータをよりよく説明するかを判断します。
逸脱度
GLM などで用いられる、モデルの適合度を表す指標。通常は小さいほど良く、LR 検定の統計量として使われることが多いです。
自由度の差
比較対象の二つのモデルで増減するパラメータ数の差。カイ二乗分布の自由度としてLR検定の検定に用いられます。
カイ二乗分布
検定統計量が従うことが多い確率分布。大標本近似の下で、自由度 df に対応する形で用いられます。
ウィルクスの定理
大標本条件のもと、-2 log L0/L1 の分布が自由度 df のカイ二乗分布に近づく、という理論です。これが LR 検定の基本的な分布仮定になります。
検定統計量
LR 検定で用いられる数値。一般には D = -2 log L0 + 2 log L1(または D = -2 log(L0/L1))として定義します。
棄却域
有意水準 α に基づき、検定統計量がこの域に入れば帰無仮説を棄却します。カイ二乗分布の臨界値や p値を用いて決定します。
p値
観測された検定統計量以上に“極端”な値が見られる確率。小さいほど帰無仮説を否定する証拠が強いと判断します。
有意水準
棄却を決める閾値。一般的には 0.05 や 0.01 などが用いられます。
帰無仮説
単純な、ある制約を満たすモデルがデータを説明できる、という仮説です。LR検定ではこの仮説を検証します。
対立仮説
より複雑なモデルがデータを説明できる、という仮説です。帰無仮説が偽であるとき成立します。
ネストモデル
より簡単なモデルが、より複雑なモデルの特殊ケースとして含まれる関係のこと。LR検定はネストモデル間の比較に適しています。
検定の前提条件
独立性・同分布・正規性など、LR検定の妥当性を保証する条件のこと。これらが崩れると分布近似の信頼性が低下します。
非ネストモデル比較
二つのモデルが互いにネストしていない場合の比較。LR 検定は原則適用できず、代わりの検定(Vuong 検定など)が使われます。
Vuong検定
非ネストモデル間の比較を行う統計検定の一つ。LR検定が使えない場合の代替として利用されることがあります。
情報量規準(AIC/BIC)
モデルの適合度とパラメータ数のトレードオフを数値化する指標。LR 検定と併せてモデル選択に用いられることがあります。
ブートストラップによるLR検定
標本を再標本化してLR検定の分布を推定する方法。サンプルサイズが小さい場合や前提が厳密でない場合に有効です。
大標本近似
サンプルサイズが十分大きいと、LR検定の統計量がカイ二乗分布に従うという近似が成立します。

尤度比検定のおすすめ参考サイト


学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
2132viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
835viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
714viws
座標計算・とは?初心者向けガイドで完全マスター共起語・同意語・対義語も併せて解説!
688viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
582viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
564viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
558viws
k型熱電対とは?初心者にも分かる基礎解説と活用事例共起語・同意語・対義語も併せて解説!
528viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
523viws
大辞林とは?初心者にもわかる日本語辞典の使い方と特徴共起語・同意語・対義語も併せて解説!
500viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
481viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
463viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
454viws
気圧の単位とは?中学生にもわかるPa・atm・bar・Torrの違いと換算ガイド共起語・同意語・対義語も併せて解説!
446viws
励磁回路とは?初心者にもわかる基礎解説と仕組みの全体像共起語・同意語・対義語も併せて解説!
434viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
430viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
403viws
摘要とは?初心者にも分かる意味と書き方ガイド共起語・同意語・対義語も併せて解説!
399viws
r134aとは?初心者向けガイド|エアコン冷媒の基本をやさしく解説共起語・同意語・対義語も併せて解説!
387viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
376viws

新着記事

学問の関連記事