wald検定・とは？初心者が押さえるべき基本と使い方ガイド共起語・同意語・対義語も併せて解説！

この記事を書いた人

高岡智則

年齢：33歳性別：男性職業：Webディレクター（兼ライティング・SNS運用担当）居住地：東京都杉並区・永福町の1LDKマンション出身地：神奈川県川崎市身長：176cm 体系：細身〜普通（最近ちょっとお腹が気になる）血液型：A型誕生日：1992年11月20日最終学歴：明治大学・情報コミュニケーション学部卒通勤：京王井の頭線で渋谷まで（通勤20分）家族構成：一人暮らし、実家には両親と2歳下の妹恋愛事情：独身。彼女は2年いない（本人は「忙しいだけ」と言い張る）

wald検定とは？基本の考え方

wald検定は統計学の中でよく使われる仮説検定の方法の一つです。難しそうに見えますが、考え方はとてもシンプルです。あるパラメータが特定の値と等しいかどうかを、サンプルデータから推定して判断します。

具体的には回帰分析や一般化線形モデルの係数が 0 かどうかを評価するシーンでよく出てきます。wald検定は推定された係数の値と仮説で仮定する値との距離を、係数の不確かさの度合いで割って検定します。

どういうとき使うのか

係数が 0 であるという仮説を検定したいときに使います。たとえば薬の効果を調べる研究で治療の効果が統計的にあるかを判断する場面や、ある要因が売上に影響を与えるかを検証する場面で活躍します。

仕組みのイメージ

推定量とその標準誤差を使って検定統計量を作ります。大まかには、推定量が仮説の値からどれだけ外れているかを、推定量のばらつきで割った値を使います。値が大きいほど仮説が間違っている可能性が高いと判断します。

公式のざっくり解説

Wald統計量は、推定量と仮説値の差を推定量の分散で割ったものです。仮説が θ0 であり推定量が θ̂ の場合、Wald統計量 W は次の考え方で使われます。実務では W が大きいほど p値が小さくなり、有意性が高いと判断します。

簡単な例

線形回帰の係数を検定したい場合、β を検定します。β̂ とその標準誤差 SE(β̂) を使い検定統計量を構成します。片側検定と両側検定の考え方はZ検定と同じです。β̂ が 0 であるという仮説に対して有意性を判断します。

計算のイメージ

数値の例を挙げます。β̂ = 0.45、SE(β̂) = 0.15 のとき、以下のように判断します。

<th>項目

値
β̂	0.45
SE(β̂)	0.15
Wald統計量	9.0
p値の近似	約 0.003

どのくらいのデータで信頼できるか

Wald検定は大きなサンプルサイズでの近似に依存します。サンプル数が少ないと推定量の分布が正規分布に近づかず、Wald統計量の精度が落ちます。その場合は別の検定方法を検討します。

実務での使い方のヒント

統計ソフトを使うときは結果の中の係数と標準誤差を確認し、Wald統計量と対応する p値を読み取ります。複数の係数を同時に検定する場合は多重性の問題にも注意します。解釈のポイントは「仮説が正しくない可能性を p値でどれだけ低くするか」という感覚です。

wald検定の同意語

wald検定: 統計学の仮説検定の一種。推定量の分布を利用して、パラメータの仮説が成り立つかを判断します。大標本近似では推定量の分布を正規分布で近似するのが特徴で、尤度比検定やスコア検定と並ぶ三大検定の一つとして使われます。
Wald検定: wald検定と同じ意味の表記。英語表記の名称で、推定量の標準誤差を用いて仮説を検定します。大標本近似に基づく仮説検定です。
ウォルド検定: Wald検定の日本語読みの別表記。意味は同じ。パラメータの有意性を評価するための検定の一つです。
Waldテスト: Wald検定の別表現。検定の考え方は同じで、パラメータ仮説の検証に用います。

wald検定の対義語・反対語

尤度比検定（Likelihood Ratio Test, LR検定）: Wald検定と同じく仮説の有意性を評価する検定手法の一つですが、モデルの尤度の比を使って検定統計量を作成します。サンプル数が大きい場合に安定して機能し、Wald検定の対となる代替手段としてよく挙げられます。
スコア検定（Score Test / Lagrange Multiplier Test）: MLEを全て求めることなく、勾配情報だけで仮説の有意性を評価する検定。Wald検定の代替として使われることが多く、特にパラメータ推定が不安定な状況で有効な場合があります。
非パラメトリック検定（Non-parametric tests）: Wald検定はパラメトリックな前提に基づく検定の代表格です。その対義語として非パラメトリック検定が挙げられ、分布形状の仮定を緩めて検定を行います。代表例にはマン・ホイットニーのU検定や符号順位検定などがあります。
ベイズ検定（Bayesian testing）: 事前情報を取り入れて仮説の確からしさを評価するベイズ統計の検定。頻度論的なWald検定とは異なる枠組みで、対概念として理解されることがあります。

wald検定の共起語

仮説検定: 統計的仮説を検証する手法の総称。Wald検定は仮説検定の一種で、モデルの係数が有意かを判断します。
標準誤差: 推定量のばらつきを示す値。Wald検定では推定量の標準誤差を使って検定統計量を作ります。
推定量: 母集団パラメータをデータから推定した値。Wald検定では回帰係数の推定量を検定します。
回帰係数: 回帰モデルで表される変数間の影響の大きさを示すパラメータ。Wald検定の対象になることが多いです。
検定統計量: 検定の結果を数値で表す指標。Wald検定では通常 z 値（または t 値）を用います。
z検定: 標準正規分布を使う仮説検定の一種。Wald検定は大標本で z検定的な形になることが多いです。
正規分布: データが従う分布。大標本では正規近似が成り立ち、Wald検定の前提となることがあります。
正規近似: 大標本で、標本分布が正規分布に近づくという近似。Wald検定は正規近似を前提とすることが多いです。
p値: 検定統計量が観測される程度の珍しさを示す値。小さいほど仮説を棄却します。
大標本: 標本サイズが大きい状況。Wald検定は大標本で安定して使われることが多いです。
尤度比検定: モデルの適合度を比較する一般的な検定。Wald検定と並ぶ主要な検定の一つ。
尤度: データが観測される確率の指標。Wald検定の直接の計算には使われませんが、統計の文脈で関連語として頻出します。
信頼区間: 推定量の不確実性を区間で示す。Wald信頼区間は推定量と標準誤差から計算します。
自由度: 統計量の自由度。Wald検定では特定ケースで自由度を考えることがあります。
ロジスティック回帰: 従属変数が二値の回帰モデル。Wald検定はこのモデルの係数検定でよく用いられます。
一般化線形モデル: GLM。Wald検定はGLMの係数の有意性を検定する場面で使われます。

wald検定の関連用語

Wald検定: 回帰係数などのパラメータが零仮説 H0: θ = θ0 かどうかを、漸近的な正規分布を用いて判定する統計的方法。推定量 θ_hat とその共分散 Var(θ_hat) を使い、Wald統計量 W = (θ_hat - θ0)^T Var(θ_hat)^{-1} (θ_hat - θ0) を算出します。W は自由度 k（検定するパラメータの数）で近似的に χ^2_k 分布に従います。GLM などの係数検定で広く使われます。
Wald統計量: Wald検定で用いられる統計量そのもの。式 W = (θ_hat - θ0)^T Var(θ_hat)^{-1} (θ_hat - θ0)。自由度は検定するパラメータの数 k。大標本で χ^2_k 分布に近似します。
最尤推定: 観測データの尤度を最大化するパラメータ推定法。データの尤度が最大になる θ_hat を求め、信頼性の高い推定量を提供します。Wald検定の基盤となる。
対数尤度関数: 尤度関数 L(θ) の自然対数。数値安定性のため対数を用いて最尤推定の計算を行います。
協方差行列: θ_hat の推定量の分散と共分散を表す行列。通常は情報量 I(θ) の逆行列で近似されます。
標準誤差: θ_hat の標準偏差。Var(θ_hat) の対角成分の平方根で求めます。Wald検定や信頼区間の計算に使われます。
Fisher情報量: 観測データから得られる情報の量。I(θ) = -E[ ∂^2 log L / ∂θ ∂θ^T ]。θ_hat の分散の下限にも関連します。
自由度: 検定で用いる確率分布の自由度。Wald検定なら k、単一の場合は 1、複数パラメータなら k になります。
正規近似: 大標本では θ_hat が正規分布に従うと近似される性質。Wald検定の根拠となります。
カイ二乗分布: Wald統計量は大標本で χ^2_k 分布に従うと近似されます。
単一パラメータ Wald検定: 検定対象が1変数のときの Wald検定。W は χ^2_1 分布に従い、Z = (θ_hat - θ0)/SE(θ_hat) は標準正規分布に相当します。
多変量 Wald検定: 複数のパラメータを同時に検定する場合の Wald検定。W = (θ_hat - θ0)^T Var(θ_hat)^{-1} (θ_hat - θ0) で χ^2_k 分布に従います。
零仮説: H0: θ = θ0。検定の出発点となる仮説。
対立仮説: H1: θ ≠ θ0 など。二側・片側の形式は設定に依存します。
パラメータベクトル: θ や β のように、検定対象となる複数のパラメータをまとめたベクトル。
テスト統計量: 検定の根拠となる値。Wald統計量が代表的な例。
Wald信頼区間: θ_hat ± z_{α/2} SE(θ_hat) のように、推定値の真値を含む区間を Wald 形式で作る方法。
尤度比検定: LRT は 2[log L(θ_hat) - log L(θ0)] に基づく検定で、H0 の下で χ^2_k 分布に近似します。Wald検定の代替として用いられます。
Score検定: Lagrange Multiplier 検定。尤度の勾配を用いて H0 の適否を判定する漸近的検定です。
GLM（一般化線形モデル）: ロジスティック回帰やポアソン回帰などを含むモデル群。Wald検定は係数の検定に広く用いられます。
回帰係数: 回帰モデルの各説明変数に対応する係数。0 であるかを検定対象とすることが多い。
回帰モデル: 説明変数と応答変数の関係を表す統計モデル。線形、一般化線形、非線形などがある。
漸近性: 大標本条件下で性質が安定すること。Wald検定の成否は主に漸近性に依存します。
p値: 検定統計量が零仮説の下で観測される確率。小さいほど零仮説を棄却する根拠が強いとされます。
Z検定: 標準正規分布 N(0,1) に基づく検定。大標本での単一パラメータの検定の考え方に近いです。
t検定: 小標本で t 分布を用いて平均の検定を行う方法。標本サイズや分散の不確かさに応じて使用します。