

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
内生性とは?
まず、内生性の意味を簡単に説明します。内生性とは、回帰分析などの推定で使う説明変数が、誤差項と関係してしまう状態のことです。つまり、X と誤差項 u が互いに影響し合ってしまい、目的の因果関係を正しく推定できなくなる現象を指します。
良いデータ分析をするためには、内生性があると結論が信用できなくなることを知っておくことが大切です。条件をきちんと満たしていないと、X が実際には Y に与える影響だけでなく、他の見えない要因や同時に起こる別の影響も一緒に映し出してしまうため、結果が偏ってしまいます。
内生性の3つの主な原因
| 原因 | 説明 |
|---|---|
| 省略変数バイアス | 重要な要因をモデルに入れ忘れると、説明変数 X と誤差項 u がつながってしまいます。 |
| 同時性 | 結果と説明変数が互いに影響を与え合うと、因果関係の向きが不明になります。 |
| 測定誤差 | X が正しく測定されずにずれていると、X と u の間に見かけ上の関連が生じます。 |
身近な例で理解する
例1. 教育時間と収入の関係を調べる場合を考えます。教育時間を増やすと収入が増えると仮定して分析しますが、実は生まれつきの性格や家庭環境といった要因も収入に影響します。これらの要因は直接は測れないことが多く、省略変数バイアスとして内生性が生じます。結果として、教育時間だけが原因で収入が増えたとは言い切れなくなるのです。
例2. ある薬の効果を調べる研究を考えます。健康状態が良い人ほど薬を受け取りやすい設計だと、薬の効果と健康状態が混ざってしまい、内生性が現れます。正しく薬の効果を知るには、他の要因を分けて考える必要があります。
内生性を抑えるための基本的な対処法
対処法1: 操作変数法 IV法:説明変数 X を別の変数 Z で置き換え、Z が X にだけ影響を与え、誤差項には関係しないことを利用して推定します。Z は X の「有効な道具」として機能する必要があります。
対処法2: 固定効果モデル:データ内の個体差や時間の影響を統計的に取り除く方法です。変数の時間的・個体的な影響をコントロールすることで、内生性の影響を減らします。
対処法3: 差分法・自然実験:実験のように外部の変化(自然現象や政策の変化)を利用して因果推定を行います。実験的条件に近い状況を作ることで、内生性の影響を抑えられます。
うまく読み解くポイント
実務では、まず「この分析で内生性の可能性があるか」を考えることが大切です。次に、可能な対処法を組み合わせて用います。IV法や固定効果の前提条件が満たされているかを検証する統計的な検査も活用します。結論として、内生性を意識した分析設計と検証が、信頼できる因果推定の鍵になります。
まとめ
内生性とは、説明変数と誤差項が関連してしまい、推定結果が偏ってしまう現象です。主な原因は省略変数バイアス・同時性・測定誤差です。対処法としては、操作変数法や固定効果、差分法などがあります。初心者には、身近な例を想定し、データの前処理と仮説の検証を丁寧に行うことが大切です。研究の目的が因果関係の理解であるなら、内生性の検討を最初に行い、適切な方法で検証を重ねていきましょう。
内生性の同意語
- 内因性
- 計量経済学で、説明変数が誤差項と関連している状態。推定量の偏りを生みやすく、因果推定を難しくする主な原因となる概念(endogeneityの日本語訳)。
- 内生要因
- データの内部要因で説明変数を決定する要因を指す表現。外生要因と対になる文脈で用いられ、内生性の説明に使われることが多い。
- 内生的性質
- 説明変数と誤差項が相関する“内生的”な性質を指す表現。やや口語寄りだが、同義として使われることがある。
- 内因的決定要因
- データ内部の要因により説明変数が決定されるという意味。内生性の原因を説明する語として用いられることがある。
- 内在性
- 内部で生じる性質という意味の表現で、文脈次第でendogeneityの同義語として用いられることがある。
内生性の対義語・反対語
- 外生性
- 内生性の対義語。説明変数が誤差項と独立・無相関である状態のこと。外生性が満たされていると、推定量のバイアスが生じにくく、因果推定が信頼しやすくなる場合が多い。
- 非内生性
- 内生性が存在しない状態。つまり、説明変数と誤差項に関連がないと考える前提。
- 説明変数の外生性
- 説明変数自体が外生的で、誤差項と独立・無相関である性質を指す表現。
- 説明変数と誤差項の独立性
- 回帰分析における核心条件のひとつ。説明変数と誤差項が統計的に独立していること。
- 無内生性
- 内生性が全く含まれていない、または存在しない状態のこと。
- 外生性を設計で確保する方法
- 外生性を満たすための研究デザインの考え方。ランダム化、自然実験、差分の差分法などが用いられる。
内生性の共起語
- 外生性
- 説明変数が誤差項と独立・無相関である性質。推定にバイアスが入りにくい前提。
- 内生性
- 説明変数が誤差項と相関してしまう状態。推定量が偏る原因となる。
- 内生変数
- 説明変数として使われるが、誤差項と相関が生じ得る変数。
- 欠落変数バイアス
- 重要な変数がモデルに含まれていないため、説明変数と誤差項が相関して推定が偏る現象。
- 同時性
- 因果関係が同時に双方に影響し合う状態。内生性の代表的原因のひとつ。
- 逆因果関係
- 因果の方向が逆になることで、説明変数と結果の関係が誤って解釈される状態。
- 測定誤差
- 変数の測定値が真の値とずれていること。測定誤差が内生性を生むことがある。
- 誤差項
- 回帰式の残差のこと。モデルで説明しきれない成分を含む。
- 誤差項と相関
- 説明変数と誤差項が相関している状態。内生性の核心要因。
- 誤差項との共分散
- 説明変数と誤差項が共分散を持つ場合、OLS推定が偏る原因になる。
- IV法
- 内生性を解消するための方法。説明変数の代わりに操作変数を用いる推定法。
- 操作変数法
- IV法の日本語表現。内生性を回避するための代表的手法。
- 有効なIV
- 誤差項と説明変数の相関を阻止でき、同時に結果と因果を正しく推定できる条件を満たす変数。
- 二段階最小二乗法
- 2SLS。内生性を含む回帰式を推定する代表的手法で、第一段階でIVを使い第二段階で推定する。
- 構造方程式モデル
- 複数の方程式で変数間の因果関係を同時に推定する統計モデル。
- 同時方程式
- 複数の方程式が互いに因果関係を持つ系。内生性が生じやすい。
- 固定効果モデル
- 個体・時点の固定特性を差し引いて内生性の影響を緩和する手法。
- ランダム効果モデル
- 個体差をランダムに捉えるモデル。内生性対策としての適用には限界があることが多い。
- 弱外生性
- 説明変数が厳密な外生性を満たさない場合でも、条件付きで外生性を保つとされる中間的概念。
- 厳密外生性
- 全ての時点・条件で説明変数と誤差項が独立・無相関であるとする強い仮定。
- 外生変数
- 誤差項と独立・無相関とみなされる、推定の前提となる説明変数。
- 第一階差分法
- データを差分化して固定効果やトレンドの影響を除去する推定法。
- 第一階差分
- データの差分を用いる方法の総称。固定効果の影響を抑える目的で用いられることが多い。
- パネルデータ
- 同一個体を時間軸で追跡したデータ。内生性対策や固定効果推定で頻繁に用いられる。
- 欠落変数
- 観測されていないが影響する変数。欠落によって内生性が生じやすくなる。
- 共変量
- 分析で統制する追加の変数。内生性対策の一部として使われることがある。
- 識別条件
- パラメータを一意に推定できるための条件。内生性が原因で適切な識別が難しくなることがある。
- 因果推定
- 因果関係を推定・結論づけること。内生性の扱いが推定の正確さに大きく影響する。
内生性の関連用語
- 内生性
- 説明変数が誤差項と相関している状態。原因と結果が互いに影響し合い、回帰推定に偏りが生じます。
- 外生性
- 説明変数が誤差項と相関していない状態。推定量が無偏・一致になる条件のひとつとして重要です。
- 誤差項
- モデルが捉えきれない要因を表す項。回帰分析では残差と同義で、データの揺れを反映します。
- 同時性
- 説明変数と被説明変数が同時に互いに影響し合う状況。内生性の主な原因の一つです。
- 省略変数バイアス
- 重要な説明変数をモデルから省くと、推定値に歪みが生じる現象です。
- 交絡因子
- 結果と説明変数の両方に影響を与える第三の変数。適切に制御しないと因果推定が歪みます。
- 選択バイアス
- 標本選択の非ランダム性によって推定が母集団を正しく反映しなくなる偏り。
- 測定誤差
- 変数の測定値に誤差があると、推定の信頼性が低下し内生性が生まれることがあります。
- 工具変数法
- 内生性を解消する手法。説明変数と誤差項を分離する外生的な工具変数を用います。
- 第一段階回帰
- 工具変数から説明変数を予測する回帰。説明変数の「推定値」を作る工程です。
- 第二段階回帰
- 第一段階の推定値を使って目的変数を推定する回帰。これが実際の推定結果になります。
- 二段階最小二乗法(2SLS)
- 第一段階と第二段階を組み合わせたIV推定の代表的手法。
- 弱い工具変数
- 工具変数が説明変数を十分に予測できず、推定値が不安定になる状態です。
- 排除制約
- 工具変数が結果変数に直接影響を与えないという前提。重要な仮定の一つです。
- 有効な工具変数の条件
- 工具変数は説明変数を強く予測でき、排除制約を満たす必要があります。
- 識別
- モデルのパラメータを一意に特定できる条件。特に因果推定の基盤となる概念です。
- Hausman検定
- OLSとIV推定などの推定方法の違いを検出する検定。内生性の存在を確認する手段として用います。
- 差分の差分法
- 介入前後のグループ間の差の変化を比較して因果を推定する準実験デザイン。
- 自然実験
- 日常の制度・出来事を利用して、準実験的に因果を推定する設計。
- ランダム化比較試験
- 介入をランダムに割り当て、内生性を完全に回避する因果推定の金標準。
- 反事実
- 介入がなかった場合の結果を想定する考え方。
- 潜在結果フレームワーク
- 介入と対照の潜在的結果を比較して効果を定義する因果推定の枠組み。
- 局所平均的処置効果(LATE)
- 工具変数の適用下での、特定のサブグループにおける介入効果。
- 介入効果
- 介入を受けたグループと受けていないグループの結果の差。
内生性のおすすめ参考サイト
- 内生性バイアスとは何か - 統計を簡単に学ぶ - Learn Statistics Easily
- 内生性、内生変数とは何か - 講義のページへようこそ
- 内生性とは何か:因果推論の最大の敵を理解する - note
- 内生性とは? わかりやすく解説 - Weblio辞書
- 内生性(ないせいせい)とは? 意味や使い方 - コトバンク
- 内生性とは?|Non - note



















