

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
周辺確率分布とは?
「周辺確率分布」は、確率の世界でよく使われる言葉です。簡単にいうと、結合分布から「ある変数だけを取り出した分布」のことです。結合分布はXとYが同時にどう起こるかを表しますが、周辺確率分布はXだけ、あるいはYだけを見たいときに使います。
結合分布と周辺分布の違い
結合分布はXとYが同時にどうなるかを示す表です。周辺分布はXの取り出し結果だけを見たときの分布です。周辺分布を計算する理由は、複数の変数が絡むデータから、ある一つの変数の特徴を知りたいときに役立つからです。
計算の基本
離散的な場合は、P(X=x) = sum_y P(X=x, Y=y)として各xについてすべてのyを足します。連続の場合は、f_X(x) = ∫ f_{X,Y}(x,y) dyのように、yを連続的に足し合わせる(積分する)操作になります。難しく見えますが、基本の考え方は「結合分布を部分的に足し合わせる」ことです。
身近な例で理解する
例として、2つの変数XとYがあり、それぞれ1〜2の値をとるとします。以下のような結合分布を考えます。
| Y=1 | Y=2 | Xの周辺 | |
|---|---|---|---|
| X=A | 0.25 | 0.25 | 0.50 |
| X=B | 0.25 | 0.25 | 0.50 |
| 周辺Y | 0.50 | 0.50 | 1.00 |
この表から、周辺確率分布としてX=Aの確率は0.50、X=Bの確率も0.50であることが分かります。周辺分布はこのように、他の変数を「合計」または「積分」することで取り出せます。
日常のデータ分析への活用
学校のテスト結果と出席日数、アンケートの性別と趣味など、複数の情報があるとき、特定の変数だけの分布を知りたい場面がよくあります。そんなときに周辺確率分布を使うと、データの偏りやパターンが見えやすくなります。分析の第一歩として、Xの周辺分布を作る練習をしてみましょう。
要点のまとめ
・周辺確率分布は、結合分布からXやYだけを取り出した分布である。
・離散ではP(X=x)=sum_y P(X=x,Y=y)、連続ではf_X(x)=∫ f_{X,Y}(x,y) dy。
・身近なデータでも、特定の変数の周辺分布を作ると情報が取り出しやすくなる。
よくある誤解と補足
よくある誤解は「周辺確率分布は常にuniformになる」というものです。そうではなく、結合分布に依存します。乱数が独立であっても、XとYの周辺分布は個別に変わることがあります。複雑なデータでは、周辺分布を視覚化するにはヒストグラムや棒グラフが役立ちますが、ここでは数式と表で基本を学ぶことが大切です。
周辺確率分布の同意語
- 周辺分布
- 多変量分布において、他の変数を積分して得られる、個々の変数の分布。全体の分布から“周辺部分”を取り出したものです。
- 辺縁分布
- 周辺分布の別表現。多変量分布に含まれる各変数の周辺的な分布を指す言い換え。
- 辺縁確率分布
- 周辺分布と同じ意味で使われる表現。多変量分布から他の変数を除いたときに残る確率分布を指します。
- マージナル分布
- 英語の marginal distribution に相当する日本語表記。周辺分布と同じ概念を略称・借用語で示す表現。
周辺確率分布の対義語・反対語
- 条件付き確率分布
- 特定の条件が満たされたときに観測変数の確率分布を表す概念。例えば P(X|Y) のように、条件づけられた状態での分布。周辺確率分布は他の変数を積分して得るのに対し、条件付き確率分布は条件がある状態での分布という点が対比になります。
- 結合確率分布
- 複数の変数が同時に従う確率分布。P(X, Y) のように表され、周辺分布はこの結合分布から他の変数を積分して取り出した分布です。結合分布は周辺分布の“元となる全体像”として対概念になります。
- 同時確率分布
- 結合確率分布の別名。複数の変数を同時に扱う分布を指し、周辺分布と対になる全体の分布として理解されます。
- 事後分布
- データを観測した後のパラメータの分布。ベイズ推論で P(θ|データ) の形の条件付き分布であり、周辺分布が条件なしの視点であるのに対してデータを条件づけした分布として対比される概念です。
周辺確率分布の共起語
- 結合分布
- 二つ以上の確率変数が同時にとる値の分布。周辺分布を得るときは、他の変数を積分(連続の場合)または和(離散の場合)します。
- 周辺化
- 結合分布から不要な変数を取り除く操作。これにより、特定の変数の分布を取り出します。
- 周辺分布
- 特定の変数だけの分布。結合分布を他の変数で積分/和して得られます。
- 条件付き分布
- ある条件が決まったときの別の変数の分布。例: P(X|Y=y)。
- 確率密度関数
- 連続分布を表す関数。積分して確率を計算します(総和は1になる)。
- 確率質量関数
- 離散分布を表す関数。各値に対応する確率を割り当てます。
- 積分
- 周辺分布を得るために結合分布を他の変数で積分する操作。
- 和
- 離散の場合、結合分布を他の変数の値で足し合わせて周辺分布を得る操作。
- 多変量分布
- 複数の確率変数の同時分布。周辺分布を得る際は変数毎の積分/和を行います。
- 多変量正規分布
- 多変量の正規分布の代表例。各変数の周辺分布は通常、それぞれ正規分布になります。
- 独立
- 変数同士が独立していると、結合分布は各変数の分布の積として表せます。
- 離散分布
- 値が離散的な確率分布。例: ベルヌーイ、ポアソン、二項分布など。
- 連続分布
- 値が連続的な確率分布。例: 正規分布、指数分布など。
- 正規分布
- 連続分布の代表例。周辺分布として現れることが多いです。
- ベルヌーイ分布
- 成功/失敗の2値をとる離散分布。
- ポアソン分布
- 平均λで起こる事象の回数を分布させる離散分布。
- ベータ分布
- 確率0-1の区間で定義される連続分布。割合の周辺分布として現れます。
周辺確率分布の関連用語
- 周辺確率分布
- 多変量分布から、ある変数のみの確率分布を取り出すこと。結合分布 p_{X,Y}(x,y) を y について和(離散の場合)または積分(連続の場合)して得られる。例: p_X(x) = ∑_y p_{X,Y}(x,y) または p_X(x) = ∫ p_{X,Y}(x,y) dy。
- 辺縁確率分布
- 周辺確率分布の別称。読みはへんえん。多くの場合、周辺確率分布と同じ意味で使われる。
- 周辺分布
- 周辺確率分布の別表現。X や Y など特定の変数の周辺分布を指す言い方。
- 周辺化
- 多変量分布から特定の変数を取り除く操作。和または積分を用いて周辺分布を得ること(英: marginalization)。
- 結合確率分布
- 複数の変数が同時にとる確率分布。例: p_{X,Y}(x,y) は X と Y の結合分布。
- 条件付き確率分布
- ある変数の値が分かったときの別の変数の確率分布。式: p_{X|Y}(x|y) = p_{X,Y}(x,y) / p_Y(y)。
- 確率密度関数
- 連続確率変数の分布を密度として表す関数。周辺分布も密度関数として扱われ、積分して1になる性質を持つ。
- 確率質量関数
- 離散確率変数の分布を質量として表す関数。例: p_X(x) = P(X = x)。
- 和による周辺化
- 離散の場合、周辺分布を求める際に joint pmf を y について和を取る方法。式: p_X(x) = ∑_y p_{X,Y}(x,y)。
- 積分による周辺化
- 連続の場合、周辺分布を求める際に joint pdf を y について積分を取る方法。式: p_X(x) = ∫ p_{X,Y}(x,y) dy。
- 独立性
- X と Y が独立であるとき、結合分布は p_{X,Y}(x,y) = p_X(x) p_Y(y) となり、片方の周辺分布はもう一方に影響されない。



















