周辺分布とは?初心者にもわかる解説と実例共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
周辺分布とは?初心者にもわかる解説と実例共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


周辺分布とは?

周辺分布とは、多変量データのうちある1つの変数だけを取り出して見た分布のことです。日常のデータ分析でもよく使われ、全体の関係性をざっくりつかむ第一歩として役立ちます。ここでは中学生にも分かるよう、具体的な例とともに丁寧に解説します。

基本の考え方

2つ以上の変数があるとき、それぞれの組み合わせでどれくらいの割合になるのかを考えます。例えば X と Y という2つの変数があるとき、P(X=x, Y=y) は「X が x かつ Y が y である確率」です。周辺分布は、このような同時分布を使って X や Y の値だけを取り出した分布のことを指します。

周辺分布を求める基本的な方法は、他の変数の影響を「足し合わせる」ことです。式で表すと次のようになります。

P(X=x) = sum over all y of P(X=x, Y=y) です。つまり、Y の値をすべて足し合わせると X の周辺分布が得られます。

この考え方は、データの奥にある「共通の要因」を取り除いて、特定の変数がどのくらいの幅で変動するかを理解するのに役立ちます。次の例で具体的に見ていきましょう。

実例で見る周辺分布

例題として、サイコロを2つ同時に振る場合を考えます。2つのサイコロをそれぞれ X と Y とします。サイコロは1〜6の目が出ます。公平なサイコロなら、同時分布はすべての組み合わせで確率が同じ 1/36 です。

X=1,Y=1: 1/36X=2,Y=1: 1/36X=3,Y=1: 1/36X=4,Y=1: 1/36X=5,Y=1: 1/36X=6,Y=1: 1/36
X=1,Y=2: 1/36X=2,Y=2: 1/36X=3,Y=2: 1/36X=4,Y=2: 1/36X=5,Y=2: 1/36X=6,Y=2: 1/36
X=1,Y=3: 1/36X=2,Y=3: 1/36X=3,Y=3: 1/36X=4,Y=3: 1/36X=5,Y=3: 1/36X=6,Y=3: 1/36
X=1,Y=4: 1/36X=2,Y=4: 1/36X=3,Y=4: 1/36X=4,Y=4: 1/36X=5,Y=4: 1/36X=6,Y=4: 1/36
X=1,Y=5: 1/36X=2,Y=5: 1/36X=3,Y=5: 1/36X=4,Y=5: 1/36X=5,Y=5: 1/36X=6,Y=5: 1/36
X=1,Y=6: 1/36X=2,Y=6: 1/36X=3,Y=6: 1/36X=4,Y=6: 1/36X=5,Y=6: 1/36X=6,Y=6: 1/36

この表は同時分布をそのまま表していますが、周辺分布を取り出すには X の値ごとに Y の全ての可能性を足し合わせます。例えば P(X=3) は Y が 1 から 6 までの確率を足し合わせたものなので、6 回の 1/36 を足すと 6/36 = 1/6 になります。したがって、周辺分布としての P(X=3) は 1/6、同様に P(X=1) も 1/6 となり、X の周辺分布は均等な分布になります。

この考え方は、2つ以上の変数が絡み合うデータを扱うときの基礎です。周辺分布を使うと、特定の変数の「どんな値を取りやすいか」を簡単に把握でき、データの可視化や意思決定の指標作りに役立ちます。

活用のヒント

データ分析の最初の一歩として、周辺分布を描くことで全体像をつかむ。強調したい点は、他の変数を“無視する”のではなく、特定の変数の傾向を見やすくするための切り口であることです

・現実のデータでは連続変数も多いので、ヒストグラムや密度関数を用いた周辺分布の考え方が役立ちます。連続データの場合は、区間ごとの頻度を使って概略をつかむのが一般的です。

まとめ

周辺分布は、複数の変数から1つの変数だけを取り出して、その確率分布を見やすくする方法です。同時分布から各変数の周辺分布を足し合わせることで求めることができデータの特徴を素早く把握する基本的なツールとなります。分析の第一歩として、この考え方を身につけておくと良いでしょう。


周辺分布の同意語

マージナル分布
多変量確率分布から、他の変数を積分(連続変数の場合)または和(離散変数の場合)して除外することで得られる、特定の1変数の分布のこと。例えばXとYが共に分布する場合、Yのマージナル分布はXを固定せずYだけの分布になる。
周辺確率分布
マージナル分布と同義の表現。複数の変数があるとき、興味の変数だけの確率分布を、他の変数を取り除いて得る分布のこと。
Marginal distribution
英語表現。多変量分布から、他の変数を統合して取り除くことで得られる、対象変数の確率分布を指す。

周辺分布の対義語・反対語

結合分布
複数の変数を同時に含む分布。XとYを同時に取り扱う全体の分布で、個々の周辺分布とは別の概念です。
同時分布
結合分布の別称。X, Y など複数の変数を同時に分布させる全体の分布のこと。
多変量分布
2変数以上を含む分布。周辺分布の対になる全体分布で、統計学でよく使われる用語です。
条件付き分布
ある条件の下での分布。たとえば X を Y の値に条件づけして求める分布で、周辺分布とは情報の切り出し方が異なります。
全分布
全ての変数を含む結合分布のことを指すことがあり、結合分布とほぼ同義で使われることがあります。

周辺分布の共起語

確率分布
確率変数が取り得る値と、それぞれの値が起こる確率を表す分布のこと。周辺分布は、複数の変数がある場合に、他の変数を積分・和して取り出した特定の変数の分布です。
結合分布
複数の確率変数が同時にとる分布のこと。周辺分布を作る際には、この結合分布から不要な変数を積分・和して取り出します。
条件付き分布
ある変数の値が分かっているときの、別の変数の分布。周辺分布と合わせて、変数間の関係を理解するのに使われます。
多変量分布
2つ以上の確率変数を同時に扱う分布の総称。周辺分布はこの分布から個々の変数の分布を取り出す操作で得られます。
独立性
2つの変数が互いに影響を与えないとき。独立なら結合分布は各周辺分布の積になります。
相関
変数同士の関係の強さを表す指標。周辺分布の形から相関を読み取ることもあります。
母集団
調べている全体の集団。周辺分布は母集団の性質を表す一つの見方です。
標本
母集団から取り出したデータの集合。標本データを使って周辺分布を推定します。
積分
連続変数の周辺分布を求めるとき、他の変数を積分して取り出します。
離散変数の周辺分布を求めるときは、全ての値の確率を足し合わせます。
連続分布
確率変数が連続的な値をとる分布。周辺分布は通常、積分で計算します。
離散分布
確率変数が離散的な値をとる分布。周辺分布は和で計算します。
モーメント
分布の特徴を表す指標(平均・分散など)。周辺分布の理解を深める手がかりになります。
期待値
周辺分布の平均的な値。
分散
周辺分布のばらつきを表す指標。
歪度/尖度
分布の形を表す指標。周辺分布の左右対称性や尾部の厚さを示します。
尤度
データがある分布に従う確率の大きさを表す量。周辺分布を扱う際の基礎概念です。
ベイズ推定
データと事前情報から分布を更新して推定する方法。周辺分布はベイズ推定で頻繁に現れる概念です。
周辺尤度
データの周辺分布を得るために、パラメータを積分した尤度。ベイズ統計で重要な役割を果たします。
パラメータ推定
分布の形を決める値(パラメータ)をデータから推定する作業。周辺分布を前提に行われることが多いです。
統計学/データ分析
データを整理・解釈する学問。周辺分布は基礎的な概念の一つです。

周辺分布の関連用語

周辺分布
多変量分布の中から特定の変数だけの分布のこと。他の変数を足し合わせる(離散なら和、連続なら積分)ことで得られる。
同時分布
2つ以上の変数が同時にとる確率分布のこと。周辺分布はこの分布から他の変数を取り除くことで求められる。
条件付き分布
ある変数を観測したときの、他の変数の分布。P(X|Y) のように表示され、周辺分布と深く関わる。
周辺確率分布
離散変数の周辺分布を指す表現。P(X=x) のように、他の変数を総和して得られる。
周辺確率密度関数
連続変数の周辺分布を表す確率密度関数。f_X(x) = ∫ f_{X,Y}(x,y) dy のように、他の変数を積分して求める。
周辺化
多変量分布から不要な変数を取り除く操作。積分(または和)を用いて周辺分布を作ることを指す。
積分による周辺化
周辺分布を得る具体的な手順。結合分布を他の変数について積分することで得られる。
多変量分布
2つ以上の変数が同時にとる分布。周辺分布はこの分布を分解することで得られる。
独立性
複数の変数が互いに影響を及ぼさない性質。独立であれば周辺分布は他の変数の影響を受けにくくなる。
周辺尤度
ベイズ統計で、パラメータを事前分布で積分して得られるデータの尤度。モデル比較や事前分布の影響を評価するために使う。
周辺分布の推定
データから周辺分布を推定する方法。ヒストグラム、カーネル密度推定、分布仮説検定などの手法を用いる。

周辺分布のおすすめ参考サイト


学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
1835viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
658viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
630viws
座標計算・とは?初心者向けガイドで完全マスター共起語・同意語・対義語も併せて解説!
580viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
486viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
464viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
442viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
407viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
377viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
368viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
352viws
k型熱電対とは?初心者にも分かる基礎解説と活用事例共起語・同意語・対義語も併せて解説!
347viws
気圧の単位とは?中学生にもわかるPa・atm・bar・Torrの違いと換算ガイド共起語・同意語・対義語も併せて解説!
344viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
330viws
3/4・とは?分数の基本を分かりやすく解く完全ガイド共起語・同意語・対義語も併せて解説!
311viws
100g・とは?初心者が今すぐ知っておきたい基本と使い方共起語・同意語・対義語も併せて解説!
306viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
305viws
endnoteとは?研究ノートを整理する基本ツールの解説共起語・同意語・対義語も併せて解説!
299viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
275viws
pastとは?初心者向けガイド:意味・使い方・例文を徹底解説共起語・同意語・対義語も併せて解説!
249viws

新着記事

学問の関連記事