

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
因子寄与率とは何か
因子寄与率とは、データの中で「どの因子がどれだけの情報を説明しているか」を表す指標です。たとえば、テストの点数をいくつかの共通する要素(計算力、読解力、記憶力など)に分けたとき、それぞれの要素が総合点のどれくらいを占めているかを示します。これを数値で見ると、どの要素が重要かが一目で分かります。重要なポイントは、寄与率は総変動量に対する割合であることです。
統計の世界では、因子分析や主成分分析(PCA)などの手法でデータを「因子」というまとまりに分けます。各因子がどれだけデータの変動を説明するかを示すのが、因子寄与率です。
どうやって計算するのか
一般的には次のような流れで計算します。まずデータを標準化し、共分散行列や相関行列を作ります。次に固有値と固有ベクトルを求めます。固有値は各因子が説明する分散の量を表し、全ての固有値の合計は総分散に等しくなります。各因子の寄与率は、各固有値を総和で割ることで得られます。割合は0から1(あるいは0%から100%)の間の値となり、多くの場合「第1因子が何%」のように報告します。
小さな例で理解を深めよう
たとえば、あるデータで固有値が 2.5、1.5、0.5 の3つだとします。総分散は 2.5 + 1.5 + 0.5 = 4.5 です。1番目の因子の寄与率は 2.5 / 4.5 ≈ 0.56(約56%)、2番目は 1.5 / 4.5 ≈ 0.33(約33%)、3番目は 0.5 / 4.5 ≈ 0.11(約11%)となります。こうして各因子が全体にどれだけ寄与しているかが分かるのです。
表で見る寄与率の例
| 因子 | 寄与率 |
|---|---|
| 因子1 | 56% |
| 因子2 | 33% |
| 因子3 | 11% |
現場での使い方としては、どの因子を重視するべきか、データの次の分析をどう組み立てるかを判断する材料になります。
この概念は高校・大学の授業、データサイエンスの入門、マーケティングの調査分析など、さまざまな場面で役立ちます。初心者のうちは「寄与率=説明できる割合」と覚えると良いでしょう。まとめとして、因子寄与率はデータの説明力を因子ごとに数値化する指標であり、総分散に対する割合として表されます。
応用と注意点
現場での活用のコツとしては、寄与率だけを見て因子の数を決めるのではなく、視覚的な判断材料と組み合わせて判断することが大切です。サンプルサイズが小さいと寄与率の推定が不安定になることがあるので、データを増やすか、別の指標と併用します。
累積寄与率は、最初のn個の因子が全体の寄与率の合計としてどの程度説明できるかを示します。一般には、80%程度を目安に因子の数を決めます。
因子寄与率の同意語
- 因子寄与率
- 各因子がデータ全体の分散に対してどれだけ寄与しているかを示す割合。PCAや因子分析で、各因子の説明力を表す基本的指標です。
- 因子の寄与度
- 因子がどれだけデータの分散に寄与しているかの大きさを表す指標。寄与率と同じく、因子の影響の大きさを示します。
- 因子貢献率
- 因子がデータの分散にどのくらい貢献しているかを示す割合。寄与率と同義で使われることが多い表現です。
- 寄与率
- 全体に対する寄与の割合を表す総称。文脈によって因子寄与率を指す場合に使われます。
- 主成分寄与率
- 主成分(因子)が説明する分散の割合。PCAで各主成分の説明力を示す指標として用いられます。
- 主成分の寄与度
- 主成分がデータの分散に与える寄与の大きさを表す指標。説明力の比較に用います。
- 因子説明率
- 因子が説明する分散の割合を示す指標。説明割合とほぼ同義で使われます。
- 説明割合
- 各因子・成分が全体の分散を占める割合を表す、広く使われる表現です。
- 分散説明割合
- 分散のうち、各因子が説明している割合を表す表現です。
- 説明量割合
- 説明量(説明される分散)の割合を示す表現。計算結果の比率として用いられます。
- 因子が説明する分散の割合
- 各因子が全体の分散をどれだけ説明しているかを示す、説明的な表現です。
因子寄与率の対義語・反対語
- 寄与なし
- この因子が、観測変数の変動に対してほとんど、または全く寄与していない状態。寄与率が非常に低いまたは0%に近い場合に使われる表現です。
- 非寄与
- その因子は寄与していない、影響を与えない状態を表す言い方。説明力がほとんどないことを意味します。
- 未寄与
- 寄与がまだ現れていない、あるいは0%近い寄与を示すときに使われる表現。将来的に寄与が大きくなる可能性は残すニュアンス。
- 未説明率
- この因子で説明できない変動の割合。全体の説明力を示す指標の補足として使われることがあります。
- 影響なし
- その因子が観測変数に影響を与えない、寄与がないという意味合いの表現です。
- 貢献度が低い
- 寄与が小さい、全体の説明力に対する影響が弱い状態を指します。
- 低寄与
- 寄与の程度が低いことを示す言い方。説明変動の中での比率が小さいときに使います。
- 残差寄与率
- 説明されなかった分の割合。因子で説明できない変動の比率として使われることがあります。
- 寄与ゼロ
- 寄与が0%である状態。全く影響がないとされる表現です。
- 未説明分
- 全体の変動のうち、因子で説明できない部分を指す言い方。未説明分が多いほど、寄与率は低いことになります。
- 説明力が低い
- その因子の説明力(寄与を説明する力)が低く、重要度が低いことを表します。
因子寄与率の共起語
- 因子分析
- 観測変数を少数の潜在因子で説明する統計手法。因子寄与率は各因子が全体の分散をどれだけ説明するかを示す指標。
- 主成分分析
- データのばらつきを最大化する直交成分に分解して次元削減を行う手法。因子寄与率は各主成分が説明する分散の割合として表される。
- 説明率
- 全体の分散のうち、特定の因子や成分が占める割合。因子寄与率の同義語として使われることが多い。
- 寄与率
- 各因子・主成分がデータ全体の分散に占める割合。分析の解釈指標として用いられる。
- 固有値
- データの分散構造の強さを表す指標。大きいほど、その成分がデータを説明する力が強いと判断される。
- 固有ベクトル
- 固有値に対応する方向を示すベクトル。主成分軸や因子荷重を決定づける要素となる。
- 因子荷重
- 観測変数と因子の関連の強さを表す指標。数値が大きいほど、その変数がその因子に寄与していることを示す。
- ロード
- 因子荷重と同義で使われることが多い。観測変数と因子の関係を直感的に示す数値。
- 因子得点
- 各観測値が因子に沿ってどの位置にあるかを示す数値。回帰法や簡易法で算出され、分析に使用される。
- 因子スコア
- 因子得点と同義。観測データの因子軸上の座標を表す表現。
- 主成分得点
- PCAで各主成分に対応する観測値の得点。次元削減後のデータ表現として用いられる。
- 共分散行列
- 変数間の共分散をまとめた対称矩陣。データの分散構造の基盤となる。
- 相関行列
- 標準化された共分散を集めた行列。変数間の関連性を比較する際に用いられる。
- 分散の分解
- 総分散を因子寄与率の成分に分解して、各因子の説明力を示す考え方。
- スクリープロット
- 固有値を降順に並べたグラフ。どの因子まで寄与が大きいかの目安を視覚的に提供する。
- 特異値分解
- 行列を特異値と左右の特異ベクトルに分解する手法。PCAは特異値分解を通じて実現されることが多い。
- 探索的因子分析
- 未知の因子構造を探索する因子分析の一種。因子寄与率を用いて因子数を決定する際に用いられる。
- 検証的因子分析
- 事前に仮説化した因子構造をデータで検証する分析。因子寄与率の妥当性を評価する。
- 次元削減
- データの情報量をできるだけ保ちながら変数の数を減らす手法の総称。代表例にPCAや因子分析がある。
- 潜在変数
- 観測できないがデータの背後にある仮想的な変数。因子分析の中心概念。
- 回転
- 因子荷重の解釈を容易にするため、因子空間を変換する手法。Varimaxなどが代表的。
- Varimax回転
- 直交回転の一種で、因子荷重を単純化し解釈を容易にする回転法。
因子寄与率の関連用語
- 因子寄与率
- データの総分散に対して、各因子(主成分・因子)がどれだけの分散を占めて説明しているかを示す割合。0〜1で表され、累積寄与率と組み合わせて解釈します。
- 主成分分析 (PCA)
- 多変量データの分散を最大化する方向(主成分)へデータを線形変換する手法。各主成分の寄与率は固有値と総固有値の比で決まります。
- 固有値
- 特異値分解や特質値分解で得られる、各主成分・因子が説明する分散の大きさを表す値。大きいほど寄与度が高いです。
- 固有ベクトル
- 共分散行列の固有ベクトル。主成分の軸方向を決める重み付けベクトルで、負荷量の基礎になることが多いです。
- 負荷量 / 因子負荷量
- 観測変数と因子との関係強度を示す指標。絶対値が大きいほど、その変数はその因子に強く関連します。
- 共通因子 (Common factors)
- 複数の観測変数に共通して影響を与える潜在因子。因子分析の核心概念です。
- 共通性 (Communality)
- 観測変数の分散のうち、共通因子で説明される割合。負荷量の二乗和で計算します。
- 独自性 / 特異性 (Uniqueness / Specificity)
- 観測変数の分散のうち、共通因子で説明されない部分。1 − 共通性で表されます。
- 累積寄与率 (Cumulative explained variance)
- 第1因子から第k因子までの寄与率を合計したもの。因子数決定の判断材料になります。
- 回転 (Rotation)
- 因子負荷量を解釈しやすくするための再表現。正交回転と斜交回転があり、解釈性を高めます。
- Varimax回転
- 最も一般的な正交回転。負荷量の分布を分離させ、解釈を簡便にします。
- Promax回転
- 斜交回転の代表。因子間の相関を認めつつ、解釈性を高めることを目指します。
- 探索的因子分析 (EFA)
- データから潜在因子を探索的に抽出する分析。事前の仮説が少ない場合に使用します。
- 確認的因子分析 (CFA)
- 事前に仮説化した因子構造がデータに適合するかを検証する分析。
- スクリープロット (Scree plot)
- 固有値を降順にプロットした図。エルボー法で適切な因子数を推定します。
- Kaiser基準 (Kaiser criterion)
- 固有値が1以上の因子を採用する目安。単純性の高い目安として用いられます。
- 肘法 (Scree test)
- スクリープロットで“肘”となる点を因子数の目安として使う視覚的判断法。
- 標準化 (Standardization / Z-score)
- データを平均0・分散1に統一する前処理。PCA・因子分析でよく使われます。
- スケーリング (Scaling)
- データを同じスケールに合わせる作業。分析結果の安定性に影響します。
- Cronbachのα (Cronbach's alpha)
- 測定尺度の内部整合性を評価する指標。因子分析前の信頼性チェックとして用いられます。
- サンプルサイズの目安
- 因子分析・PCAの安定性はサンプルサイズに依存します。一般的には変数数の数倍以上を推奨されます。
- 負荷量の閾値 (Loading threshold)
- 解釈上の目安として、例えば0.4以上を『主要な負荷量』と見なすことが多いです。
- 特性値分解 (Eigen decomposition / 特性値分解)
- 共分散行列を固有値と固有ベクトルに分解する手法。PCAや因子分析の基盤となります。
- 因子間相関 (Factor correlations)
- 斜回転などで因子間の相関を許す場合の関係性。分析の回転選択に影響します。
- 最尤法 (Maximum Likelihood)
- 因子分析の推定手法の一つ。データが正規分布に従う前提で、負荷量や共通性を推定します。



















