

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
確認的因子分析・とは?
確認的因子分析は、既にある仮説の「因子構造」をデータで検証する統計手法です。EFAとの違いは、事前に「この因子が何個あって、どの項目がどの因子に対応するはずだ」という設計を決めておく点です。
基礎となる考え方
観測される複数の質問や指標は、少数の潜在因子の影響を受けて変動します。潜在因子とは直接見えない要素で、信念・態度・能力などが該当します。 CFAでは「この観測変数がこの因子にどれだけ依存しているか」を表す「荷重」と呼ばれる数値を推定します。
何を検証するのか
たとえば、心理テストで「学業動機」を測る8問があるとします。仮に2つの因子、内発的動機と外発的動機を仮設した場合、各質問がどの因子にどれだけ結びつくかを分析します。モデルがデータに合っているかを「適合度指標」で判断します。
適合度指標とは
代表的な指標にはCFI、RMSEA、SRMRなどがあります。これらはモデルの「よさ」を数値で示します。目安として、CFIが0.90以上、RMSEAが0.08未満、SRMRが0.08未満だと「よく適合している」と言われることが多いです。ただし分野やデータの特性で基準は変わります。
分析の流れ(初心者向け)
- 1. データ準備:回答が欠損していないか、尺度が適切に測られているかを確認します。
- 2. モデルの仮説づくり:何因子で、各質問がどの因子と結びつくかを決めます。
- 3. 推定と評価:ソフトウェアで荷重を推定し、適合度指標を見てモデルを評価します。
- 4. 改善と検証:必要ならパラメータを微修正し、新しいデータで再検証します。
実務でのヒント
初心者にはサンプルサイズが大きいほど安定した推定が得られやすい点が魅力です。目安としては200以上の回答があると良いと言われます。また、データが正規分布に近いと推定が安定しますが、現実には完全に正規分布にはならないことが多いです。
まとめ
確認的因子分析は「仮説を検証するための道具」です。事前に因子構造を決めておくことで、データがその仮説にどれだけ合っているかを数値で示せます。分析を始める前に、理論とデータの性質をよく考え、適切なサンプルサイズと指標を選ぶことが大切です。
よくある質問
| 指標 | 意味 |
|---|---|
| CFI | 比較適合度指標。0.9以上が目安。 |
| RMSEA | モデルの適合の誤差。小さいほど良い。 |
| SRMR | 観測データとモデルの差。小さいほど良い。 |
確認的因子分析の同意語
- 確認的因子分析
- 特定の因子構造仮説をデータで検証する目的の因子分析です。事前に因子数や各観測変数の因子負荷を仮定し、モデルの適合度を統計的指標で評価します。
- 検証的因子分析
- 理論で定めた因子構造をデータで検証するための手法です。因子数や因子と観測変数の割り当てをあらかじめ仮定して、データ適合を判断します。
- 確証的因子分析
- 理論・仮説をデータで確証することを目的とした因子分析。CFAと同義として使われることがあります。
- 仮説検証型因子分析
- 仮説の正しさを検証することを重視する因子分析。CFAの代替表現として使われることがあります。
- CFA(英語表記)
- Confirmatory Factor Analysis の略。日本語では確認的因子分析と呼ばれますが、英語表記の略称としてCFAを用いるケースも多いです。
確認的因子分析の対義語・反対語
- 探索的因子分析
- 確認的因子分析が事前に仮定した因子構造を検証するのに対し、探索的因子分析はデータを観察して潜在因子の数や構成を探る。因子数の決定や負荷の形をあらかじめ決めず、データのパターンから構造を推測します。
- 非確認的因子分析
- 確認的という語を使わず、検証よりも探索を優先するアプローチ。用語としては稀ですが、仮説を厳格に検証しない意味合いで使われることがあります。
- 探索的構造方程式モデリング
- CFA の制約を緩め、因子負荷の配置をより自由に扱える方法。探索的要素と構造方程式モデリングを組み合わせ、厳密な固定を避けたい場合に有効です。
- 仮説生成的因子分析
- データから新しい因子構造の仮説を生み出す目的の探索的手法。検証段階に移る前の仮説作りに適しています。
確認的因子分析の共起語
- 因子分析
- 観測変数の共通性を説明する潜在因子を推定する統計手法(探索的・検証的を含む総称)
- 探索的因子分析
- データから潜在因子の数と構造を探る手法。仮説を前提とせず因子を抽出
- 検証的因子分析
- 事前に仮定した因子構造がデータに適合するかを検証する手法
- 構造方程式モデリング
- 潜在変数と観測変数の関係を同時にモデル化する総合的手法
- モデル適合度
- データがモデルとどの程度一致しているかを示す総合評価
- 適合度指標
- CFI、RMSEA、SRMRなど、適合度を評価する複数の指標の総称
- カイ二乗検定
- モデルの適合度を評価する統計量。大規模データでは敏感になりやすい
- 自由度
- モデル内で自由に動かせるパラメータの数。カイ二乗検定と関連
- χ2/df比
- カイ二乗値を自由度で割った指標。低いほど良い目安は約2〜3以下
- RMSEA
- 近似誤差の平方根平均。低いほど良い。目安0.05以下
- CFI
- Comparative Fit Index。0.90以上が目安。モデル比較にも使う
- TLI
- Tucker-Lewis Index(NNFI)。CFIに類似、1に近いほど良い
- GFI
- Goodness-of-Fit Index。0.90以上が目安
- AGFI
- Adjusted Goodness-of-Fit Index。自由度補正付きのGFI
- SRMR
- Standardized Root Mean Square Residual。0.08以下が目安
- AIC
- Akaike Information Criterion。低いほど良いが相対比較で用いる
- BIC
- Bayesian Information Criterion。低いほど良い
- パス係数
- 潜在因子と観測変数の関係を示す回帰係数
- 因子負荷
- 観測変数がどの因子にどれだけ寄与するかを表す指標
- 潜在変数
- 観測できないがデータの共通因を表す変数
- 観測変数
- データとして直接観測できる指標変数
- 観測指標
- 観測変数のこと。指標変数とも呼ぶ
- 推定法
- データからモデルのパラメータを推定する方法
- 最大尤度法
- 尤度を最大化してパラメータを推定する一般的な推定法
- WLSMV
- 順序尺度データに適した推定法。ウェイト付き最小二乗法の拡張
- ロバスト推定
- 非正規性や外れ値を考慮した頑健推定
- 欠損データ
- データの欠損部分のこと
- 欠損値処理
- 欠損データを扱う方法(FIML、ペアワイズなど)
- 多変量正規性
- データが多変量正規分布に従うという仮定
- 正規性
- データが正規分布に近いこと
- 因子間相関
- 複数の潜在因子間の相関関係
- 共分散
- 観測変数間の共分散。因子構造を説明する
- 収束
- 推定計算が安定して収束すること
- 因子数
- CFAで仮定・指定する因子の数
- サンプルサイズ
- 分析に用いるデータ点の数。大きいほど安定
- データ前処理
- データのクリーニング・正規化・欠損値処理
- ソフトウェア
- CFAを実行する代表的なツール。AMOS、LISREL、Mplus、lavaan など
- 因子構造の検証
- 仮説の因子構造がデータに適合するかを検証
- 因子荷重
- 観測変数が所属する因子の寄与度
- 標準化解
- 標準化された推定結果。比較がしやすい
- 仮定検証
- 正規性・多変量正規性などの前提条件を確認
- データの正規性チェック
- データ分布が正規性に近いかを確認
- 推定結果の解釈
- 推定されたパラメータを解釈してモデルの意味を理解
確認的因子分析の関連用語
- 確認的因子分析
- 測定モデルを事前に仮定し、データがその仮定にどれだけ適合するかを検証する統計手法。潜在因子と観測変数の関係を決定して評価します。
- 探索的因子分析
- データから潜在因子の構造を発見する手法。因子数や因子と観測変数の関係をデータに基づき推定します。
- 構造方程式モデリング
- 測定モデルと構造モデルを同時に扱う統計的フレームワーク。CFAはSEMの一部で、因子間の関係や回帰も扱えます。
- 測定モデル
- 観測変数と潜在変数の関係を表す部分。因子負荷量と誤差項で構成され、妥当性の評価対象となります。
- 潜在変数
- 観測できない仮説上の概念。例として「満足度」「知識レベル」などがある。
- 観測変数
- データとして直接測定できる指標。質問項目や測定値など。
- 因子負荷量
- 潜在変数と観測変数の関連の強さを示す係数。正の値ほど観測変数が潜在因子の影響を受けていることを示します。
- 誤差項
- 観測変数に含まれる測定誤差やノイズを表す。
- 同定性
- モデルパラメータを一意に推定できる条件。適切な自由度と設定が求められます。
- 自由度
- モデルが自由に動けるパラメータの数。適合度評価や同定性に関係します。
- 適合度指標
- モデルがデータにどれくらい適合しているかを評価する指標の総称。複数を併用して判断します。
- CFI
- Comparative Fit Indexの略。理想的には1に近いほど良く、0.90以上を目安にします。
- TLI
- Tucker-Lewis Indexの略。CFIと同様に適合度の目安で、0.90以上を目安にします。
- RMSEA
- 近似誤差の平方根平均。小さいほど良く、0.05以下を良好とされることが多いです。
- SRMR
- 標準化残差の平方根平均。0.08以下が良好とされます。
- AIC
- 赤池情報量基準。モデル間の相対比較に用い、値が小さいほどデータに適合しやすいとされます。
- BIC
- ベイズ情報量基準。サンプルサイズを考慮した情報量基準で、小さいほど良いと判断されます。
- χ2検定
- カイ二乗検定。モデルとデータの適合を統計的に評価します。大きなカイ二乗値は適合が悪いことを意味します。
- 欠測データ処理
- 欠測データへの対応方法。リストワイズ削除、ペアワイズ削除、全情報最大尤推定(FIML)などが利用されます。
- FIML
- 全情報最大尤推定。欠測データを含むデータセットに対して最大尤度を推定する手法です。
- 多変量正規性
- ML推定の前提となる正規性の仮定。非正規性が強い場合はロバスト推定や別の推定法を検討します。
- ML推定
- 最大尤推定。データの尤度を最大化してパラメータを推定する標準的な方法です。
- ロバスト推定
- 非正規性や外れ値、小サンプル時の偏りを抑える推定法。例としてMLRなどがある。
- 標準化因子負荷量
- 標準化済みの因子負荷量。単位を統一して比較できます。
- 非標準化因子負荷量
- 元のスケールの因子負荷量。研究設問に応じた解釈がしやすい場合に用いられます。
- パス図
- モデルの関係性を矢印とノードで図示した図。モデルの理解を助けます。
- 修正指標
- モデルを改善するための指標で、 Modification Indices (MI) などが用いられます。
- 因子間相関
- 複数の潜在因子間の相関を表す。モデルに因子間の関連を許容するかどうかが決まります。
- 階層 CFA
- 階層構造の因子を扱う確認的因子分析。上位因子と下位因子の関係を表現します。
- サンプルサイズ要件
- 信頼性の高い推定のための最低限のデータ数。設計によって異なりますが一般に多くのサンプルが望まれます。
- Cronbachのα
- 内部一貫性を示す信頼性指標。0.7以上が目安とされることが多いです。
- 測定の信頼性と妥当性
- 測定が安定して再現性があり、測りたい概念を正しく測れているかを評価する概念。



















