

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
正規性の検定とは?
統計でデータを分析するとき、結果を信頼できるかどうかは「データが正規分布に近いかどうか」に大きく影響します。正規分布とは、山のように左右対称で中央にデータが集中する形のことです。多くの統計手法はこの正規性を前提に動くため、事前にデータの正規性を確認することが大切です。正規性の検定は、その前提が成り立つかどうかを数値的に判断するための検定です。
ここでのポイントは「検定の結果がすべてを決めるわけではない」ということ。検定はあくまでも目安であり、データの性質や研究目的と合わせて解釈することが大切です。
なぜ正規性の検定が必要なのか
多くの統計分析では、データが正規分布に近いほど、平均や分散といった指標で結果を安定して推定できます。例えば平均を比較するt検定や回帰分析などは、正規性の前提が崩れると結果が変わってしまうことがあります。
正規性の検定を使う場面は大きく分けて2つあります。1つはデータの準備段階、もう1つは分析方法の選択です。前者ではデータの性質を把握して最適な検定を選び、後者では正規性の前提を満たしているかを確認してから適切な分析を行います。
代表的な正規性の検定
正規性を判断する方法にはいくつかの検定があります。代表的なものを4つ紹介します。
| 検定名 | 特徴 | 使いどころ |
|---|---|---|
| Shapiro-Wilk検定 | 小さめのデータに強く、正規性を厳密に評価します。 | 標本数が50以下のデータに特におすすめ。 |
| Kolmogorov-Smirnov検定 | 分布全体の近さを見るが、母集団分布を仮定することがあります。 | 大きなデータや連続分布の検定に使われます。 |
| Anderson-Darling検定 | 尾の部分を重視して正規性を評価します。 | データの端でのばらつきが問題になる場合に有効。 |
| Jarque-Bera検定 | 歪度と尖度を使って正規性を判断します。 | 経済データなど、回帰分析前の前処理として使うことが多い。 |
検定を使うときのポイントとして、サンプルサイズと検定の前提を確認することが挙げられます。Shapiro-Wilkは小さなデータで信頼性が高い一方、Kolmogorov-Smirnovは大きなデータでも使えますが結果の解釈に注意が必要です。Anderson-Darlingは尾部のばらつきに敏感で、Jarque-Beraは歪みと尖度を見ます。
実践的な使い方の流れは以下のとおりです。1) データを整理し、欠損値を扱う。2) サンプルサイズと分布の特徴を確認する。3) 適切な正規性検定を選ぶ。4) 検定を実行し、p値を確認する。5) p値が通常の有意水準(例: 0.05)より小さい場合、正規性は否定され、別の分析方法を検討します。6) 研究の前提を報告して結果を解釈します。
初心者へのコツとしては、まずデータの形を観察することです。山型に近いか、左右対称かを目視でチェックし、次に検定を併用して判断材料を増やすと良いです。最後に、正規性の検定は「万能の答え」ではなく、分析の一部として活用するものだと覚えておきましょう。
正規性の検定の同意語
- 正規性の検定
- データが正規分布に従うかどうかを判断する統計的検定の総称(例:シャピロ・ウィルク検定、コルモゴロフ–スミノフ検定、アンダーソン–ダーリング検定など)
- 正規分布性の検定
- データが正規分布に従うという仮定を検証する検定のこと。
- 正規分布性の検証
- データが正規分布に従うかを検証する作業・検定のこと。
- 正規分布適合性の検定
- データが特定の正規分布へ適合するかを判定する検定の別称。
- 正規性検証
- データの正規性を評価・検証する行為。
- 正規分布適合性検証
- データが正規分布へ適合しているかを検証する手法のこと。
- ノーマリティ検定
- 英語の normality test の日本語表現。データが正規分布に従うかを検定すること。
- ノーマリティ検証
- データの正規性を検証する作業。
正規性の検定の対義語・反対語
- 非正規性の検定
- データが正規分布でないかを検証する検定。正規性の検定の対極に位置する発想で使われます。
- 非正規分布の検定
- データが正規分布でない(非正規分布)かどうかを判断する検定。
- ノンノーマリティ検定
- Non-normality(非正規性)を検定する手法の総称として使われるカジュアルな表現。
- 正規性を否定する検定
- データが正規分布であるという仮説を否定する検定。結果として非正規性を示します。
- 正規分布以外の分布検定
- データが正規分布以外の分布に従うかを検証する検定の意図を表します。
- 非正規性仮説検定
- 正規性を仮定しない、非正規性を検証する仮説検定の見方。
- 非対称性検定
- 分布が左右対称かどうかを検定することで、正規分布の対称性の特性と反対の性質を評価する表現。
- ノンノーマリティ仮説検定
- 非正規性を仮説として検証する検定の一種を指す言い方です。
正規性の検定の共起語
- 正規分布
- データが従うと期待されるベル型の確率分布。正規性の検定の対象となる基本概念です。
- QQプロット
- 観測データの分位数を正規分布の分位数と比較して直線に近いかを視覚的に確認できるグラフ手法。
- シャピロ・ウィルク検定
- Shapiro–Wilk test。小~中規模データにおける正規性検定で高い検出力を持つ代表的な検定。
- コルモゴロフ-スミノフ検定
- Kolmogorov–Smirnov test。理論分布(ここでは正規分布)に従うかを検定する方法。
- リリーフォース検定
- Lilliefors test。未知の平均・分散を前提とした正規性の適合性を評価する検定。
- アンダーソン-ダーリング検定
- Anderson–Darling test。尾部の適合度も重視して正規性を検定する手法。
- D'Agostino検定
- D’Agostino’s K^2 test。歪度と尖度を用いて正規性を検定する方法。
- Jarque-Bera検定
- JB検定。歪度と尖度の組合せから正規性を評価する統計量に基づく検定。
- 残差の正規性
- 回帰分析の残差が正規分布に従うかを評価する観点。妥当な推定の前提となることが多い。
- 母集団分布
- データのもととなる母集団の分布の形。正規性検定はこの分布が正規かを判別する。
- 検定統計量
- 各検定で計算される統計量。検定の結論はこの値と分布の関係で出される。
- p値
- 検定結果の有意性を示す確率。小さいほど帰無仮説を棄却しやすい。
- 有意水準
- p値と比較する基準値。よく使われるのは5%(0.05)など。
- 帰無仮説
- データが正規分布に従う、という仮説。検定の比較対象となる基本仮説。
- ノンパラメトリック検定
- 正規性を仮定しない検定群。データが非正規でも適用できる。
- パラメトリック検定
- 正規性を前提とする検定群。t検定やANOVAなどが代表例。
- 外れ値
- データの中で異常に大きい/小さい点。正規性検定の結果に影響を与えることがある。
- サンプルサイズ
- 検定の検出力や信頼性に直結するデータ数。小さいと検出力が落ちることがある。
- 検定の前提条件
- 正規性検定を適用する際に満たしておくべき条件(独立性、データのスケールなど)。
- 線形回帰の残差正規性
- 線形回帰分析の前提の一つ。残差が正規分布に従うと推定が安定する。
正規性の検定の関連用語
- 正規性の検定
- データが正規分布に従うかどうかを判断する統計的検定の総称です。
- 正規分布
- 平均を中心に左右対称で釣鐘型の連続確率分布。多くの統計手法の前提となる基本分布です。
- 帰無仮説
- データは正規分布に従う(正規性が成り立つ)という仮説。
- 対立仮説
- データは正規分布に従わない、または別の分布をとるという仮説。
- p値
- 観測データが帰無仮説の下でどれだけ極端かを表す指標。小さいほど棄却の根拠が強いです。
- 有意水準
- 帰無仮説を棄却する際の閾値。例: 0.05。設定次第で厳しさが変わります。
- Shapiro-Wilk検定
- 小~中規模サンプルで高い検出力を持つ正規性検定。
- Anderson-Darling検定
- 尾部の適合度を重視する正規性検定で、全体の適合度も評価します。
- Kolmogorov-Smirnov検定
- 経験分布と理論分布の最大距離を用いる検定。パラメータ知覚が既知である場合に限界があります。
- Lilliefors検定
- パラメータをデータから推定するKS検定の修正版。
- Jarque-Bera検定
- データの歪度と尖度から正規性を評価する検定。特に時系列データで用いられます。
- D'AgostinoのK^2検定
- 偏度と歪度を組み合わせて正規性を評価する検定。
- Shapiro-Francia検定
- Shapiro-Wilkに類似した正規性検定。大規模サンプルで用いられることが多いです。
- Pearsonのχ^2検定(正規性)
- データをビン化して観測度と期待度の差から正規性を評価する古典的検定。
- QQプロット
- 理論正規分布とデータの分位点を比較する視覚的検定ツール。直線に近いほど正規性が高いと判断します。
- Cramér–von Mises検定
- 経験分布と理論分布の差を二乗和で評価する適合度検定。正規性にも用いられます。
- 検定統計量
- 各検定で計算される統計量のこと。例としてShapiro-WilkのW、AD統計量、KS統計量などがあります。
- 自由度
- 検定の分布を決定するパラメータの数。特にパラメータを推定する場合に影響します。
- 標本サイズ
- データのサンプル数。規模が小さいと検出力が低下し、大きいと検出力が高まります。
- 外れ値
- データの極端な値。正規性検定の結果を大きく左右することがあるため、事前処理が重要です。
- データ変換
- 正規性を高める目的でデータを変換する手法。例: 対数変換、Box-Cox変換、平方根変換。
- Box-Cox変換
- データを正規分布に近づけるための指数変換の一種。
- 対数変換
- データを自然対数などに変換して正規性を改善する基本的な手法。
- 非パラメトリック検定
- 正規性を前提とせずに比較を行う検定の総称。例: Wilcoxon検定、Mann-Whitney検定。



















