正規性の検定とは？初心者にもわかるやさしい解説と使い方ガイド共起語・同意語・対義語も併せて解説！

この記事を書いた人

高岡智則

年齢：33歳性別：男性職業：Webディレクター（兼ライティング・SNS運用担当）居住地：東京都杉並区・永福町の1LDKマンション出身地：神奈川県川崎市身長：176cm 体系：細身〜普通（最近ちょっとお腹が気になる）血液型：A型誕生日：1992年11月20日最終学歴：明治大学・情報コミュニケーション学部卒通勤：京王井の頭線で渋谷まで（通勤20分）家族構成：一人暮らし、実家には両親と2歳下の妹恋愛事情：独身。彼女は2年いない（本人は「忙しいだけ」と言い張る）

正規性の検定とは？

統計でデータを分析するとき、結果を信頼できるかどうかは「データが正規分布に近いかどうか」に大きく影響します。正規分布とは、山のように左右対称で中央にデータが集中する形のことです。多くの統計手法はこの正規性を前提に動くため、事前にデータの正規性を確認することが大切です。正規性の検定は、その前提が成り立つかどうかを数値的に判断するための検定です。

ここでのポイントは「検定の結果がすべてを決めるわけではない」ということ。検定はあくまでも目安であり、データの性質や研究目的と合わせて解釈することが大切です。

なぜ正規性の検定が必要なのか

多くの統計分析では、データが正規分布に近いほど、平均や分散といった指標で結果を安定して推定できます。例えば平均を比較するt検定や回帰分析などは、正規性の前提が崩れると結果が変わってしまうことがあります。

正規性の検定を使う場面は大きく分けて2つあります。1つはデータの準備段階、もう1つは分析方法の選択です。前者ではデータの性質を把握して最適な検定を選び、後者では正規性の前提を満たしているかを確認してから適切な分析を行います。

代表的な正規性の検定

正規性を判断する方法にはいくつかの検定があります。代表的なものを4つ紹介します。

検定名	特徴	使いどころ
Shapiro-Wilk検定	小さめのデータに強く、正規性を厳密に評価します。	標本数が50以下のデータに特におすすめ。
Kolmogorov-Smirnov検定	分布全体の近さを見るが、母集団分布を仮定することがあります。	大きなデータや連続分布の検定に使われます。
Anderson-Darling検定	尾の部分を重視して正規性を評価します。	データの端でのばらつきが問題になる場合に有効。
Jarque-Bera検定	歪度と尖度を使って正規性を判断します。	経済データなど、回帰分析前の前処理として使うことが多い。

検定を使うときのポイントとして、サンプルサイズと検定の前提を確認することが挙げられます。Shapiro-Wilkは小さなデータで信頼性が高い一方、Kolmogorov-Smirnovは大きなデータでも使えますが結果の解釈に注意が必要です。Anderson-Darlingは尾部のばらつきに敏感で、Jarque-Beraは歪みと尖度を見ます。

実践的な使い方の流れは以下のとおりです。1) データを整理し、欠損値を扱う。2) サンプルサイズと分布の特徴を確認する。3) 適切な正規性検定を選ぶ。4) 検定を実行し、p値を確認する。5) p値が通常の有意水準（例: 0.05）より小さい場合、正規性は否定され、別の分析方法を検討します。6) 研究の前提を報告して結果を解釈します。

初心者へのコツとしては、まずデータの形を観察することです。山型に近いか、左右対称かを目視でチェックし、次に検定を併用して判断材料を増やすと良いです。最後に、正規性の検定は「万能の答え」ではなく、分析の一部として活用するものだと覚えておきましょう。

正規性の検定の同意語

正規性の検定: データが正規分布に従うかどうかを判断する統計的検定の総称（例：シャピロ・ウィルク検定、コルモゴロフ–スミノフ検定、アンダーソン–ダーリング検定など）
正規分布性の検定: データが正規分布に従うという仮定を検証する検定のこと。
正規分布性の検証: データが正規分布に従うかを検証する作業・検定のこと。
正規分布適合性の検定: データが特定の正規分布へ適合するかを判定する検定の別称。
正規性検証: データの正規性を評価・検証する行為。
正規分布適合性検証: データが正規分布へ適合しているかを検証する手法のこと。
ノーマリティ検定: 英語の normality test の日本語表現。データが正規分布に従うかを検定すること。
ノーマリティ検証: データの正規性を検証する作業。