

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
dixon法とは?
dixon法は、少ないデータの中から「外れ値」を見つけ出すための統計的な手法です。外れ値は、データのばらつきを大きくしてしまい、平均値や結論を歪めることがあります。dixon法は、小さな標本サイズ(通常はN=3〜12程度)で有効なのが特徴です。
仕組みの考え方は、整列されたデータを並べ、端の値で「疑われる外れ値」を仮定します。疑わしい値が外れ値である場合、隣接するデータとの間の差(隙間)と、全体の幅(最大値と最小値の差)との比を計算します。この比をQと呼び、Qが事前に決めた臨界値を超えると、外れ値と判断します。
公式は次のとおりです。データを x1 ≤ x2 ≤ ... ≤ xN に並べたとき、疑われる端の値が小さい方の場合は Q = (x2 - x1) / (xN - x1)、大きい方の場合は Q = (xN - xN-1) / (xN - x1) となります。Nはデータの個数、x1は最小値、xNは最大値です。
この方法には前提条件があります。まず、元のデータが近似的に正規分布に従っていることが前提になることが多いです。データが非対称だったり、複数の外れ値があるとdixon法は正しく機能しないことがあります。また、一度に1つの外れ値のみを検出するため、複数の外れ値があるデータには適していません。これらの点に注意して、他の検定と組み合わせて使うと良いでしょう。
使い方のステップ(初心者向けの流れ)は次のとおりです。
1) データを小さな標本として集める。Nは3〜12程度が目安です。
2) データを昇順に並べ、外れ値を疑う端を決める。
3) 上の公式のどちらかを用いてQを計算する。
4) 適切な有意水準に対するQ臨界値と比較する。Qが臨界値を超えれば外れ値と判断する。
5) 外れ値と判断した場合は、データセットから除外して再計算することもあります。
例を見てみましょう。データとして以下の5つの値を考えます。 例:1.0, 1.1, 1.2, 1.3, 3.5。最大値3.5が外れ値かもしれないと仮定します。x1=1.0, x2=1.1, xN-1=1.3, xN=3.5 とおくと、疑われる外れ値が最大値である場合のQは
Qの計算:Q = (xN - xN-1) / (xN - x1) = (3.5 - 1.3) / (3.5 - 1.0) = 2.2 / 2.5 = 0.88 です。N=5、α=0.05 のときのQ臨界値は表を参照しますが、0.88は多くの場面で臨界値を超えることが多く、外れ値と判断される可能性が高いです。実際には、DixonのQ表でN=5、α=0.05の値を確認し、結果を確定します。
表の使い方も合わせて紹介します。下の表は、N(データの個数)とアルファ値0.05におけるQ臨界値の例を示しています(実際には正式な表を参照してください)。
| Q_crit(0.05) | |
|---|---|
| 5 | 表を参照 |
| 6 | 表を参照 |
| 7 | 表を参照 |
実務では、このような手順で外れ値を検出します。注意点として、データが極端に非正規だったり、複数の外れ値がある場合にはdixon法は適さないことが多いです。代わりに他の検定(例えばグラフ的な方法や別の統計テスト)を使いましょう。
まとめとして、dixon法は小さな標本で外れ値を見つけるためのシンプルな検定です。難しく考えすぎず、データの性質と適用条件を確認しながら使うと、データの信頼性を高める一助になります。
dixon法の同意語
- ディクソン法
- 統計学で外れ値を検出する Dixon の検定法を指す総称。データの端にある異常値を判断する際に用いられる。
- Dixon法
- Dixon の検定法の総称。外れ値検出に使われることが多い。
- ディクソンの検定
- Dixon が提案した検定手法の総称。主に Dixon's Q検定のことを指す。
- Dixonの検定法
- Dixon が開発した検定法の総称。外れ値検出を中心とする方法を含むことが多い。
- ディクソンのQ検定
- 統計学の外れ値検定の一つで、データの最も端の値が外れているかを判断する方法。Dixon の検定の一種。
- Dixon's Q検定
- Dixonの検定として知られる外れ値検出法。データの最小値・最大値の近接度を基に判断する。
- ディクソンのアップダウン法
- 心理物理学の閾値推定法の一つで、刺激強度を階段状に上下させて閾値を推定する方法。
- Dixonのアップアンドダウン法
- 同上、刺激の上下動を繰り返し、閾値を推定する階段法。
- ディクソン法(階段法)
- Dixon の階段法として、刺激の閾値を推定する方法の一つ。
- Dixon's up-and-down method
- Dixon によるアップアンドダウン法。心理実験で感覚閾値を推定する階段法。
dixon法の対義語・反対語
- 非Dixon法
- Dixon法以外の手法・検定を指す、対義語として用いられる概念。
- Dixon法以外の検定
- Dixon法とは別の検定手法全般を指す、対になる名称。
- 一般的手法
- 特定の名称を持たない一般的な手法を指す対義語。
- 直感法
- データや統計に頼らず、直感や経験に基づいて判断する手法。
- 経験則法
- 過去の経験則に基づいて判断する手法で、統計的検定を用いないケース。
- 質的評価法
- 数値化された検定ではなく、質的な評価を重視する手法。
- 定性的検定
- 定性的データを扱い、定量化を前提としない検定・評価のアプローチ。
- 無手法
- 特定の手法を用いず、手法自体が不存在・不使用の状態。
- 代替法
- Dixon法の代替として用いられる他の検定・手法の総称。
- 古典的方法を使わないアプローチ
- 伝統的な統計法に依存せず、現代的・非古典的な手法を採用するアプローチ。
dixon法の共起語
- ディクソン法
- 小標本データに対する外れ値検出の統計的手法。データを昇順に並べ、最大値または最小値が外れ値かをQ統計量と臨界値で判断します。
- ディクソンQ検定
- ディクソン法の主要な検定形式の一つ。データの最小値または最大値が外れ値かどうかを、Q統計量と対応する臨界値で判定します。
- 外れ値検定
- データセットに含まれる異常値(外れ値)の有無を検定する手法群の総称。Dixon法はその一種です。
- 外れ値の検出
- データの中から他の値と著しく離れている値を見つけ出す作業。
- 小標本
- データ点数が少ない状態を指す用語。Dixon法は小標本向けの外れ値検出法として用いられます。
- Q検定
- 外れ値検出の検定の総称。Dixon法で用いられるQ検定を指すことが多いです。
- Q統計量
- 外れ値の有無を判断する比率で、通常は gap / range の形で定義される統計量です。
- 臨界値表
- サンプルサイズごとに定められたQ検定の臨界値をまとめた表。
- 有意水準
- 検定の閾値となる確率。例: 0.05(5%)など。
- p値
- 観測データが帰無仮説の下で得られる確率。検定の補足情報として用います。
- 片側検定
- 片側だけで外れ値の可能性を検討する検定形態。Dixon法は一般に片側検定として使われます。
- 正規性前提
- データが正規分布に近い、または正規分布を仮定して適用する前提。
- 順序統計量
- データを昇順または降順に並べたときの順位情報。Dixon法では最小値と最大値の位置が重要です。
- 最大値・最小値
- データの端の値。外れ値候補として検討されることが多いです。
- サンプルサイズ
- データ点の数。Dixon法は一般に n が3〜30程度の小標本で適用されます。
- データセット
- 検定に用いる観測値の集合。
- データ整理
- データを整然と並べ替え、分析の準備をする作業。
- 計算式
- Q統計量の定義式。例: Q = (隣接するデータの差) / (データの範囲) など。
- 手順
- Dixon法の大まかな流れ。データの並べ替え、Qの計算、臨界値と比較、外れ値の判定、場合により除外。
- 応用分野
- 分析化学、品質管理、環境測定など、測定データの外れ値検出に用いられる現場分野。
- デメリット
- 複数の外れ値がある場合の適用性が低い、サンプルサイズ依存で結果が不安定になることがある、分布仮定の影響を受けやすい。
- 代替法
- Grubbs検定、IQR法、Roy–Grubbs検定など、Dixon法の代替・比較対象となる外れ値検出手法。
- Grubbs検定
- 外れ値検出の代表的な検定の一つ。 Dixon法の代替として用いられることがある。
- IQR法
- 四分位範囲を用いた外れ値検出の方法。 Dixon法と併せて検討されることがある。
- 実務の注意点
- 同一データセットで複数の外れ値が疑われる場合は慎重に判断し、臨界値範囲を確認して適用します。
- Roy-Grubbs検定
- Roy–Grubbs検定とも呼ばれる、正規分布に基づく外れ値検出検定の一つ。Dixon法と比較されることがあります。
- 正規分布仮定
- 検定を適用する際に正規分布を前提とする場合が多い。非正規データでは信頼性が低下する可能性あり。
dixon法の関連用語
- Dixon法
- 小さな標本において1つの外れ値を検出する統計的検定。データを最大値または最小値側の候補として取り扱い、Q統計量を計算して臨界値と比較します。正規分布の仮定の下で用いられ、外れ値の除外判断を行います。
- 外れ値
- データ集合の中で他のデータと著しく離れている値。Dixon法はこの“外れ値候補”を検出するための検定の一種です。
- Q統計量
- Dixon法で用いる検定統計量。最大値候補と次に近い値の差をデータの全範囲で割って求めます(最小値側の検定では最小値と次の値の差を用います)。
- 臨界値
- Dixon法の閾値。サンプルサイズと有意水準に応じた表から取り出し、計算したQ統計量と比較します。これを超えると外れ値と判断します。
- 有意水準
- 検定の基準となる確率の閾値。よく使われる値は0.05や0.01で、Dixon法の臨界値はこれに対応した表が用意されています。
- 正規分布
- Dixon法はデータが正規分布に従うことを前提とする検定です。正規性が大きく損なわれる場合には適用を避けるか、別の方法を選択します。
- 標本サイズ
- Dixon法は小さな標本に適用されることが多く、対象となるサンプル数は表の区分により3〜10程度が一般的です。
- 片側検定
- Dixon法では外れ値が端のどちらか一方にある可能性を検討します。最大値側または最小値側のいずれかの片側検定として使われます。
- 両側検定
- Dixon法は通常、端の片側に外れ値がある場合に用いられます。両側検定の形で同時に検出する用途は一般的ではありません。
- グラブス検定
- Grubbs検定とも呼ばれ、データの平均と標準偏差を基に最大偏差が外れ値かを判定する、外れ値検出の別の統計検定です。
- 箱ひげ図
- 箱ひげ図(ボックスプロット)はデータの分布と外れ値の視覚的表示を提供します。Dixon法の前後検討の補助として使われます。
- データクリーニング
- データ集合から外れ値の有無を検討し、必要に応じて除外・補正・再測定を行う前処理工程です。
- データ前処理
- 分析前のデータを整える作業。欠損値処理、外れ値の扱い、正規化などを含みます。
- 注意点
- Dixon法は正規性・独立性・単一の外れ値という前提が崩れると信頼性が低下します。データセットが大きい場合には適用に注意し、複数の検定を組み合わせると良い場合があります。
- 用途・適用場面
- 主に小規模な実験データや測定データにおいて、1つの外れ値の有無を判断したい時に使われます。化学・材料・品質管理などの分野で用いられることが多いです。



















