

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
スピアマン相関とは?
スピアマン相関は、2つのデータがどれくらい「同じ順番」で並ぶかを表す指標です。英語名は Spearman's rank correlation coefficient。データの分布形や外れ値に影響されにくい、非パラメトリックな相関の考え方としてよく使われます。
スピアマン相関とピアソン相関の違い
ピアソン相関はデータの値そのものの線形関係を測るのに対し、スピアマン相関は順位の関係を使います。そのため、データが厳密な直線関係でなくても、1つの変数が増えるともう1つも増えるような単調な関係があれば、スピアマン相関は高い値を示します。
計算の流れ
計算の基本は次の4つのステップです。
1) 変数XとYのデータを順位に置き換えます。同じ値には同じ順位をつけます(ties)。
2) 各データ点について rankX と rankY の差 d_i を計算します。
3) d_i をすべてのデータ点について平方し、Σ d_i^2を求めます。
4) データ点の個数を n として、rs = 1 - 6 Σ d_i^2 / [n(n^2 - 1)]で rs を算出します。
簡単な例
次のデータを使って計算してみましょう。データ点は5点です。
| 項目 | X | Y | rankX | rankY | d | d^2 |
|---|---|---|---|---|---|---|
| データ1 | 102 | 70 | 3 | 3 | 0 | 0 |
| データ2 | 98 | 65 | 2 | 2 | 0 | 0 |
| データ3 | 120 | 80 | 5 | 5 | 0 | 0 |
| データ4 | 110 | 75 | 4 | 4 | 0 | 0 |
| データ5 | 95 | 60 | 1 | 1 | 0 | 0 |
この例ではすべての d が 0 なので Σ d^2 = 0 となり、rs は 1になります。つまり、X と Y は完全に単調増加の関係があると解釈できます。
解釈のポイントと実務での使い方
・rsの値は -1 から +1 の範囲をとります。+1 に近いほど強い正の単調関係、-1 に近いほど強い負の単調関係、0 に近いほど単調関係が弱いことを意味します。
・スピアマン相関は順位データや外れ値の影響を受けにくい点が魅力です。複数の観測値が同時に大きい/小さいといった現象(外れ値の影響)を受けやすいときに有効です。
・ただし、rs が高くても必ずしも「因果関係」があるわけではありません。あくまで関連の強さと方向を示す指標です。
よくある誤解
- 誤解1: rs が +1 なら必ず完璧な直線関係がある。
実際には単調な関係であれば +1 に近づくが、データの測定値の揺れや結合の仕方によっては厳密には +1 にならないこともある。 - 誤解2: rs が 0 なら全く関係がない。
単調な関係を見落としている可能性があり、線形でも非線形でも別の関係があるかもしれません。
まとめ
スピアマン相関は、データの順位を用いて2つの変数の関係の強さと方向を評価する、非パラメトリックな指標です。データが線形ではなくても、単調な関係がある場合には有効です。計算は順位の差を用いて行い、公式 rs = 1 - 6 Σ d_i^2 / [n(n^2 - 1)] を使います。実務では、データの分布や外れ値の影響を考慮しつつ、Pearson相関と併用して総合的に判断するのがよくあります。
補足
興味があれば、実際のデータに対してスピアマン相関を計算してみましょう。ソフトウェアやオンラインのツールを使えば、順位の付け方や同値の扱い(ties)の処理を自動でしてくれます。
スピアマン相関の同意語
- スピアマン相関
- スピアマンの順位相関係数の略称。データを順位に変換してその順位の間の相関を測る指標で、非線形の単調関係にも対応します。
- スピアマンの順位相関係数
- データの順位を用いて計算される相関係数。-1から1の範囲で、値が1に近いほど正の単調関係、-1に近いほど負の単調関係を示します。
- スピアマンのrho
- ρ(rho)として表される、スピアマン相関係数そのものの別称。
- Spearman's rho
- 英語表現。スピアマン相関係数のこと。
- 秩相関係数
- 順位を用いて相関を測る指標のうちの一つ。特にSpearman法を指すことが多く、値は-1から1。
- 秩相関
- 順位に基づく相関を指す総称。Spearman法を指す場合が多い用語。
- 順位相関係数
- 順位に置換して計算する相関係数の総称。主にSpearman法による相関を指します。
スピアマン相関の対義語・反対語
- ピアソン相関係数
- スピアマン相関の対比となる、連続変数の線形関係を前提にした相関を測る指標。値は-1〜1で表され、直線的な関係の強さを示します。
- パラメトリック相関
- パラメトリックな仮定の下で推定される相関。例としてピアソン相関があり、正規分布などの前提を必要とします。
- ケンドールの順位相関係数
- Spearmanと同様に順位に基づく相関を測る指標だが、計算方法が異なる。値は-1〜1で表され、秩序関係の強さを示します。
- 無相関
- 二変数間に統計的な関係がほとんどない状態。相関係数が0に近いことが多いです。
- 正の相関
- 二変数が同じ方向に変動する関係。Spearmanで正の値に近づくほど順位の一貫性が高いことを示します。
- 負の相関
- 二変数が反対方向に変動する関係。Spearmanで負の値に近づくほど順位の反方向性が高いことを示します。
- 完全相関
- 二変数の関係が直線的・順位的に完全に一致する状態。相関係数は+1または-1となります。
- 独立
- 二変数が互いに影響を及ぼさない状態。統計的には相関が0に近いことが期待されます。
スピアマン相関の共起語
- スピアマン相関係数
- Spearmanの秩序データに基づく相関係数。データを順位に変換した後の順位間の相関を測定します。-1から1までの値を取り、+1は完全な正の単調関係、-1は完全な負の単調関係を示します。
- 順位相関
- データの順位同士の関係を評価する相関の一種。スピアマン相関はこの分類に該当します。
- ランク相関
- データを順位(ランク)で結ぶ関係を測る指標。スピアマン相関はランク相関の代表例です。
- データの順位付け
- 元データを小さい順などに並べて順位をつける処理。Spearmanではこの順位データを用います。
- 順位データ
- 数値を逐次的な順位として扱うデータ。Spearman相関の出発点となるデータ形です。
- ランキングデータ
- データの順序を示すデータのこと。順位データとほぼ同義で使われます。
- 単調性
- 2変量の関係が一方が増えるともう一方も一定方向に増減する性質。Spearmanはこの単調性を検出します。
- ρ(rho)
- スピアマン相関係数の記号。値は-1〜1の範囲で、関係の強さと方向を示します。
- ピアソン相関
- 線形関係を前提とした相関の指標。Spearmanは順位を使うため、非線形・非正規データにも適用できます。
- 相関係数
- 変数間の関係の強さを0〜1または-1〜1などの指標で表した数値。Spearmanはその一種です。
- ケンドールのτ
- 別の順位相関の指標。Spearmanと異なる計算方法で同様に-1〜1の範囲を取り、順位データの関係を測ります。
- ノンパラメトリック
- 母集団分布の仮定を厳しく要求しない統計手法。Spearmanは典型的なノンパラメトリック手法です。
- p値
- 検定の有意性を示す確率。小さければ観測された相関が偶然とは言えない可能性が高くなります。
- 有意性
- 統計的に有意かどうかの判断基準。p値と合わせて解釈します。
- 正規分布の仮定不要
- Spearmanは正規分布を前提としません。ノンパラメトリックな点がこの特徴です。
- Python
- データ分析でよく使われるプログラミング言語。scipy.stats.spearmanrなどの関数を使ってSpearman相関を計算できます。
- SciPy
- Pythonの科学計算ライブラリ。統計関数を多く提供します。
- scipy.stats.spearmanr
- SciPyの関数。2変数のSpearman相関係数とp値を返します。
- R言語
- 統計解析向けの言語。Spearman相関を簡単に計算できます。
- Rの cor(..., method='spearman')
- RでSpearman相関を計算する代表的な方法。method='spearman'を指定します。
- Excel
- 表計算ソフト。標準機能だけでは直接Spearmanを取ることは難しいが、順位付けと相関関数を組み合わせる手法も紹介されます。
- 単調関係の検出
- 2変量の関係が単調であるかを判定する能力。Spearmanがこれを評価します。
- データ前処理
- 欠損値対応や外れ値の扱いは分析結果に影響するため事前に整えることが重要です。
スピアマン相関の関連用語
- スピアマン相関
- スピアマンの順位相関係数のこと。データを順位に変換して2変数の関連性を測るノンパラメトリックな指標。
- ランク相関
- 順位を用いて変数間の関係を評価する指標の総称。SpearmanとKendallが代表的。
- 順位データ
- 観測値を小さい順に割り当てた順位データ。元データの尺度に依存せず比較可能。
- スピアマンの順位相関係数の計算公式
- 基本公式は rho = 1 - 6 Σ d_i^2 / (n(n^2−1))。ただし同順位がある場合は、順位を用いた一般式で計算する。
- 同順位の取り扱い
- 同じ値には平均順位を割り当てるなど、ties を適切に処理して計算を安定化させる。
- ピアソンの相関係数
- 線形関係を測る指標。連続データの正規性・線形性を前提とするのに対し、Spearmanは前提が緩い。
- Kendallのτ
- 順位間の一致と不一致を基に相関を測る別のランク相関指標。ties も扱える。
- Kendallのτ-b/τ-c
- Kendallのτの同順位補正型。ties が多い場合の安定性を高める。
- 有意性検定
- rho が 0 でないかを検定する手法。サンプルサイズに応じて正規近似や近似検定を用いる。
- p値
- 帰無仮説(無相関)のもとで、観測データが得られる確率。小さいほど帰無仮説を棄却しやすい。
- t検定による検定
- rho の t 検定を用いて有意性を判定する。式は t = rho * sqrt((n-2)/(1−rho^2))、自由度 n-2。
- ノンパラメトリック検定
- 分布に仮定を置かない検定の総称。Spearmanもその一種。
- 欠損値の扱い
- 欠損がある場合はペアごと除外する(ペアワイズ除去)などの方法をとることが多い。
- 単調関係と非線形性
- Spearman は単調関係を検出する。曲線的でも単調であれば高い相関を示すことがあるが、非単調だと低くなる。
- 使い分けのポイント
- データが順序尺度または非正規分布の場合は Spearman、正規分布かつ線形関係が前提なら Pearson を選ぶと良い。
- Pythonでの計算方法
- scipy.stats.spearmanr(x, y) で rho と p値を取得できる。
- Rでの計算方法
- cor(x, y, method = 'spearman') または cor.test(x, y, method = 'spearman') で有意性を検定。
- 長所
- 前提が緩く、外れ値の影響を受けにくく、データ尺度に敏感でない。
- 短所
- 結果の解釈が難しく、絶対的な共分散情報は得られない。
- 信頼区間の推定
- ブートストラップ等を用いて rho の信頼区間を推定することが可能。
- 実務での適用例
- 教育データの成績順位と出席回数の関連、アンケート回答の順位の一致度、医療データの危険因子の順位関係など。



















