

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
r二乗値とは
r二乗値は回帰分析でよく使われる指標で データと予測の関係の強さを表します 英語名は R squared です r二乗値の意味を理解するにはまず残差と呼ばれる誤差の概念を押さえることが大切です 値が1に近いほどモデルがデータをよく説明していると覚えましょう
計算の考え方
回帰分析では実測値 y と予測値 y_hat の差を残差と呼びます 残差のばらつきを SS_res といい y の平均からどれだけずれているかを示します さらに全体のばらつきを表す SS_tot を考えます
r二乗値はこの二つの量を使って次の式で表されます r二乗値 = 1 - SS_res / SS_tot これは直感的には予測がどれだけデータのばらつきを説明できているかを示す指標です
単回帰の場合は r二乗値と相関係数 r の自乗が同じ値になります つまり R^2 は rの二乗 と理解しておくととても分かりやすいです
例と解釈
もしデータ点が直線にぴったり乗る場合 SS_res は 0 となり r二乗値は必ず 1 になります 一方現実のデータでは r二乗値は 0 から 1 の間の値をとり 0.3 や 0.6 のように低めの値になることも珍しくありません
| 値 | |
|---|---|
| SS全体 | 20 |
| SS残差 | 8 |
| R二乗値 | 0.6 |
この例では予測はデータの約60パーセントのばらつきを説明しており まだ改善の余地があると判断できます ただし r二乗値だけでモデルのよし悪しを決めるのは危険です 変数の数が増えると必ずしも良くなるわけではなく過学習のリスクも出てきます この点を理解しておくと分析の質が高まります
要点をまとめると r二乗値はモデルの適合度を示す指標であり 0 から 1 の範囲で解釈します 理解の第一歩はこの概念を身につけることです 機会があれば実際のデータを使って自分で計算してみるとさらに理解が深まります
r二乗値の同意語
- 決定係数
- 回帰モデルが従属変数の変動をどれだけ説明しているかを示す指標です。0から1の値を取り、1に近いほどモデルの適合度が高いと解釈します。
- R二乗値
- R二乗(R-squared)と呼ばれる指標で、説明変数が従属変数の変動をどれだけ説明できるかを示します。0〜1の範囲で表され、値が高いほど良い適合を示します。
- R平方値
- R平方値はR^2の別名で、同じく回帰モデルの適合度を表します。説明力の割合を0〜1の範囲で示します。
- R^2
- Rの二乗を意味する表記で、回帰モデルの適合度を表す統計量です。0〜1の値を取り、1に近いほど良い適合を示します。
- R二乗
- R^2の略表記として使われることが多い表現です。回帰の説明力を示す指標です。
- 決定係数(R^2)
- 決定係数の表記の一つで、R^2と同じ意味を持ちます。モデルがデータの変動をどれだけ説明できるかを示します。
- R平方
- R平方はR^2の同義語で、回帰の適合度を評価する指標です。
r二乗値の対義語・反対語
- 説明力が低い
- r二乗値は従属変数のばらつきのうち、独立変数で説明できる割合を表します。これの反対は、説明力が乏しく、データのばらつきの大半を説明できない状態です。
- 決定係数が0に近い
- 説明変動の割合が極めて低く、モデルがデータに適合していないことを示します。
- 相関が弱い
- 独立変数と従属変数の直線的関係が薄く、rの絶対値が小さい状態を意味します(r^2としては低い値)。
- 適合度が低い
- 回帰モデルの予測が実データと大幅にずれており、良い適合とは言えません。
- 説明力ゼロに近い
- 説明変動の寄与がほとんどなく、r二乗値が0に近い状態を表します。
- 無相関に近い
- 変数間の線形関係がほぼない状態で、rが0に近いことを示唆します。
- 説明変動をほとんど説明できない
- データのばらつきの大半を、独立変数で説明できないことを意味します。
r二乗値の共起語
- 決定係数
- r二乗値の正式な別名。回帰モデルがデータの分散をどれだけ説明しているかを示す指標で、0から1の値をとり、1に近いほどモデルの適合度が高いです。
- 相関係数
- 2変数間の線形関係の強さを示す指標。r二乗値はこの相関係数を二乗した値です。
- ピアソンの相関係数
- 最も一般的な相関係数の名称。正規分布に近いデータでの線形関係の強さを表します。r二乗値はこの値の二乗です。
- 回帰分析
- データの関係性をモデル化する統計手法。r二乗値は回帰モデルの適合度を評価する指標として使われます。
- 線形回帰
- 入力変数と出力変数の間の直線的関係を説明する回帰手法。R二乗値はその直線の適合度を示します。
- 説明変数
- 独立変数。r二乗値はこれらの変数が従属変数の分散をどれだけ説明できるかを示します。
- 目的変数
- 従属変数。回帰分析で予測・説明の対象となる変数です。
- 自由度調整済み決定係数
- Adjusted R-squared。説明変数の数を考慮して過学習を抑えるために調整された指標です。
- 分散分析
- ANOVA。R^2は回帰が説明した分散の割合を表す一部として表に現れます。
- 残差
- 実測値と予測値の差。R^2は残差平方和と全平方和を用いて算出されます。
- 平方和
- SS_tot(全平方和)、SS_res(残差平方和)、SS_reg(回帰平方和)など、R^2の計算に関与する概念です。
- 回帰平方和
- SS_reg。回帰が説明できる分散の量を表します。
- 残差平方和
- SS_res。モデルの誤差としての分散を表します。
- 予測力
- 新しいデータに対する予測の精度・力を示す概念。R^2は文脈によって予測力の一つの目安になります。
- 過適合
- モデルが訓練データに過剰に適合してしまい、未知データへの汎化性能が下がる現象。R^2は過適合時に過大評価されがちです。
- 交差検証
- データを複数の折りたたみで検証する方法。R^2をテストデータで評価してモデルの汎化性能を測ります。
r二乗値の関連用語
- R二乗値(R-squared)
- 回帰モデルがデータのばらつきをどれだけ説明できるかを示す指標。0〜1の値で、値が高いほどモデルの説明力が高い。
- 決定係数
- R二乗値の別名。回帰モデルの適合度を表す代表的指標。
- 調整済み決定係数
- 説明変数の数を考慮してR^2を修正した指標。過学習のリスクを抑えたモデル比較に有用。
- 相関係数
- 2変数間の直線的な関係の強さを表す指標。-1〜1の範囲で、R^2はこの値の二乗になることが多い。
- 重相関係数
- 複数の説明変数が従属変数と同時にどれだけ線形に関係しているかを示す指標。多変量回帰の全体的な相関の強さを表す。
- 多重相関係数(R)
- 複数の説明変数が従属変数と持つ全体の相関の大きさを表す値。R^2を得る基になる量。
- 説明変動(回帰平方和・ESS)
- 回帰によって説明されるデータの分散部分。R^2の分子に相当。
- 残差平方和(RSS)
- モデルの予測誤差を平方和にして合計したもの。未説明の変動。
- 総平方和(TSS)
- データ全体の分散の総和。ESSとRSSの和に等しい。
- 自由度
- 推定や検定で使われる独立した情報の数。一般にサンプル数−推定パラメータ数で求める。
- F値
- 回帰モデルの有意性を検定する統計量。大きいほど有意性が高いとされる。
- p値
- 検定で得られた統計量が偶然に起こる確率。小さいほど有意と判断されやすい。
- 回帰係数
- 各説明変数が従属変数に与える影響の大きさと符号を示す係数。
- 標準化回帰係数
- 変数を標準化した上での回帰係数。変数間の影響度を比較しやすくする。
- 最小二乗法(OLS)
- 観測値と予測値の平方誤差を最小化してパラメータを推定する代表的推定法。
- 交差検証
- データを分割してモデルの汎化性能を評価する手法。過学習を抑える目的で使われる。
- 多重共線性
- 説明変数間の強い相関が生じる現象。推定の安定性を低下させ、R^2の解釈にも影響する。
- 情報量規準(AIC/BIC)
- モデルの適合度と複雑さをバランス良く評価し、モデル比較に用いる指標。
- 回帰係数の信頼区間
- 回帰係数推定値の不確実性を示す区間推定。
- 予測誤差
- 未知のデータに対する予測値と実測値の差。モデル評価の基本指標。
r二乗値のおすすめ参考サイト
- 決定係数R2って何?は今日でお終い!3分でわかるR二乗とは
- 回帰分析とは?目的やExcelでのやり方までわかりやすく解説!
- 決定係数R2って何?は今日でお終い!3分でわかるR二乗とは
- [評価関数]決定係数(Coefficient of Determination)R2とは? - IT
- 決定係数R2とは?機械学習や統計で使われる評価関数について解説!
- 決定係数とは?求め方や相関係数の違いについて解説!



















