

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
カメラ行列とは何かをざっくり把握する
カメラ行列は写真(関連記事:写真ACを三ヵ月やったリアルな感想【写真を投稿するだけで簡単副収入】)や映像を作るときの土台となる数式です。3次元の世界を2次元の画像に写し出す変換を表します。私たちの世界は立体ですが、写真の平面にはその情報が圧縮されています。カメラ行列はその圧縮と投影の仕組みを数式で表す道具です。
この大きな枠組みは通常 内在行列、外在行列、そして 投影行列 の三つに分けて考えます。これらは写真や映像のピクセルの位置を決める基本です。
内在行列とは
内在行列はカメラの内部の特性を表します。焦点距離やセンサーの大きさ、主点の位置などが詰まっています。代表的な形は次のようです。K は K = [ fx s cx ; 0 fy cy ; 0 0 1 ] の形をとることが多いです。fx は水平方向の焦点距離、fy は垂直方向の焦点距離、cx/cy は主点(画面中心に相当する点)、s はスキューと呼ばれる微小な歪みを表します。これらの数値を変えると、映像に現れる見え方が微妙に変わります。
外在行列とは
外在行列はカメラの姿勢を表します。世界の座標系からカメラ座標系へ変換するために 回転行列 R と 平行移動ベクトル t を使います。これらを組み合わせて 投影行列 P = K [ R | t ] を作ると、3D 点を2Dの画素へ投影できるようになります。
投影の仕組みと式
3D の点 X = [ X, Y, Z, 1 ] を 投影行列に掛け、画像平面の座標へと写像します。式は s [u v 1]^T = K [ R | t ] [ X Y Z 1 ]^T です。ここで s は任意のスケール因子、(u, v) が最終的なピクセル位置です。
例で見る理解
R を単位行列、t を [0, 0, -5]、K を先ほどの値とすると、3D 点 X = [0, 0, 10] はカメラの正面にあり、投影点は (u, v) = (cx, cy) となります。すなわち (320, 240) です。中心を結ぶ要素は 焦点距離が現実的な値 の場合、画面の中心に投影されます。
実務での使い方
現実のカメラでは内在行列と外在行列を組み合わせ、シーンの座標を正確にピクセルに結びつける必要があります。これを「キャリブレーション」と呼びます。写真や映像の正確な幾何を活かすには、画像群から K, R, t を推定します。最も一般的な手法はチェス盤パターンを用いた Zhang の法や、現代の自動キャリブレーションツールです。
表で見るポイント
| 意味 | |
|---|---|
| fx | 横方向の焦点距離をピクセル単位で表す |
| fy | 縦方向の焦点距離 |
| s | 主に歪みの補正に関する値、現実には0に近いことが多い |
| cx | 画像の主点、横方向の中心 |
| cy | 画像の主点、縦方向の中心 |
実際の現場では キャリブレーションの精度 が画像の幾何正確さを左右します。粗い推定では歪みや位置ずれが目立ち、測定や3D再構成の品質に影響します。
要点のまとめ
カメラ行列は写真や映像の基盤となる変換を数式で表します。内在行列がカメラ内部の性質を、外在行列がカメラの位置と向きを、投影行列がそれらを組み合わせて3D点を2Dピクセルへ結びつけます。覚えるべきは基本形と用語の意味、そしてキャリブレーションの重要性です。
カメラ行列の同意語
- カメラ行列
- 3D座標を2D画像座標へ射影する変換を表す行列。P=K[R|t] の形で、カメラの内部パラメータと外部パラメータを組み合わせて表現されることもある。初心者には最も基本的な呼び方として使われることが多い。
- 投影行列
- 3D点を画像平面へ投影するための行列。英語の Projection Matrix の和訳で、カメラ行列とほぼ同義に使われることが多い。P=K[R|t] の形で現れることが多い。
- 射影行列
- 投影行列と同義の表現。3D点を2D像へ変換する役割を指す。
- カメラ投影行列
- カメラの投影機能を表す行列。投影行列と同義に使われ、P=K[R|t] の全体を指すことが多い。
- 内部パラメータ行列
- カメラの内部の幾何特性をまとめた行列。焦点距離や主点などを含む K(3x3 行列)として表され、P の K 成分として機能する。
- カメラ内部行列
- 内部パラメータ行列の別表現。K として知られ、画像のスケーリングや中心点の補正など内部幾何を扱う。
- 内部行列
- 内部パラメータ行列の短縮表現。技術文献やコードで略して使われることがある。
- P行列
- 投影行列の略称。3×4 の行列で、世界座標系の点を画像座標系へ射影する変換を表す。
- 外部パラメータ行列
- カメラの姿勢を表す行列(通常は [R|t])。P の一部として使われることが多く、厳密には“カメラ行列”そのものではなく、外部パラメータをまとめた要素として扱われる。
カメラ行列の対義語・反対語
- 外部パラメータマトリクス
- カメラと世界座標系の関係(姿勢Rと位置t)を表す情報を含む行列。カメラ行列K(内部パラメータ)とは別物として扱われ、対になる概念として理解されます。
- 世界座標系変換行列
- 世界座標系からカメラ座標系へ変換するための行列(Rとtを含む)。物体の位置を世界基準で扱う際に使われ、内部のカメラパラメータに対して外部パラメータが関わる点で対比されます。
- カメラ外部パラメータ
- カメラの位置と向き(姿勢)を表す情報。外部パラメータは、カメラの内部パラメータと対照的に、撮影環境の配置を示します。
- 投影行列(P行列)
- 3D点を画像平面へ投影するための行列。Kと[R|t] を組み合わせて作られることが多く、カメラ行列(K)だけを指す語とは別の、より広い文脈で使われる概念。
- 内部パラメータマトリクス(Intrinsicマトリクス)
- カメラの内部特性を表す行列。焦点距離・主点などを含み、いわばカメラの内部の仕様を決定します。カメラ行列の一部として扱われることが多い。
- 世界座標系(ワールド座標系)
- 物体が定義される基準座標系。カメラ座標系と対比して使われることが多く、座標系の概念として対義的に理解されます。
カメラ行列の共起語
- カメラ内部パラメータ
- カメラの内部特性を表すパラメータの集合。焦点距離 fx, fy、主点 cx, cy、歪み補正などを3×3行列 K で表現することが多い。
- カメラ外部パラメータ
- カメラの姿勢と位置を決定するパラメータ。回転行列 R と並進ベクトル t で表され、世界座標系とカメラ座標系の関係を示す。
- 投影行列
- 3D 世界座標を 2D 画像座標へ射影するための 3×4 行列。P = K [R|t] の形で表され、点の投影を決定する。
- ピンホールモデル
- 最も基本的なカメラモデル。一点透視で、3D 点を 2D 点へ投影する幾何を表す。
- 焦点距離
- レンズの光学的な拡大率を示す指標。通常 fx, fy の形で表現し、画素単位の値として表される。
- 主点
- 画像平面上の射影の中心。通常 cx, cy の座標で表される。
- 歪み係数
- レンズによる射影の非線形歪みを表すパラメータ。ラジアル歪みとタンジェンシャル歪みを含む。
- レンズ歪み
- レンズの歪みそのものの総称。主にラジアル歪みとタンジェンシャル歪みを指す。
- 歪み補正
- 撮影後に歪みを補正する処理。キャリブレーションで推定したパラメータを用いる。
- チェッカーボード
- キャリブレーションで用いるチェッカーボード(棋盤)パターン。角点を検出して内部パラメータを推定する。
- 回転行列
- カメラの姿勢を表す 3×3 行列。世界座標系からカメラ座標系への回転を示す。
- 並進ベクトル
- カメラの位置を表す3要素のベクトル。世界座標系からカメラ座標系への並進を表す。
- 座標変換
- 座標系を別の座標系へ変換する計算。回転と並進を組み合わせて点の座標を変換する。
- ワールド座標系
- 実世界の基準となる座標系。3D点の位置を表す。
- カメラ座標系
- カメラ中心を原点とする座標系。カメラ視点での表現を行う。
- ホモグラフィ
- 平面間の射影変換。カメラ行列と組み合わせて写像を扱うことがある。
- 射影方程式
- 3D 点を 2D 画像点へ写す基本式。一般には p ~ P X のように同次座標を使って表す。
- キャリブレーション
- カメラ内部パラメータと歪みを推定する作業。
- OpenCV
- 画像処理・コンピュータビジョンの代表的なライブラリ。カメラ行列の推定や投影計算を支援する。
- P行列
- 射影行列の別名。3×4 行列 P のことを指すことがある。
- K行列
- カメラ内部パラメータを表す 3×3 行列 K の別称。 fx, fy, cx, cy などを含む。
カメラ行列の関連用語
- カメラ行列
- 3×4の投影行列で、3D点を2D像点へ結ぶ。P = K [R|t] の形で表され、内部パラメータと外部パラメータを統合します。
- 投影行列
- 3×4の行矩で、3D座標を画像座標へ投影する役割を持つ。カメラ行列とほぼ同義として使われることが多いです。
- P行列
- Projection Matrix。3×4の行列で、世界座標を像点へ変換する。P = [K|0] などの分解にも使われます。
- 内部行列
- K。3×3の行列で、 fx, fy, cx, cy, s(スキュー) を含み、カメラの内部幾何を定義します。
- 焦点距離
- fx, fy。画素単位で表され、視野の広さを決定します。
- 主点
- cx, cy。画像平面の中心点を表します。
- 歪み係数
- k1, k2, k3, p1, p2 など。レンズの非線形歪みを表すパラメータ。
- 歪み補正
- 歪んだ画像を補正して真の像を復元する処理。undistort などで行います。
- 外部行列
- 3×4の行列 [R|t]。カメラの姿勢と位置を表す。
- 回転行列
- R。3×3の正則直交行列。カメラの向きを表します。
- 平行移動ベクトル
- t。3×1のベクトル。カメラの位置を表します。
- 世界座標系
- 3D世界の座標系。外部パラメータはこの座標系とカメラ座標系の関係を表します。
- カメラ座標系
- カメラ中心を原点とする座標系。Z軸が前方に向くのが特徴です。
- 3D→2D投影方程式
- X = (X, Y, Z, 1)^T を P X に射影し、u = (P1·X)/(P3·X), v = (P2·X)/(P3·X) の形で像点を得る式です。
- キャリブレーション
- 内部パラメータ・外部パラメータ・歪み係数を推定する過程。



















