

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
ホモグラフィ変換とは?初心者でもわかる基本と実例解説
ホモグラフィ変換は、2D の写真(関連記事:写真ACを三ヵ月やったリアルな感想【写真を投稿するだけで簡単副収入】)や画像同士の対応を使って、異なる視点から見た同じ平面の写像を表すすごく重要な考え方です。カメラが動くと、同じ場所の点も写真上で位置が変わります。このとき全ての対応点を1つの3×3の行列で表すのがホモグラフィ変換です。変換後の座標は、元の座標を同次座標系に変換してから、H という行列で掛け算して得られます。最後に非線形な正規化を行い、実際の画面座標に戻します。
直感的には、ホモグラフィ変換は「遠くのものは小さく見え、近くのものは大きく歪む」現象を数式で表現する方法です。たとえば、風景の写真を別の角度から写したとき、建物の直線が別の写真ではわずかに曲がって見える場合があります。これを正しく結び付けると、二つの写真を正しく並べて重ねることができ、パノラマ画像の作成や現実世界の物体の位置合わせに役立ちます。
式の概要としては、3 次元の同次座標系にて点 x=(x, y, 1) を x'=(x', y', w) に写像し、最終的に (x'/w, y'/w) を得ます。これを実現するのが 3×3 の行列 H で、H の9つの成分は対応点を使って決定します。実用的には、少なくとも4組の対応点が必要で、よく使われるのは最小二乗法や正規化を施した解法です。正規化はデータの尺度差を小さくして計算を安定させる重要なステップです。
以下に、ホモグラフィ変換の主要な構成要素をまとめた表を置きます。
| 用語 | 説明 |
|---|---|
| ホモグラフィ変換 | 2D 点を別の平面へ写す 3×3 行列のこと |
| 対応点 | 元の画像と変換後の画像で同じ現実の点を指す点の対 |
| 正規化 | 数値安定性を高める前処理のこと。座標を平均0・分散1へ整える場合が多い |
| 用途 | 画像の結合・パノラマ作成・AR の現実感向上など |
実際の手順としては、まず 対応点を選ぶ、次に 最小二乗法で H を求める、最後に 正規化を適用して座標を戻すという流れです。現場では自動的に検出された特徴点(SIFT, ORB など)を使って対応点を得ることが多く、これを数百組集めて H を推定するケースもあります。
この変換を学ぶと、写真同士を滑らかにつなぐ技術や、現実世界の物体の位置合わせ、AR の仮想物体の固定など、応用の幅がぐんと広がります。中学生でも理解できるポイントは、「点と点の対応を 1 つの変換で結ぶ」ことと、「変換の結果を正しく正規化して実際の座標に戻すこと」です。理解を深めるには、身近な写真を使って自分で点を対応づけ、H を推定してみるのが一番の近道です。
注意点として、平面でない場面ではホモグラフィ変換は厳密には成立しません。曲面や球状の物体は、同じ平面として扱うと誤差が出ます。その場合は平面性を前提とした近似として扱います。
ポイントの選び方のコツとして、特徴点はテクスチャが豊富で角度が変わっても検出しやすい場所を選ぶと良いです。カーソル視点を変えたり、光の条件を変えたりしても一致点が見つかりやすくなります。
最後に、実装面のヒントとして、OpenCV などのライブラリには findHomography という関数があり、4点以上の対応点から高精度に H を計算してくれます。
ホモグラフィ変換の同意語
- ホモグラフィ変換
- 2D平面間の対応を表す射影変換のこと。1つの平面を別の平面へ写す際に使い、3×3のホモグラフィ行列で表現します。
- 射影変換
- 平面間の点を別の平面へ写す一般的な変換。ホモグラフィの代表表現で、3×3行列で表されることが多いです。
- 透視変換
- 透視投影の原理に基づく平面間の写像。近くと遠くの物体の見え方を保つ性質があり、ホモグラフィの実装として用いられます。
- プロジェクティブ変換
- 英語の Projective Transformation の訳語。平面間の射影変換を指す言葉として使われます。
- 平面射影変換
- 二枚の平面間で点を対応づける射影変換のこと。ホモグラフィと同義で使われる表現です。
- ホモグラフィ行列
- ホモグラフィ変換を表す3×3の行列。座標を同次座標に変換して計算します。
- 平面ホモグラフィ
- 二枚の平面間のホモグラフィを指す表現。対象が平面であることを強調します。
- プロジェクティブマッピング
- プロジェクティブ変換を別の言い方で表した語。点の対応を新しい平面へ写す処理を指します。
ホモグラフィ変換の対義語・反対語
- 非ホモグラフィ変換
- ホモグラフィ変換ではない、平面間の透視的歪みを表現しない変換を意味します。
- アフィン変換
- 平行性を保持し、透視効果を表現できない変換。ホモグラフィ変換より制約が多く、透視歪みを扱いません。
- 非線形変換
- 座標の変換が線形ではなく、ホモグラフィのような線形-分数モデルとは異なる、非線形な歪みを伴う変換です。
- 非透視変換
- 透視投影を使わない、平面間の単純な幾何変換のこと。透視効果を表現しません。
- 3D変換
- 2D平面のホモグラフィが対象となるのに対し、3D空間での変換は異なる射影・立体変換を含む概念です。
- 線形変換
- 2Dの回転・拡大・せん断などの基本的な線形変換。ホモグラフィの非線形歪みを含まない点が対比になります。
- 直交変換
- 長さと角度を保つ特殊な線形変換。透視歪みを含まず、幾何的制約が強い変換です。
ホモグラフィ変換の共起語
- 射影変換
- 平面を別の平面へ透視的に写し出す変換。ホモグラフィ変換の別名として使われることが多い。
- 透視変換
- 遠近法に基づく変換。2点以上の対応で平面を別の平面に写す3x3行列で表される。
- H行列
- ホモグラフィ変換を表す3x3の行列。座標を別の視点へ写す変換を定義する要素。
- 3x3行列
- ホモグラフィ変換を表現する3列3行の正方行列。3次元同次座標系を用いて表現される。
- 対応点
- 二つの画像で対応する点のペア。ホモグラフィ推定に使われる基礎データ。
- 点対応
- 対応点と同義。二枚の画像間で対応する特徴点の組。
- 特徴点
- SIFT/ORB/SURFなどで検出される局所的な特徴点。ホモグラフィ推定の入力となる。
- 特徴量マッチング
- 二つの画像の特徴点をペアに結びつける処理。対応点ペアの作成に使う。
- RANSAC
- 外れ値を除去して信頼できるホモグラフィ行列を推定するロバスト推定法。
- ロバスト推定
- 外れ値に強い推定手法。ホモグラフィ推定にも使われる。
- 外れ値
- 対応点ペアの中に誤検出やノイズが混じるもの。
- アフィン変換
- 平行性を保つ線形変換の一つで、ホモグラフィとは異なるが関連用語として混在することがある。
- パノラマ合成
- 複数の画像をつなぎ合わせて広い視野の画像を作る処理。ホモグラフィは重要な要素。
- モザイク
- 画像をつなぎ合わせた表現。パノラマ合成の一部として使われることがある。
- OpenCV
- 画像処理/コンピュータビジョンの代表的なライブラリ。ホモグラフィ変換の実装も提供。
- cv2.findHomography
- OpenCVでホモグラフィ行列を推定する関数(Python API)。
- 投影変換
- 透視投影に基づく変換の総称。ホモグラフィ変換の別名として使われることがある。
- 投影矩陣
- ホモグラフィ変換を表す3x3の投影行列のこと。
- 逆行列
- ホモグラフィ変換の逆変換を表す行列。対応する座標系の復元などに使われる。
- 正則性
- Hが正則行列(逆行列が存在する状態)であることが多い。
- 平面認識
- 対象が平面であると仮定してホモグラフィを適用するケース。
- エピポーラ幾何
- 2画像間の幾何関係を表す概念。ホモグラフィは平面上の対応を扱う場合と関係が深い。
- 座標変換
- 画像の座標を別の座標系へ移す処理全般。ホモグラフィは座標変換の一つ。
- 幾何変換
- 形状を変えずに位置や向きを変える変換の総称。ホモグラフィは透視的幾何を扱う一種。
- 平面対応
- 対象が平面であるとの前提で一致する点ペアを得るケース。
- データ拡張
- 合成やマッシュアップの際にホモグラフィを使って画像を整列させることがある。
- 対応精度
- 対応点ペアの品質がホモグラフィの精度に直結する話題。
- SVD
- 特異値分解。ホモグラフィ推定の計算過程で使われることがある。
- マッチング閾値
- 特徴点をマッチングする際の距離・比率の閾値。
- 平面再投影誤差
- 推定したホモグラフィが平面にどれだけ正確に写っているかを測る指標。
ホモグラフィ変換の関連用語
- ホモグラフィ変換
- 2枚の画像のうち、同じ平面上の点を対応づけるための透視投影変換。3×3のホモグラシー行列を用い、8自由度を持ちます。
- ホモグラフィ行列
- 3×3の行列 H のこと。入力点を同次座標で出力点へ写す変換を定義します。
- 射影変換(透視変換)
- 平面間の透視効果を表す一般的な変換の総称。ホモグラフィ変換はこの一種です。
- アフィン変換
- 平行性を保つ変換で、回転・拡大縮小・平行移動・せん断を含みますが、透視歪みは表現できません。
- 対応点
- 2枚の画像で同じ物体の点の対応関係のこと。ホモグラフィ推定にはこの対応点が必要です。
- 特徴点マッチング
- SIFT・SURF・ORB などの特徴量を使い、2枚の画像間の対応点を検出・対応づける手法です。
- SIFT
- スケール不変特徴量の略。照明や大きさの変化にも頑健な特徴点を提供します。
- SURF
- Speeded-Up Robust Features の略。SIFTより高速で頑健な特徴量です。
- ORB
- Oriented FAST and Rotated BRIEF の略。高速で軽量な2値特徴量です。
- RANSAC
- 外れ値を除外して良いモデルを推定する乱択法。ホモグラフィ推定を安定させます。
- DLT法
- Direct Linear Transform。特徴点対応からホモグラフィを線形方程式として解く基本アルゴリズムです。
- 正規化(点の正規化)
- DLT前処理として点を適切なスケールと中心へ正規化する手法で、数値安定性を高めます。
- 再投影誤差
- 推定したホモグラフィを使って点を再投影したときに生じる誤差。小さいほど良い推定と判断します。
- パノラマ作成/画像スティッチング
- 複数の画像をつなぎ合わせて1枚の大きな画像にする作業。ホモグラフィで画像を整列します。
- 内部パラメータ(K)
- カメラの焦点距離や主点など、画像形成に関わる内部特性を表す行列です。
- 外部パラメータ(R, t)
- カメラの姿勢を表す回転行列 R と並進ベクトル t のこと。世界とカメラの位置関係を定義します。
- プロジェクション行列(P)
- P = K [R|t] の形で表される、カメラの全体的な投影行列。点を画像へ投影します。
- 平面座標系と画像座標系
- 平面上の座標系(世界座標系)と画像のピクセル座標系の対応を扱います。
- キャリブレーション
- カメラの内部パラメータを正確に推定するための測定・推定作業です。
- 透視歪み
- 視点の違いによって生じる平面上の歪みのこと。ホモグラフィ変換で表現されます。
- 正規化DLT
- 点の正規化を組み込んだ DLT 法。より安定してホモグラフィを推定できます。



















