

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
ホモロジーモデリングとは?
ホモロジーモデリングは、生物のタンパク質の3次元構造を予測する手法です。実験的に構造を解くのが難しい場合に、すでに分かっている類似タンパク質の構造をテンプレートとして使います。「ホモロジー」は進化的に似ていることを意味し、配列が似ていれば立体の形も似ていると仮定します。
この方法が有効なのは、ターゲットタンパク質とテンプレートの相同性が高いときです。相同性が高いほど、推定された位置や形の信頼性が上がります。一方、相同性が低い場合は、結果に不確実性が増します。実験データが無い領域でも手掛かりを得られる点が魅力です。
基本的な流れ
まず、対象タンパク質の配列を用意し、公開データベースから適切なテンプレートを探します。次に、ターゲットとテンプレートの配列を並べて、対応する位置を決める「アラインメント」を作成します。ここが肝心で、アラインメントの品質がその後のモデル精度を左右します。
アラインメントを元に、テンプレートの立体構造をベースとしてターゲットのモデルを構築します。このとき、欠けている部分は補完され、欠損領域がある場合には別のテンプレートを用いることもあります。
次に、モデルを微調整する「リファインメント」段階を行います。エネルギーの最適化や分子の動的挙動を模倣する手法を使い、構造の物理的妥当性を高めます。最後に、品質評価を行い、信頼性を判断します。評価には、構造の整合性、タンパク質の機能部位の配置、二次構造の整合性などを確認します。
表で整理すると分かりやすい
| ステップ | ターゲットタンパク質の選定とテンプレートの探索 |
|---|---|
| ステップ | 配列アラインメントの作成 |
| ステップ | モデルの作成(立体構造の推定) |
| ステップ | リファインメントとエネルギー最適化 |
| ステップ | 品質評価と信頼性の判断 |
| ステップ | 複数モデルの比較と最終モデルの選択 |
このようにして得られるモデルは、薬剤設計の初期段階、機能予測、実験の計画立案など、さまざまな場面で活用されます。ただし、ホモロジーモデリングには注意点もあります。とくに、テンプレートが低相同性だったり、構造が大きく異なった場合には予測が不正確になることがあります。
注意点と限界
重要な点として、モデルはあくまで予測であり、実験データと同じ動きを必ずしも再現するわけではありません。実験で検証することが前提です。相同性が高いテンプレートでも、活性部位の細かな配置は慎重に評価する必要があります。
初心者向けのポイント
・テンプレート選択は最初の鍵。相同性が高く、すでに多くの研究で使われている構造を優先します。・アラインメントの品質を最優先に。間違った対開合率の整列は後のモデルを大きく崩します。・複数のテンプレートを比較することで、信頼性の高い領域と不確実な領域を見分けやすくなります。
実務での活用例
医薬品開発の初期段階で、ターゲットタンパク質の結合部位の予測を行い、候補化合物の結合様式を評価します。これにより実験の回数を減らし、効率的な研究設計が可能になります。加えて、機能予測や進化研究の補助にも使われます。
ホモロジーモデリングの同意語
- ホモロジーモデリング
- 未知のタンパク質の三次元構造を、既知の同源タンパク質の構造をテンプレートとして用いて予測する、テンプレートベースの構造予測手法。
- 同源モデリング
- ホモロジーモデリングと同義で使われる呼び方。
- 相同性モデリング
- 配列の相同性(同源性)を根拠に、近縁構造の既知モデルを元に未知構造を推定する方法。
- テンプレートベースモデリング
- テンプレート(既知の構造)をベースにしてモデルを作るモデリング手法。
- テンプレートモデリング
- テンプレートを用いたモデリングの別名。
- テンプレート依存モデリング
- テンプレートに強く依存して推定を行うモデリング手法。
- 比較モデリング
- 相同性情報を活用して、別のタンパク質の構造情報を比較して推定するモデリング手法。
ホモロジーモデリングの対義語・反対語
- アブイノモデリング
- ホモロジーモデリングの対極的手法。未知のタンパク質に対して、既知のテンプレートを使わず、物理法則とアルゴリズムで構造を推定する。モンテカルロ法・分子動力学サンプリングなどを用いる。
- デノボモデリング
- ab initioモデリングと同義。テンプレートなしで構造を構築する手法。計算コストが高いが新規タンパク質の構造推定に有効。
- テンプレートなしモデリング
- テンプレートを使わないモデリング手法全般を指す表現。ab initioやフォールド認識の一部が含まれることがある。
- フォールド認識モデリング
- 未知配列を既知の構成フォールドと照合する手法。テンプレート依存が薄い場合もあり、ホモロジーより幅広い候補フォールドを探すことが目的。
- 実験的構造決定法
- 計算推定ではなく、実験で三次元構造を決定する方法。ホモロジーモデリングの対比として挙げられることが多い。
- X線結晶構造解析
- タンパク質を結晶化してX線回折データから構造を決定する実験法。高解像度だが結晶化の難易度が高い。
- NMR構造決定法
- 核磁気共鳴を用いてタンパク質の三次元構造を決定する実験法。小〜中規模タンパク質に有効。
- クライオ電子顕微鏡(Cryo-EM)構造決定
- 低温での電子顕微鏡観察から構造を推定する実験法。大分子・複合体の構造決定に適している。
- テンプレート非依存モデリング
- テンプレートに依存しないモデリングを強調する表現。ab initioモデリングを含むことが多い。
ホモロジーモデリングの共起語
- アミノ酸配列
- ターゲットとなるタンパク質のアミノ酸の並び。モデル化の出発点となる基本情報。
- ターゲット配列
- モデル化の対象となる未知の構造を持つ配列。遺伝子情報から読み取られる実体。
- 配列アラインメント
- ターゲット配列とテンプレート配列の対応を揃える作業。どの残基が対応するかを決める重要なステップ。
- アラインメント
- 配列を比較して対応する残基を決める作業の総称。
- 相同性/相同性
- ターゲットとテンプレートの類似度。高いほど適切なテンプレートを選択しやすい指標。
- テンプレート
- 既知の3D構造データベースに登録された構造。新しいモデルの出発点。
- テンプレート選択
- 複数候補の中から最も適したテンプレートを選ぶプロセス。
- テンプレートライブラリ
- 候補となる構造の集まり。検索・比較の対象。
- 3D構造
- 原子座標で表現された三次元の立体構造。モデリングの最終的な出力。
- 3Dモデル
- 作成された三次元の構造データ。PDBなどの形式で保存されることが多い。
- モデリング/モデルビルディング
- 3Dモデルを構築する作業。テンプレートと配列情報を用いて形を作る。
- ループモデリング
- 不確定なループ領域を推定して埋める手法。
- ドメイン
- タンパク質を機能的に区切る領域。モデリングの単位として使われることが多い。
- ドメインアラインメント
- 複数ドメイン間での配列対応を整える作業。
- エネルギー最小化
- 構造の不自然な歪みを減らし、物理的に安定なモデルへ整える計算。
- 分子動力学/MD
- 時間発展を模擬して構造安定性や挙動を検証する手法。
- 品質評価/検証
- 作成したモデルの信頼性や精度を評価する指標や手法。
- ラムチャンドラン図
- 主鎖角度の取り得る値を可視化する図。異常な配置を検出するのに役立つ。
- QMEAN/GMQE/Verify3D/ProSA
- 代表的なモデル品質指標や検証ツールの総称。数値で品質を評価します。
- PDB/PDBファイル
- タンパク質の3D座標データを保存する形式。データベースにも同名の名称が使われる。
- BLAST/相同性検索
- ターゲット配列に対して類似したテンプレート候補を探索する初期ツール。
- SWISS-MODEL/Phyre2/Modeller/Rosetta
- ホモロジーモデリングを実行する主要なソフトウェアやウェブサービス。
- PyMOL/Chimera
- 作成したモデルを可視化・解析する代表的なツール。
- ギャップ/ギャップペナルティ
- アラインメントで挿入・欠失をどう扱うかを決める設定。
- アミノ酸置換・影響評価
- 置換が構造や機能に与える影響を評価する視点。
- 機能予測
- 得られた構造モデルからタンパク質の機能を推定する用途。
ホモロジーモデリングの関連用語
- 比較モデリング
- ホモロジーモデリングの別名。既知のテンプレートタンパク質の構造情報を使って、予測対象タンパク質の3Dモデルを作る方法です。
- テンプレート
- 3D構造が公開されている、解析に使う基礎構造。ターゲットのモデル化の土台となります。
- テンプレート同定
- 最適なテンプレート候補をデータベースから検索・選択する作業。配列類似性やプロファイル情報を用います。
- ターゲットタンパク質
- モデル化の対象となるタンパク質のアミノ酸配列。研究者が予測したいタンパク質です。
- 配列アラインメント
- ターゲットとテンプレートのアミノ酸の対応関係を決める作業。正確なアラインメントはモデル品質を左右します。
- 配列同一性
- ターゲットとテンプレートの間のアミノ酸の一致率。高いほど信頼性の高いモデルが得られやすいです。
- 3Dモデル作成
- テンプレートとアラインメントを基に、ターゲットの立体構造を推定して作成する結果です。
- ループモデリング
- テンプレートに含まれない長いループ領域を別途推定して補完します。
- サイドチェーン配置
- 残基の側鎖の最適な配置(ロタマー)を決定する作業。モデルの精度を左右します。
- ロタマー
- サイドチェーンの回転角の候補集。最適化で自然な構造が選ばれます。
- エネルギー最適化/リファインメント
- 力場を使ってモデルを滑らかに、実験データに近づける調整を行います。
- モデル評価
- RMSD、TM-score、DOPEなどの指標や視覚的検査でモデルの品質を検証します。
- Ramachandranプロット
- タンパク質の主鎖角の分布を示す図。適切な角度分布を満たしているかを確認します。
- 検証ツール
- PROCHECK、MolProbity、Verify3D、ProSAなどのソフトウェアを使い、幾何学的妥当性を評価します。
- PDB
- Protein Data Bank。既知の3D構造データが蓄積されたデータベースで、テンプレート探しに使われます。
- 複数テンプレートモデリング
- 複数のテンプレートを組み合わせて、欠落部を補い、より正確なモデルを作る手法です。
- デノボモデリング
- テンプレートを使わず、アミノ酸配列から新規に構造を予測する方法。ホモロジーが不十分なときに用います。
- フォールド認識/スレッド法
- テンプレートが乏しい領域も含め、既知の折りたたみパターンを活用して構造を推定する方法です。
- マルチシーケンスアラインメント
- 複数の関連タンパク質配列を同時に揃えて、テンプレート探しやアラインメントの精度を高めます。
- HMM/プロファイル検索
- 隠れマルコフモデルやプロファイル情報を用いて、感度の高いテンプレート検出を行います。



















