

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
interpro・とは?
はじめに、interproとは何かをやさしく解説します。interproは、タンパク質の機能を推定するための統合データベースです。複数の専門データベースからの情報を集約しており、タンパク質の「ファミリー」や「ドメイン」「モチーフ」といった特徴を一度に確認できる仕組みになっています。これにより、配列データだけを見ただけでも、どんな機能を持つタンパク質かの候補を絞り込むことができます。現代のゲノム研究では、鍵となる機能の予測やアノテーション作業に欠かせないツールとして広く使われています。
実際のところ、interproは単一のデータベースではなく、Pfam、SMART、PROSITE、PRINTS、SUPERFAMILY などの複数のデータベースからの情報を統合します。これらのデータベースが見つけた「ファミリー(家族)」や「ドメイン(領域)」といった特徴を、InterProの共通の枠組みで整理して表示します。各エントリにはIPR番号と呼ばれる一意の識別子が付けられており、研究者は検索結果を簡単に参照・共有できます。
この仕組みのよいところは、複数の出典情報を一本化してくれる点です。例えば、あるタンパク質配列に対して Pfam で見つかったドメインの情報と、 SMARTで見つかったモチーフの情報を別々に見るより、interproの結果として総合的なプロフィールを得られるため、機能推定の信頼性を高めやすくなります。
使われ方の例としては、ゲノム解析で新規配列の機能を仮説づけるときや、学術論文の補足データとしてアノテーションを作成するときがあります。特に「このタンパク質はこのドメインを持つファミリーに近い」といった結論を得るには、InterProの出力が強力な手掛かりになりやすいです。
InterProの仕組みと出力の見方
まず、InterProのウェブサイトやツールを使って配列を解析します。ウェブ検索で「InterPro」と入力すると、各エントリのIPR番号、ファミリー名、ドメイン境界、機能のヒントなどが一覧で表示されます。結果には、どのデータベースからの情報が統合されているか、そして信頼性を示すスコアが付くこともあります。
このあと、InterProScanと呼ばれるツールを使えば、独自の配列をスキャンして複数のデータベースの情報を同時に取得できます。InterProScanはローカル環境でも実行でき、配列データを企業内のパイプラインに組み込むのに適しています。ウェブ版とローカル版の両方が提供されており、研究の規模やニーズに合わせて選択できます。
以下は、ウェブ版の出力の見方の一例です。結果には、IPR番号と対応するファミリー名、ドメイン境界、機能のヒント、関連情報が表示されます。各エントリには“関係するデータベース”や“関連する生物種”の情報も併記され、どのような生物学的文脈でそのドメインが重要かを判断する手掛かりになります。
| 説明 | |
| 主な目的 | タンパク質のファミリーやドメインを同定し、機能を予測すること |
|---|---|
| 連携データベース | Pfam、SMART、PROSITE、PRINTS、SUPERFAMILY など |
| 出力の特徴 | IPR番号、ファミリー名、ドメイン境界、機能のヒント、関連情報 |
| 利用形態 | ウェブ検索、InterProScan、API、アノテーションワークフロー |
最後に覚えておきたいポイントとして、interproは強力な研究支援ツールですが、単独の予測に過度に依存せず、実験データや他の生物情報と組み合わせて解釈することが大切です。複数のデータソースを横断して総合的に判断する習慣をつけましょう。
使い方の基本ステップ
1. InterProの公式サイトにアクセスします。
2. 配列またはエントリIDを入力します。配列をそのまま貼り付けることも、既存のIDを使うこともできます。
3. 検索結果を確認します。ファミリー、ドメイン、モチーフの情報と、どのデータベースが情報を出しているかが表示されます。
4. 必要に応じて、InterProScanを使って自前のシーケンスを解析します。解析結果は出力形式を選んでダウンロードでき、アノテーション作成の基礎になります。
結論
総じて、interproは生物情報学の「道具箱」として、タンパク質の機能予測を効率化してくれます。学習用の教材としても、研究の現場でのデータ解釈にも役立つ信頼性の高いリソースです。
interproの同意語
- InterPro
- 公的なタンパク質ファミリーとドメインの統合データベースの名称。タンパク質のファミリー・ドメイン情報を総合的に提供します。
- InterProデータベース
- InterProの正式名称を指す表現。タンパク質ファミリーとドメインのアノテーション情報を集約して公開しているデータベースです。
- タンパク質ファミリーデータベース
- タンパク質をファミリー(同じ機能・構造を持つグループ)に分類・整理するデータベースの総称。InterProの役割と近い概念です。
- タンパク質ドメインデータベース
- タンパク質の機能的領域(ドメイン)情報を集約・検索できるデータベースのこと。InterProの主要機能の一つです。
- 蛋白質ファミリーデータベース
- 蛋白質のファミリー情報を整理・提供するデータベース。中・古い表記の同義語として使われることがあります。
- 蛋白質ドメインデータベース
- 蛋白質のドメイン情報を集約するデータベースのこと。InterProと同様の機能を指す表現です。
- ファミリとドメインの統合データベース
- ファミリー情報とドメイン情報を統合して提供するデータベースという意味で使われる表現。
- 統合機能予測データベース
- タンパク質の機能要素(ファミリー・ドメイン・サイトなど)を統合的に予測・注釈するデータベースという意味。
- タンパク質機能予測データベース
- タンパク質の機能を予測し、アノテーションを提供するデータベース。
- 蛋白質機能アノテーションデータベース
- 機能アノテーションを提供するデータベースという意味。
- ドメインファミリーデータベース
- ドメインとファミリー情報を統合的に扱うデータベースという意味。
interproの対義語・反対語
- 非InterProデータ
- InterProデータベース以外の情報・データを指す表現。InterProに依存していないデータを意味します。
- InterPro以外のデータベース
- InterProとは別の、他のタンパク質ドメイン・ファミリ情報を提供するデータベースを指す言い方です。
- イントラプロ情報
- 単一のタンパク質内部に焦点を当てた情報・注釈。InterProの“横断的・組織的”視点の対比として使います。
- タンパク質間情報
- 複数のタンパク質同士の関連性や比較を扱う情報。InterProの跨蛋白情報に対する対概念です。
- 内部注釈
- タンパク質内部の局所的注釈・特徴を指す語。広義の機能・ファミリ情報とは別の視点です。
- 単一タンパク質情報
- 特定の1つのタンパク質に限定した情報・特徴。InterProの広範な横断情報の対比として用いられます。
- 外部参照なしデータ
- InterProが提供する外部参照(クロスリファレンス)を前提としないデータ・情報を指す表現。
interproの共起語
- InterPro
- タンパク質ファミリー・ドメイン・機能部位を統合して提供するデータベース。複数の専門データベースの情報をひとつに統合し、配列解析のアノテーション根拠として利用されます。
- タンパク質ドメイン
- タンパク質の機能や構造を決定づける基本的な領域。InterProは様々なデータベースのドメイン情報を集約しています。
- タンパク質ファミリー
- 相同性を持つタンパク質のグループ。機能や起源が共通することが多く、InterProがファミリー情報を統合します。
- ドメインファミリー
- 複数の関連するドメインの集合。InterProはこのようなファミリー構造を整理して提供します。
- アノテーション
- タンパク質の機能・局在・構造情報を配列に関連付ける作業。InterProはアノテーションの根拠データを提供します。
- InterProScan
- 配列を入力してInterProのドメイン・ファミリーを予測する解析ツール。研究やゲノムアノテーションでよく使われます。
- Pfam
- タンパク質ファミリー・ドメインのデータベースの一つ。InterProと連携して情報を提供します。
- PROSITE
- モチーフ・パターンのデータベース。InterProはPROSITEの情報を統合してアノテーションの根拠とします。
- PRINTS
- パターンベースのデータベース。InterProに統合され、ファミリードメインの同定に役立ちます。
- SMART
- タンパク質ドメインの境界と機能情報を提供するデータベース。InterProに組み込まれています。
- SUPERFAMILY
- 構造に基づくファミリー分類データベース。InterProはこの情報をエントリとして統合します。
- Gene Ontology
- 遺伝子・タンパク質の機能・生物学的過程・細胞成分を表す共通辞書。InterProのエントリはGO用語とリンクします。
- UniProt
- タンパク質配列と機能情報の総合データベース。InterProはUniProtのエントリにドメイン情報を付与します。
- EBI
- European Bioinformatics Institute。InterProを提供・ホスティングする機関の一つです。
- IPR番号
- InterProのエントリ識別子。例: IPR000001。配列スキャンの結果として表示されます。
- 配列解析
- DNA/タンパク質配列を解析して機能・構造を推定する作業。InterProはこの解析の一部として用いられます。
- 生物情報学
- 生物学データを計算機で扱う学問領域。InterProは主要なデータベースの一つです。
- ドメインアノテーション
- 配列中のドメインを同定してラベルを付ける作業。InterProはこのアノテーションを提供します。
interproの関連用語
- InterPro
- タンパク質ファミリ・ドメイン・機能部位の情報を、複数の専門データベースから統合して提供する総合データベース。
- InterProScan
- 配列データを入力して、InterProの署名(シグネチャ)と一致するファミリやドメイン、機能部位を特定する解析ツール。
- Pfam
- タンパク質ファミリとドメインをHMMで表現する大規模データベース。InterProの主要なメンバーの一つ。
- PROSITE
- タンパク質のドメイン・モチーフ・機能部位をパターンやプロファイルで定義するデータベース。InterProにも統合されている。
- PRINTS
- タンパク質の指紋( fingerprints)と呼ばれるパターンの集合体でファミリを識別するデータベース。InterProのメンバー。
- SMART
- モジュラーなドメイン構造を中心に扱うデータベース。InterProの重要な構成要素の一つ。
- SUPERFAMILY
- 構造情報に基づくドメイン・ファミリを分類するデータベース。InterProのメンバー。
- Gene3D
- 構造ベースのドメインファミリを提供するデータベース。InterProのメンバー。
- TIGRFAMs
- 細菌・古細菌向けに curated された厳密なファミリ定義データベース。InterProのメンバー。
- CATH-Gene3D
- CATHの階層情報とGene3Dの統合データを提供するエントリ群。InterProのメンバー。
- IPR_Accession
- InterProエントリの一意識別子。例: IPR000001。ファミリ・ドメインを指すID。
- InterPro_Entry
- InterPro内の1つのエントリ。複数の署名を統合して、機能予測の根拠を提供する単位。
- GO_Mapping
- InterProエントリとGene Ontology(GO)用語の対応づけ。機能・過程・細胞成分を表す。
- EC_Number
- 酵素反応を分類するEC番号。該当エントリに関連付けられることがある。
- UniProt
- タンパク質配列データベース。InterProはUniProtエントリと連携して機能注釈を提供することが多い。
- CrossReferences
- 他データベース(例: UniProt、GO、EC など)への参照リンクを提供する仕組み。
- Signature
- InterProが用いる署名(シグネチャ)。複数のデータベースのパターンやHMMを組み合わせて定義される。
- Domain
- タンパク質の機能的・構造的なモジュール。独立して機能することもある領域。
- Protein_Family
- 共通の祖先と機能を共有するタンパク質の集合。ファミリとして分類される。
- Protein_Domain
- 機能や構造を担う独立した領域。ドメインは多くのタンパク質に共通することがある。
- Conserved_Motif
- 機能に関与する保存された短いアミノ酸の配列モチーフ。
- Domain_Architecture
- タンパク質内のドメインの配置順序や組み合わせ方を表す概念。
- InterPro_Release
- InterProデータベースの公開リリース情報。新規エントリや修正を含む版。
- InterPro_API
- プログラムからInterProデータを取得・操作するためのAPI。
- InterProScan_Results
- InterProScan実行後の結果セット。該当エントリID、GO・ECの情報、ドメイン情報などを含む。
- Annotation_Transfer
- 信頼性の高いエントリから未注釈の配列へ機能情報を伝搬する考え方・プロセス。
- Sequence_Annotation
- 配列データに対する機能注釈の総称。配列の機能推定に使われる情報。
- GO_Terms
- Gene Ontologyの用語群。InterProエントリに紐づく機能・生物学的プロセス・場所を説明する用語群。



















