interpro・とは?初心者向け解説と使い方ガイド共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
interpro・とは?初心者向け解説と使い方ガイド共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


interpro・とは?

はじめに、interproとは何かをやさしく解説します。interproは、タンパク質の機能を推定するための統合データベースです。複数の専門データベースからの情報を集約しており、タンパク質の「ファミリー」や「ドメイン」「モチーフ」といった特徴を一度に確認できる仕組みになっています。これにより、配列データだけを見ただけでも、どんな機能を持つタンパク質かの候補を絞り込むことができます。現代のゲノム研究では、鍵となる機能の予測やアノテーション作業に欠かせないツールとして広く使われています。

実際のところ、interproは単一のデータベースではなく、Pfam、SMART、PROSITE、PRINTS、SUPERFAMILY などの複数のデータベースからの情報を統合します。これらのデータベースが見つけた「ファミリー(家族)」や「ドメイン(領域)」といった特徴を、InterProの共通の枠組みで整理して表示します。各エントリにはIPR番号と呼ばれる一意の識別子が付けられており、研究者は検索結果を簡単に参照・共有できます。

この仕組みのよいところは、複数の出典情報を一本化してくれる点です。例えば、あるタンパク質配列に対して Pfam で見つかったドメインの情報と、 SMARTで見つかったモチーフの情報を別々に見るより、interproの結果として総合的なプロフィールを得られるため、機能推定の信頼性を高めやすくなります。

使われ方の例としては、ゲノム解析で新規配列の機能を仮説づけるときや、学術論文の補足データとしてアノテーションを作成するときがあります。特に「このタンパク質はこのドメインを持つファミリーに近い」といった結論を得るには、InterProの出力が強力な手掛かりになりやすいです。

InterProの仕組みと出力の見方

まず、InterProのウェブサイトやツールを使って配列を解析します。ウェブ検索で「InterPro」と入力すると、各エントリのIPR番号、ファミリー名、ドメイン境界、機能のヒントなどが一覧で表示されます。結果には、どのデータベースからの情報が統合されているか、そして信頼性を示すスコアが付くこともあります。

このあと、InterProScanと呼ばれるツールを使えば、独自の配列をスキャンして複数のデータベースの情報を同時に取得できます。InterProScanはローカル環境でも実行でき、配列データを企業内のパイプラインに組み込むのに適しています。ウェブ版とローカル版の両方が提供されており、研究の規模やニーズに合わせて選択できます。

以下は、ウェブ版の出力の見方の一例です。結果には、IPR番号と対応するファミリー名、ドメイン境界、機能のヒント、関連情報が表示されます。各エントリには“関係するデータベース”や“関連する生物種”の情報も併記され、どのような生物学的文脈でそのドメインが重要かを判断する手掛かりになります。

<th>項目
説明
主な目的タンパク質のファミリーやドメインを同定し、機能を予測すること
連携データベースPfam、SMART、PROSITE、PRINTS、SUPERFAMILY など
出力の特徴IPR番号、ファミリー名、ドメイン境界、機能のヒント、関連情報
利用形態ウェブ検索、InterProScan、API、アノテーションワークフロー

最後に覚えておきたいポイントとして、interproは強力な研究支援ツールですが、単独の予測に過度に依存せず、実験データや他の生物情報と組み合わせて解釈することが大切です。複数のデータソースを横断して総合的に判断する習慣をつけましょう。

使い方の基本ステップ

1. InterProの公式サイトにアクセスします。

2. 配列またはエントリIDを入力します。配列をそのまま貼り付けることも、既存のIDを使うこともできます。

3. 検索結果を確認します。ファミリー、ドメイン、モチーフの情報と、どのデータベースが情報を出しているかが表示されます。

4. 必要に応じて、InterProScanを使って自前のシーケンスを解析します。解析結果は出力形式を選んでダウンロードでき、アノテーション作成の基礎になります。

結論

総じて、interproは生物情報学の「道具箱」として、タンパク質の機能予測を効率化してくれます。学習用の教材としても、研究の現場でのデータ解釈にも役立つ信頼性の高いリソースです。


interproの同意語

InterPro
公的なタンパク質ファミリーとドメインの統合データベースの名称。タンパク質のファミリー・ドメイン情報を総合的に提供します。
InterProデータベース
InterProの正式名称を指す表現。タンパク質ファミリーとドメインのアノテーション情報を集約して公開しているデータベースです。
タンパク質ファミリーデータベース
タンパク質をファミリー(同じ機能・構造を持つグループ)に分類・整理するデータベースの総称。InterProの役割と近い概念です。
タンパク質ドメインデータベース
タンパク質の機能的領域(ドメイン)情報を集約・検索できるデータベースのこと。InterProの主要機能の一つです。
蛋白質ファミリーデータベース
蛋白質のファミリー情報を整理・提供するデータベース。中・古い表記の同義語として使われることがあります。
蛋白質ドメインデータベース
蛋白質のドメイン情報を集約するデータベースのこと。InterProと同様の機能を指す表現です。
ファミリとドメインの統合データベース
ファミリー情報とドメイン情報を統合して提供するデータベースという意味で使われる表現。
統合機能予測データベース
タンパク質の機能要素(ファミリー・ドメイン・サイトなど)を統合的に予測・注釈するデータベースという意味。
タンパク質機能予測データベース
タンパク質の機能を予測し、アノテーションを提供するデータベース。
蛋白質機能アノテーションデータベース
機能アノテーションを提供するデータベースという意味。
ドメインファミリーデータベース
ドメインとファミリー情報を統合的に扱うデータベースという意味。

interproの対義語・反対語

非InterProデータ
InterProデータベース以外の情報・データを指す表現。InterProに依存していないデータを意味します。
InterPro以外のデータベース
InterProとは別の、他のタンパク質ドメイン・ファミリ情報を提供するデータベースを指す言い方です。
イントラプロ情報
単一のタンパク質内部に焦点を当てた情報・注釈。InterProの“横断的・組織的”視点の対比として使います。
タンパク質間情報
複数のタンパク質同士の関連性や比較を扱う情報。InterProの跨蛋白情報に対する対概念です。
内部注釈
タンパク質内部の局所的注釈・特徴を指す語。広義の機能・ファミリ情報とは別の視点です。
単一タンパク質情報
特定の1つのタンパク質に限定した情報・特徴。InterProの広範な横断情報の対比として用いられます。
外部参照なしデータ
InterProが提供する外部参照(クロスリファレンス)を前提としないデータ・情報を指す表現。

interproの共起語

InterPro
タンパク質ファミリー・ドメイン・機能部位を統合して提供するデータベース。複数の専門データベースの情報をひとつに統合し、配列解析のアノテーション根拠として利用されます。
タンパク質ドメイン
タンパク質の機能や構造を決定づける基本的な領域。InterProは様々なデータベースのドメイン情報を集約しています。
タンパク質ファミリー
相同性を持つタンパク質のグループ。機能や起源が共通することが多く、InterProがファミリー情報を統合します。
ドメインファミリー
複数の関連するドメインの集合。InterProはこのようなファミリー構造を整理して提供します。
アノテーション
タンパク質の機能・局在・構造情報を配列に関連付ける作業。InterProはアノテーションの根拠データを提供します。
InterProScan
配列を入力してInterProのドメイン・ファミリーを予測する解析ツール。研究やゲノムアノテーションでよく使われます。
Pfam
タンパク質ファミリー・ドメインのデータベースの一つ。InterProと連携して情報を提供します。
PROSITE
モチーフ・パターンのデータベース。InterProはPROSITEの情報を統合してアノテーションの根拠とします。
PRINTS
パターンベースのデータベース。InterProに統合され、ファミリードメインの同定に役立ちます。
SMART
タンパク質ドメインの境界と機能情報を提供するデータベース。InterProに組み込まれています。
SUPERFAMILY
構造に基づくファミリー分類データベース。InterProはこの情報をエントリとして統合します。
Gene Ontology
遺伝子・タンパク質の機能・生物学的過程・細胞成分を表す共通辞書。InterProのエントリはGO用語とリンクします。
UniProt
タンパク質配列と機能情報の総合データベース。InterProはUniProtのエントリにドメイン情報を付与します。
EBI
European Bioinformatics Institute。InterProを提供・ホスティングする機関の一つです。
IPR番号
InterProのエントリ識別子。例: IPR000001。配列スキャンの結果として表示されます。
配列解析
DNA/タンパク質配列を解析して機能・構造を推定する作業。InterProはこの解析の一部として用いられます。
生物情報学
生物学データを計算機で扱う学問領域。InterProは主要なデータベースの一つです。
ドメインアノテーション
配列中のドメインを同定してラベルを付ける作業。InterProはこのアノテーションを提供します。

interproの関連用語

InterPro
タンパク質ファミリ・ドメイン・機能部位の情報を、複数の専門データベースから統合して提供する総合データベース。
InterProScan
配列データを入力して、InterProの署名(シグネチャ)と一致するファミリやドメイン、機能部位を特定する解析ツール。
Pfam
タンパク質ファミリとドメインをHMMで表現する大規模データベース。InterProの主要なメンバーの一つ。
PROSITE
タンパク質のドメイン・モチーフ・機能部位をパターンやプロファイルで定義するデータベース。InterProにも統合されている。
PRINTS
タンパク質の指紋( fingerprints)と呼ばれるパターンの集合体でファミリを識別するデータベース。InterProのメンバー。
SMART
モジュラーなドメイン構造を中心に扱うデータベース。InterProの重要な構成要素の一つ。
SUPERFAMILY
構造情報に基づくドメイン・ファミリを分類するデータベース。InterProのメンバー。
Gene3D
構造ベースのドメインファミリを提供するデータベース。InterProのメンバー。
TIGRFAMs
細菌・古細菌向けに curated された厳密なファミリ定義データベース。InterProのメンバー。
CATH-Gene3D
CATHの階層情報とGene3Dの統合データを提供するエントリ群。InterProのメンバー。
IPR_Accession
InterProエントリの一意識別子。例: IPR000001。ファミリ・ドメインを指すID。
InterPro_Entry
InterPro内の1つのエントリ。複数の署名を統合して、機能予測の根拠を提供する単位。
GO_Mapping
InterProエントリとGene Ontology(GO)用語の対応づけ。機能・過程・細胞成分を表す。
EC_Number
酵素反応を分類するEC番号。該当エントリに関連付けられることがある。
UniProt
タンパク質配列データベース。InterProはUniProtエントリと連携して機能注釈を提供することが多い。
CrossReferences
他データベース(例: UniProt、GO、EC など)への参照リンクを提供する仕組み
Signature
InterProが用いる署名(シグネチャ)。複数のデータベースのパターンやHMMを組み合わせて定義される。
Domain
タンパク質の機能的・構造的なモジュール。独立して機能することもある領域。
Protein_Family
共通の祖先と機能を共有するタンパク質の集合。ファミリとして分類される。
Protein_Domain
機能や構造を担う独立した領域。ドメインは多くのタンパク質に共通することがある。
Conserved_Motif
機能に関与する保存された短いアミノ酸の配列モチーフ
Domain_Architecture
タンパク質内のドメインの配置順序や組み合わせ方を表す概念。
InterPro_Release
InterProデータベースの公開リリース情報。新規エントリや修正を含む版。
InterPro_API
プログラムからInterProデータを取得・操作するためのAPI。
InterProScan_Results
InterProScan実行後の結果セット。該当エントリID、GO・ECの情報、ドメイン情報などを含む。
Annotation_Transfer
信頼性の高いエントリから未注釈の配列へ機能情報を伝搬する考え方・プロセス。
Sequence_Annotation
配列データに対する機能注釈の総称。配列の機能推定に使われる情報。
GO_Terms
Gene Ontologyの用語群。InterProエントリに紐づく機能・生物学的プロセス・場所を説明する用語群。

学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
2082viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
815viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
705viws
座標計算・とは?初心者向けガイドで完全マスター共起語・同意語・対義語も併せて解説!
681viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
570viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
557viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
550viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
513viws
k型熱電対とは?初心者にも分かる基礎解説と活用事例共起語・同意語・対義語も併せて解説!
502viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
471viws
大辞林とは?初心者にもわかる日本語辞典の使い方と特徴共起語・同意語・対義語も併せて解説!
467viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
446viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
443viws
気圧の単位とは?中学生にもわかるPa・atm・bar・Torrの違いと換算ガイド共起語・同意語・対義語も併せて解説!
433viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
420viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
376viws
摘要とは?初心者にも分かる意味と書き方ガイド共起語・同意語・対義語も併せて解説!
372viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
370viws
100g・とは?初心者が今すぐ知っておきたい基本と使い方共起語・同意語・対義語も併せて解説!
368viws
3/4・とは?分数の基本を分かりやすく解く完全ガイド共起語・同意語・対義語も併せて解説!
368viws

新着記事

学問の関連記事