

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
genbankとは何か
genbankは世界中の研究者が投稿した遺伝子配列データを集めて公開している巨大なデータベースです。正式名称は GenBankであり、データは米国国立生物工学情報センター NCIB? ではなく NC BI の National Center for Biotechnology Information が運営しています。初心者にとっては難しそうに思えるかもしれませんが、基本の使い方はとてもシンプルです。遺伝子配列の“配列データ”とそれに付随する“注釈情報”がひとまとめになっており、研究や教育の現場で幅広く利用されています。
genbankを使う主な目的は、他の生物の遺伝子配列を調べて比較したり、特定の遺伝子がどう変化しているかを確認したりすることです。データは公開されており、研究成果の再現性を高める役割も果たします。ウェブ上の検索機能を使えば、生物名や遺伝子名で簡単に該当データを見つけられます。
GenBankの中身とデータ形式
GenBankには次のような情報が入り混みます。配列データそのもの、配列の注釈(どの遺伝子か、機能の説明、由来となる生物種など)、論文の情報です。データは様々な形式で提供されており、代表的なものには FASTA や GenBank 形式があります。初学者はまず Web 上で配列のページを開いて、注釈と配列の読み方を覚えると理解が早く進みます。
GenBankの情報は日々更新され、新しい研究成果が追加されています。データを利用する際は、出典を必ず確認し、データの最新版かどうかを確認しましょう。
使い方の基本フロー
初心者が GenBank を使い始めるときの基本的な流れは以下のとおりです。まずは 生物種名や遺伝子名を入力して検索します。次に該当データのページを開き、遺伝子の配列と注釈を確認します。必要に応じてデータをダウンロードし、授業や課題で使うファイルとして保存します。データの利用には出典表示が必要です。
表で見る GenBank の基本情報
| データの種類 | |
| 提供元 | NCBI(National Center for Biotechnology Information) |
|---|---|
| 主なデータ形式 | FASTA, GenBank 形式 など |
| 利用目的 | 遺伝子の比較・機能推定・教育・研究の基礎資料 |
データを使うときの注意点として、データの信頼性は投稿者の情報と注釈に依存する点があります。実験結果の再現性を高めるには、複数のソースを照合し、必要に応じて原著論文を参照してください。教育現場では、データの読み方や表記の仕方を一緒に学ぶことで、遺伝子研究の基礎力を着実に育てられます。
よく使われる用語
Entrezは GenBank などのデータベースを横断検索するための検索システムの名前です。注釈は配列の意味を説明するテキスト、機能予測はその遺伝子がもつと考えられる機能の推定です。最初はこれらの語をひとつずつ覚えるだけでも、ページの読み取りが楽になります。
教育・研究での活用例
授業では、生徒が特定の遺伝子を検索して配列を読み取り、注釈を整理する演習を行うと理解が深まります。研究では、他の研究者が公開した配列と自分のデータを比較して、系統関係の考察や機能の検証を進めます。
データ取得の簡単な手順例
以下は最も基本的なステップです。ウェブサイトにアクセスし、遺伝子名や生物種名を入力して検索します。該当データのページを開き、配列データと注釈を閲覧します。必要ならデータをローカルに保存し、授業資料や研究ノートに貼り付けます。データの利用には出典表示を忘れずに。
GenBankは生物学を学ぶ人にとって強力な学習リソースです。 少しずつ慣れていけば、遺伝子の仕組みや進化の理解が深まり、研究の幅が広がります。
注意点とマナー
データを使う前に、出典の表記と利用規約を必ず確認しましょう。公開データは研究の資産ですが、著作権・データ使用条件に従うことが大切です。教育の場では、データを共有する際にも同様のマナーを守ることが求められます。
まとめ
genbankは遺伝子配列データを世界中の研究者と共有する重要な資源です。配列そのものだけでなく注釈情報も併せて提供され、教育・研究の基礎として広く利用されています。初めは難しく感じても、基本的な検索と注釈の読み方を覚えるだけで、データを活用する力が着実に身につきます。
genbankの同意語
- GenBank
- NCBI が提供する核酸配列データベースの正式名称。遺伝子のDNA/RNA配列と注釈情報を公開している主要データベース。
- GenBank データベース
- GenBank の日本語表現。DNA/RNA の配列データと注釈をまとめて検索・取得できるデータベースのこと。
- GenBank nucleotide sequence database
- GenBank の英語正式名称。核酸(DNA/RNA)配列データを公開するデータベース。
- NCBI GenBank
- National Center for Biotechnology Information が提供する GenBank データベースの呼び方。英語表現。
- GenBank フラットファイル形式
- GenBank エントリを記述する標準的なテキスト形式。遺伝子配列と注釈が連携して格納される。
- GenBank ファイル
- GenBank データを格納するファイル全般。エントリや配列が含まれる。
- GenBank エントリ
- GenBank に登録された個々の遺伝子配列エントリ。配列データと注釈がセットで保存される。
- GenBank 配列データベース
- GenBank の別表現。遺伝子配列データを蓄積・公開するデータベースとしての意味。
- 遺伝子配列データベース
- GenBank を含む、DNAやRNAの配列データを蓄積・公開するデータベースの総称。
- INSDC GenBank 部分
- INSDC(国際ヌクレオチド配列データベース連携)のうち、GenBank 側のデータを指す用語。
genbankの対義語・反対語
- 非公開データベース
- 公開されず、アクセスに認証や制限が必要なデータベース。GenBankが誰でも閲覧できる公開データベースであるのに対して、その性質とは反対のイメージ。
- 私的データベース
- 個人や特定の少人数の組織だけが管理・利用するデータベース。公開性が低く、研究コミュニティ全体には開かれていません。
- クローズドデータベース
- 特定の条件を満たす人や団体のみアクセスを許可する閉鎖的なデータベース。公開されているGenBankとは対照的。
- ローカルデータベース
- 所属機関の内部ネットワークや端末に限定して保管・利用するデータベース。公衆がアクセスできない点が反対。
- 機密データベース
- 高度に秘密性を保つデータベースで、公開されない。GenBankの公開性と対立します。
- 紙ベースの記録
- データが紙に保存され、デジタル化されていない形式の記録。GenBankはデジタルで公開される点と対照的。
- 遺伝子データ以外のデータベース
- 遺伝子配列データを扱わない、あるいは遺伝子データを前提としないデータベース。
- 企業内機密データベース
- 企業内でのみ利用され、外部には公開されないデータベース。GenBankの公開性とは反対の性質。
genbankの共起語
- NCBI
- 米国国立生物工学情報センター。GenBankを含む多様な生物学データベースを提供する機関。
- アクセッション番号
- GenBankエントリに付与される一意の識別子。特定の配列を指し示す標準的な参照名。
- 塩基配列
- DNAの塩基(A・C・G・T)からなる文字列で、GenBankに格納される基本データの中心。
- DNA配列
- デオキシリボ核酸の配列情報。生物の遺伝情報を表す。
- FASTA
- 配列データを表すテキスト形式の一つ。ヘッダ行と配列行で構成される。
- GenBankフォーマット
- GenBankエントリの平坦ファイル形式。LOCUS・DEFINITION・ACCESSION・FEATURES・ORIGINなどのセクションがある。
- GenBankデータベース
- GenBank自体のデータベース。公開配列と注釈を集約して提供。
- アノテーション
- 配列データに結びつく遺伝子名・機能・翻訳などの注釈情報。
- ORF
- Open Reading Frame。タンパク質をコードする可能性のある翻訳領域。
- CDS
- Coding Sequence。タンパク質をコードする遺伝子領域を表す注釈。
- RefSeq
- Reference Sequence。NCBIが提供する標準化された参照配列の集合。
- Entrez
- NCBIの統合検索システム。複数データベースを横断して検索可能。
- BLAST
- Basic Local Alignment Search Tool。配列の局所的な類似性を高速に探索するツール。
- GenPept
- GenBankの翻訳(タンパク質配列)エントリ。タンパク質情報を提供。
- タンパク質翻訳
- DNA配列から翻訳されるアミノ酸配列の表記。
- 参照配列
- RefSeqの別名として用いられることがある、標準的な参照配列。
- Taxonomy
- 生物の分類情報。種名・科・属などの系統情報。
- 種名
- 配列の生物種名を示す情報。
- データ提出
- GenBankへデータを提出する行為。適切なフォーマットとメタデータが必要。
- 平坦ファイル
- GenBank flatfile format。人が読みやすいテキスト形式のエントリ。
- 配列検索
- 配列データを対象にした検索機能。BLASTなどを用いて類似配列を探す。
- 遺伝子名
- 遺伝子の正式名称・別名。注釈として付記されることが多い。
genbankの関連用語
- GenBank
- 米国のNCBIが提供する公共の核酸塩基配列データベース。世界中の生物種の配列と注釈が登録され、他データベースと連携して検索・分析の基盤となります。
- NCBI
- National Center for Biotechnology Information の略。米国の生物情報機関で、GenBank や BLAST、Entrez などのツールを提供しています。
- INSDC
- International Nucleotide Sequence Database Collaboration の略。GenBank(NCBI)、EMBL-EBI、DDBJ の三者がデータを共有する国際連携組織です。
- EMBL-EBI
- European Bioinformatics Institute の略。ENA などの核酸データベースを運用し、INSDC の一翼を担っています。
- DDBJ
- DNA Data Bank of Japan の略。日本の核酸データベースで、INSDC のパートナーとしてデータを提供しています。
- accession number
- 各配列レコードを一意に識別する番号。レコードを参照する基本的なIDで、更新ごとにバージョンが付くことがあります。
- locus
- レコードの基本情報を示す LOCUS 行の情報。配列の長さや分子種などが記載されます。
- nucleotide sequence
- DNA または RNA の塩基配列。A・C・G・T(DNA)または A・C・G・U(RNA)で表され、遺伝情報の本体です。
- RefSeq
- NCBI が厳密に検証・統合した参照配列セット。多くは GenBank のデータを基に作られ、標準的な参照として使われます。
- FASTA
- 最も基本的な塩基・アミノ酸配列のテキストフォーマット。ヘッダ行は > で始まり、続く行に配列が並びます。軽量で広く用いられます。
- FASTQ
- FASTA に品質情報を加えたフォーマット。次世代シーケンスデータで、配列と各位置の品質スコアを一緒に保存します。
- GenBank flat file
- GenBank のレコード形式。LOCUS、DEFINITION、ACCESSION、VERSION、FEATURES、ORIGIN などのセクションから成り、配列と注釈が一体となって格納されます。
- GenPept
- GenBank レコードの翻訳情報を含むタンパク質データベース。DNA 配列の CDS から翻訳されたアミノ酸配列が格納されます。
- ORF
- Open Reading Frame の略。翻訳可能な読み枠のこと。開始コドンから停止コドンまでを含む領域の候補です。
- CDS
- Coding Sequence の略。遺伝子の翻訳可能な領域を示すフィーチャーで、/gene・/product・/translation などの注釈が付くことが多いです。
- gene feature
- 遺伝子を示す注釈フィーチャー。/gene などの修飾子が使われます。
- gene qualifier
- フィーチャーの遺伝子名を示す修飾子。例: /gene="BRCA1"
- product qualifier
- 遺伝子産物の名称を示す修飾子。例: /product="DNA helicase"
- translation qualifier
- CDS のアミノ酸配列を示す修飾子。例: /translation="MKT..."
- origin
- 実際の塩基配列データが格納されるセクション。座標は 1 から始まります。
- feature table
- GenBank の注釈情報を格納するセクション。遺伝子、CDS、RNA などのフィーチャーを一覧で管理します。
- annotation
- レコードに付随する情報全般。遺伝子名、機能、配列情報などの説明が含まれます。
- WGS
- Whole Genome Shotgun の略。全ゲノムのドラフトデータセットで、_contigs が結合されて登録されます。
- TSA
- Transcriptome Shotgun Assembly の略。転写産物のショットガンアセンブリデータです。
- EST
- Expressed Sequence Tag の略。発現している遺伝子の発現断片を指す古くからあるデータ形式です。
- cDNA
- complementary DNA の略。遺伝子の転写産物を元に作られたDNAで、研究に頻繁に用いられます。
- mRNA
- メッセージRNA。タンパク質合成のテンプレートとなるRNAです。
- tRNA
- transfer RNA。アミノ酸をリボソームへ運ぶ役割を持つ小さなRNA分子です。
- rRNA
- ribosomal RNA。リボソームの構成要素となるRNAです。
- BLAST
- Basic Local Alignment Search Tool の略。配列間の局所的な類似性を高速に検出します。
- MegaBLAST
- 大規模なデータベースでの高速類似検索に適した BLAST の派生版です。
- tBLASTn
- タンパク質配列を核酸データベースで検索する BLAST の形式。
- blastp
- タンパク質同士の相同性検索。蛋白質データベースを対象に比較します。
- Entrez
- NCBI の統合検索システム。複数データベースを横断して検索・取得が可能です。
- BankIt
- GenBank へ配列を提出するウェブベースの提出ツール。
- Sequin
- GenBank へデータを提出するためのコマンドライン/デスクトップツール。
- SRA
- Sequence Read Archive。次世代シーケンスの原データ(生データ)を格納するデータベースです。
- BioProject
- 研究プロジェクトをまとめるメタデータ単位。複数データの集合を一つのプロジェクトとして管理します。
- BioSample
- 実験で使われたサンプルのメタデータを表すデータの単位です。
- Nucleotide database
- NCBI の核酸データベース全体を指す総称。GenBank、RefSeq、SRA などを含みます。
- GenBank divisions
- GenBank データが分類される区分のこと。例: GenBank、RefSeq、WGS、TSA、EST など、データの性質を示します。



















