次世代シーケンスとは?初心者にもわかる基本と応用共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
次世代シーケンスとは?初心者にもわかる基本と応用共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


次世代シーケンスとは何か

次世代シーケンスとは、DNAやRNAの 配列情報を一度に大量に読み取ることができる最新の技術です。英語名は Next-Generation Sequencing で、略して NGS と呼ばれます。従来の方法に比べて、同じ時間で読取れるデータ量が飛躍的に増え、研究のスピードが大きく上がりました。初心者の人にも、ここでは難しい専門用語をできるだけ使わず、身の回りの例でイメージできるように解説します。

どうやって使われるのか

まず、DNAを 小さな断片 に分け、端に識別用のコードをつけて「ライブラリ」と呼ばれる準備をします。次に、これらの断片を一度に機械に読み取らせます。読み取られた短い文字列をコンピュータがつなぐことで、元の長いDNA配列を復元します。この一連の作業を経て、人の遺伝子の変化や病気の原因となる場所を特定できるようになります。

NGSの特徴とメリット

NGSのこうした特徴の多くは、次の3つの点に集約されます。まず 高速性、次に コストの低下、そして データ量の多さです。これらの組み合わせにより、以前は難しかった大規模な研究が現実的になりました。また、環境サンプルから微量のDNAを検出することも可能で、医療だけでなく農業・生物学研究でも活用が進んでいます。

従来の方法との比較

以下の表は、従来の方法とNGSを比べたときの代表的な違いをまとめたものです。読み取り速度、コスト、データ量、適用範囲などの観点から理解を深める手助けになります。

<th>項目
従来法NGS
読み取り速度遅い高速
コスト高い低コスト化
データ少量大量
適用範囲限定的広範囲

まとめとして、次世代シーケンスは現代の生物学と医療の基盤となる技術です。研究者はこの技術を使って、病気の原因遺伝子の特定、進化の歴史の解明、遺伝子治療の新しい可能性の探索などを行っています。中学生でも理解できるように、まずは“DNAの読み取りをどう効率化するか”という発想を持つことが大切です。


次世代シーケンスの同意語

次世代シーケンス
現代のDNAシーケンス技術の総称。従来のサンガー法に対して、同時に多数の断片を高速に読み取り、ゲノム全体の解読を実現します。
NGS
Next-Generation Sequencing の略。大量のDNA断片を並列に読み取る高スループット技術の総称。
新世代シーケンス技術
次世代シーケンスと同義の表現。新しい世代のDNA配列決定技術を指します。
次世代DNAシーケンス
DNAの配列決定を目的とした次世代技術。ゲノム解析の中心的手法として広く使われています。
次世代ゲノムシーケンス
ゲノム全体の配列解読を指す表現。ゲノム規模の解析に適した技術群を含みます。
高スループットシーケンス
高いデータ処理能力を活かして多量の配列データを短時間で取得する技術。研究・臨床の両方で広く用いられます。
ハイスループットシーケンシング
高スループットのシーケンス技術を指す表現。大量データを効率よく読み取る特徴を強調します。
大量並列シーケンス
Massively parallel sequencing の和訳。多くのDNA断片を同時に読み取る方式です。
Massively parallel sequencing
英語圏で用いられる呼称。大量のDNA断片を一度に並列に読み取る技術の総称。
大規模並列シーケンス
大量データを並列に取得する性質を表す別表現。NGS の特徴を指します。

次世代シーケンスの対義語・反対語

第一世代シーケンス
Sanger法を代表とする従来のシーケンス技術。一本ずつ順に読み取るため低スループット・長時間・高コストになりやすい点がNGSの対義語として語られます。
従来のシーケンス技術
NGS以前の一般的な手法の総称。データ量が少なく、手作業や手動化が多い傾向があります。
サンガー法
第一世代の代表的なシーケンス法。高い精度は得られる一方で大量データには不向きで、NGSと対照的な位置づけになります。
スループットシーケンス
同時に読み取れるDNA断片の数が少ない手法。データ量が限られ、検査全体の時間や費用がかさみやすい点が特徴です。
逐次シーケンス
断片を逐次的に読み取る方法で、NGSの並列読み取りに対して読み取りの並列性が低い点が対義的です。
手動・半自動化のシーケンス
多くの工程が人手または半自動で行われる手法。NGSの高度な自動化・機械化と対照的に扱われます。
古典的シーケンス技術
伝統的な手法全般を指す語。長時間・高コスト・低スループットの特徴があり、NGSと比較されることが多い。

次世代シーケンスの共起語

NGS
次世代シーケンスの略称で、同時に多数のDNA断片を並列に読み取る技術群を指します。
Illumina
現在最も普及している次世代シーケンスプラットフォームの代表格。主にショートリードを高スループットで提供します。
PacBio
PacBio(Pacific Biosciences)が提供する長鎖リード対応プラットフォーム。長いリード長で複雑領域の解読に強いのが特徴です。
Oxford Nanopore
ナノポア技術を使う長鎖リードのシーケンス。ポータブル機器もあり、現場での測定にも適しています。
Roche 454
旧来の次世代シーケンス機。現在は市場から撤退していますが、NGSの発展史でよく挙げられます。
SOLiD
ABIのSOLiD シーケンス。複数の色素で読み取る方式の古いプラットフォーム。現在は希少です。
ショートリード
短い長さのリード(例: 50–300 bp、Illumina系が多い)。高スループットでコスト効率が良いです。
ロングリード
長いリード(数千〜数万 bp)。PacBioやNanoporeで得られ、複雑領域の解決に有利。
リード長
1つの読み取りの長さの指標。長いほどゲノムの組み立てや構造変異の検出に有利です。
カバレッジ
ゲノム全体が何回読み取られたかの平均。一般に高いほど変異検出の信頼性が上がります。
品質スコア
各塩基の信頼度を表す指標。高いほど誤読の可能性が低くなります。通常はQスコアで表現します。
FASTQ
リードの配列データと品質情報を同時に格納する標準フォーマット
FASTA
配列データのみを格納する、古くから使われているフォーマット
BCL
Illuminaの初期出力ファイル形式のひとつ。Base Callの略。
アダプター
ライブラリ作製時につける短いDNA配列。データ解析時には取り除くトリミング対象です。
インデックス / バーコード
複数サンプルを一本のランで測定する際に識別するための短い識別子。
マルチプレックス
複数サンプルを同時に解析する方式。リードとインデックスで区別します。
ライブラリ調製
DNAをシーケンス可能な小さな断片へ加工する前処理全般を指します。
DNA断片化
ゲノムDNAをシーケンス可能な断片長へ切断する工程。
PCR増幅
ライブラリを十分な量にするため断片を増幅する工程。偏りの原因となることがあります。
デノボアセンブリ
参照ゲノムを用いずにゲノムを組み立てる解析手法。
リファレンス導きアセンブリ
既知の参照ゲノムを基に断片を配置して組み立てる手法。
アライメント
リードを参照ゲノムや転写産物配列へ正確に並べ替える作業。
マッピング
アライメントとほぼ同義。リードの位置を決定する作業です。
BWA
最も一般的に使われるリードアライメントツールのひとつ(Burrows-Wheeler Aligner)。
Bowtie
高速なリードアライメントツールの一つ。
STAR
RNA-Seq向けの高速アライメントツール。大規模データに適しています。
HISAT2
RNA-Seqに適した高速アライメントツール。
GATK
変異検出や品質評価を行う解析ワークフローの中核ツール群。
SAMtools
BAM/VCFなどのファイル処理や抽出を行う基本ツール群。
VCF
変異情報を格納する標準フォーマット(SNP/Indelなどを格納)。
SNP
一塩基多型。個体間の塩基の差異の代表例
Indel
挿入・欠失と呼ばれる小さな変異。
RNA-Seq
転写産物の発現プロファイルを調べるためのシーケンス手法。
トランスクリプトーム
細胞内の全RNAの集合体を指す言葉。
メタゲノム
環境サンプル中の微生物ゲノム全体を同時に解析する手法。
16S rRNAシーケンス
細菌の系統解析に使われる重要遺伝子のシーケンス。
アノテーション
得られた配列データに遺伝子機能などの情報を付与する作業。
ゲノムブラウザ
IGVなど、ゲノムデータを視覚的に閲覧するツール。
ワークフロー / パイプライン
解析手順を自動化して再現性を高める仕組み。
クラウドコンピューティング
データ処理をクラウド上で実行する選択肢
データ形式
FASTQ、BAM、SAM、VCF など、解析で使われる標準形式の総称。
BQSR
Base Quality Score Recalibration の略。品質スコアを再計算して精度を上げる処理。
MultiQC
複数のQCレポートを1つにまとめて比較しやすくするツール。
リファレンスゲノム
解析の基準となる既知のゲノム配列。

次世代シーケンスの関連用語

次世代シーケンス
DNAやRNAを同時に大量に読み取る技術の総称。従来のSanger法より高スループットで短いリードを多数取得します。
ライブラリ調製
分析対象をシーケンサーで読める形に整える前処理。断片化、アダプター付加、サイズ選択、PCR増幅などを含みます。
断片化
長いDNA/RNAを読み取り可能な短い断片へ細かく砕く作業。リード長に合わせてサイズを調整します。
アダプター付加
断片の両端にシーケンサーが認識できる短いDNA配列(アダプター)を付ける工程。読取やサンプル識別に使われます。
デュアルインデックス
各サンプルに固有のバーコードを両端に付け、複数サンプルの混入を防ぎつつ同時測定を可能にする方法。
インデックス/バーコード
サンプル識別用の短いDNA配列。複数サンプルを一度にシーケンスする際に用います。
リード長
1回の読み取りで得られるDNA断片の長さ。例: 2×150 bp や 2×75 bp など、ペアエンドの場合が多いです。
ペアエンドシーケンシング
リードの両端を別々に読み取る方式。位置推定の精度や組み立ての精度が向上します。
シングルエンドシーケンシング
片端だけを読み取る方式。コストは抑えられますが、情報量は少なくなります。
トリミング
アダプターや低品質領域をリードから除去する前処理。データ品質を向上させます。
品質管理(QC)
データ品質を評価・監視する工程。問題を早期に把握して解析精度を保ちます。
FastQC
リード品質の概要を可視化する代表的なQCツール。品質分布やアダプター汚染などをチェックします。
Cutadapt
アダプターや低品質の末端を除去するツール。前処理の基本ツールです。
Trimmomatic
リードのトリミングと品質フィルタリングを行うツールの一つ。
FASTQ
リード配列と品質情報を格納する標準ファイル形式。多くの解析パイプラインの入口データです。
参照ゲノム
解析の基準となる、既知の完全なゲノム配列。リードのマッピング先として用います。
マッピング/アライメント
リードを参照ゲノム上の位置へ配置する作業。正確な位置情報を得る基本工程です。
BWA-MEM
DNAリードのマッピングに広く使われる代表的なアライナー
Bowtie2
短いリードのマッピングを高速・高精度に行うツール。
STAR
主にRNA-seqのマッピングに用いられる高速アライナー。スプライシングを考慮します。
HISAT2
RNA-seq のマッピングに適した高速アライナー。
minimap2
長短両方のリードに対応する汎用アライナー。
アセンブリ
リードをつなぎ合わせてゲノムやトランスクリプトームの長い連続配列を再構成する作業。
de novoアセンブリ
参照ゲノムを使わずに、リードだけから新規配列を組み立てる方法。
SPAdes
デノボアセンブリに特化した代表的なソフトウェア。
Velvet
古典的なデノボアセンブリのツールの一つ。
参照ガイドアセンブリ
参照ゲノムを用いてリードを組み立てる方法。参照に基づくアセンブリ。
トランスクリプトーム解析
RNA-seqデータを用いて、発現している遺伝子の分布・量・スプライシングなどを解析する作業。
RNA-seq
転写物の発現を測るNGS手法。遺伝子の発現量を定量化します。
16S rRNAシーケンス
細菌の同定・分類に用いられる、16S rRNA遺伝子を対象としたターゲットシーケンス。
メタゲノム
環境サンプル中の全微生物の遺伝情報を同時に解析する手法。
Kraken2
環境サンプル中の生物種を高速に分類するツール。
MetaPhlAn
環境サンプルの微生物群衆構成を推定するツール。
scRNA-seq
単一細胞レベルでのRNA発現を測定する手法。細胞ごとの発現差を解析します。
scATAC-seq
単一細胞レベルでクロマチンの開放状態を測る手法。
ChIP-seq
特定のタンパク質が結合しているゲノム領域を特定する手法。
ATAC-seq
開放的なクロマチン領域を検出する全ゲノム対応の手法。
Hi-C
ゲノム全体の三次元構造を捉える手法。染色体間の相互作用を読み取ります。
ビスルファイトシーケンス
DNAのメチル化パターンを検出するために、ビスルファイト処理を用いるシーケンス。
エクソームシーケンス
遺伝子コード領域(エクソン)を富化して読み取るターゲットシーケンス。
キャプチャ(ハイブリダイゼーションキャプチャ)
ターゲット領域を捕捉して富化する技術。エクソームなどで使用。
バリアントコール
リードからDNAの変異(SNP/Indel)を検出する解析工程。
SNP / Indel
一塩基置換(SNP)や小さな挿入・欠失(Indel)を指す用語。
VCF
検出した変異を格納する標準ファイル形式。Variant Call Format。
BAM / SAM
アライメント済みリードの格納形式。BAMは圧縮版。
TPM / FPKM / CPM
RNA-seqデータの発現量を定量化する指標。TPMが比較的直感的
DESeq2 / edgeR
RNA-seqの発現差を統計的に検出する代表的なソフトウェア
ワークフロー / パイプライン
データ解析の手順を自動化した作業の流れ。
Nextflow / Snakemake
NGS解析のワークフローを作成・実行するツール。
BQSR
Base Quality Score Recalibration。品質スコアを再調整して精度を上げる手法。
UMI
Unique Molecular Identifier。同一分子のリードを識別して定量の biasを抑えるタグ
FASTQ.gz
圧縮されたFASTQファイル。

次世代シーケンスのおすすめ参考サイト


学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
1922viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
698viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
654viws
座標計算・とは?初心者向けガイドで完全マスター共起語・同意語・対義語も併せて解説!
616viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
508viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
491viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
487viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
453viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
412viws
k型熱電対とは?初心者にも分かる基礎解説と活用事例共起語・同意語・対義語も併せて解説!
397viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
384viws
気圧の単位とは?中学生にもわかるPa・atm・bar・Torrの違いと換算ガイド共起語・同意語・対義語も併せて解説!
373viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
372viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
364viws
3/4・とは?分数の基本を分かりやすく解く完全ガイド共起語・同意語・対義語も併せて解説!
330viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
325viws
100g・とは?初心者が今すぐ知っておきたい基本と使い方共起語・同意語・対義語も併せて解説!
324viws
endnoteとは?研究ノートを整理する基本ツールの解説共起語・同意語・対義語も併せて解説!
318viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
315viws
pastとは?初心者向けガイド:意味・使い方・例文を徹底解説共起語・同意語・対義語も併せて解説!
276viws

新着記事

学問の関連記事