次世代シーケンスとは？初心者にもわかる基本と応用共起語・同意語・対義語も併せて解説！

この記事を書いた人

高岡智則

年齢：33歳性別：男性職業：Webディレクター（兼ライティング・SNS運用担当）居住地：東京都杉並区・永福町の1LDKマンション出身地：神奈川県川崎市身長：176cm 体系：細身〜普通（最近ちょっとお腹が気になる）血液型：A型誕生日：1992年11月20日最終学歴：明治大学・情報コミュニケーション学部卒通勤：京王井の頭線で渋谷まで（通勤20分）家族構成：一人暮らし、実家には両親と2歳下の妹恋愛事情：独身。彼女は2年いない（本人は「忙しいだけ」と言い張る）

次世代シーケンスとは何か

次世代シーケンスとは、DNAやRNAの 配列情報を一度に大量に読み取ることができる最新の技術です。英語名は Next-Generation Sequencing で、略して NGS と呼ばれます。従来の方法に比べて、同じ時間で読取れるデータ量が飛躍的に増え、研究のスピードが大きく上がりました。初心者の人にも、ここでは難しい専門用語をできるだけ使わず、身の回りの例でイメージできるように解説します。

どうやって使われるのか

まず、DNAを 小さな断片 に分け、端に識別用のコードをつけて「ライブラリ」と呼ばれる準備をします。次に、これらの断片を一度に機械に読み取らせます。読み取られた短い文字列をコンピュータがつなぐことで、元の長いDNA配列を復元します。この一連の作業を経て、個人の遺伝子の変化や病気の原因となる場所を特定できるようになります。

NGSの特徴とメリット

NGSのこうした特徴の多くは、次の3つの点に集約されます。まず 高速性、次に コストの低下、そして データ量の多さです。これらの組み合わせにより、以前は難しかった大規模な研究が現実的になりました。また、環境サンプルから微量のDNAを検出することも可能で、医療だけでなく農業・生物学研究でも活用が進んでいます。

従来の方法との比較

以下の表は、従来の方法とNGSを比べたときの代表的な違いをまとめたものです。読み取り速度、コスト、データ量、適用範囲などの観点から理解を深める手助けになります。

<th>項目

従来法	NGS
読み取り速度	遅い	高速
コスト	高い	低コスト化
データ量	少量	大量
適用範囲	限定的	広範囲

まとめとして、次世代シーケンスは現代の生物学と医療の基盤となる技術です。研究者はこの技術を使って、病気の原因遺伝子の特定、進化の歴史の解明、遺伝子治療の新しい可能性の探索などを行っています。中学生でも理解できるように、まずは“DNAの読み取りをどう効率化するか”という発想を持つことが大切です。

次世代シーケンスの同意語

次世代シーケンス: 現代のDNAシーケンス技術の総称。従来のサンガー法に対して、同時に多数の断片を高速に読み取り、ゲノム全体の解読を実現します。
NGS: Next-Generation Sequencing の略。大量のDNA断片を並列に読み取る高スループット技術の総称。
新世代シーケンス技術: 次世代シーケンスと同義の表現。新しい世代のDNA配列決定技術を指します。
次世代DNAシーケンス: DNAの配列決定を目的とした次世代技術。ゲノム解析の中心的手法として広く使われています。
次世代ゲノムシーケンス: ゲノム全体の配列解読を指す表現。ゲノム規模の解析に適した技術群を含みます。
高スループットシーケンス: 高いデータ処理能力を活かして多量の配列データを短時間で取得する技術。研究・臨床の両方で広く用いられます。
ハイスループットシーケンシング: 高スループットのシーケンス技術を指す表現。大量データを効率よく読み取る特徴を強調します。
大量並列シーケンス: Massively parallel sequencing の和訳。多くのDNA断片を同時に読み取る方式です。
Massively parallel sequencing: 英語圏で用いられる呼称。大量のDNA断片を一度に並列に読み取る技術の総称。
大規模並列シーケンス: 大量データを並列に取得する性質を表す別表現。NGS の特徴を指します。

次世代シーケンスの対義語・反対語

第一世代シーケンス: Sanger法を代表とする従来のシーケンス技術。一本ずつ順に読み取るため低スループット・長時間・高コストになりやすい点がNGSの対義語として語られます。
従来のシーケンス技術: NGS以前の一般的な手法の総称。データ量が少なく、手作業や手動化が多い傾向があります。
サンガー法: 第一世代の代表的なシーケンス法。高い精度は得られる一方で大量データには不向きで、NGSと対照的な位置づけになります。
低スループットシーケンス: 同時に読み取れるDNA断片の数が少ない手法。データ量が限られ、検査全体の時間や費用がかさみやすい点が特徴です。
逐次シーケンス: 断片を逐次的に読み取る方法で、NGSの並列読み取りに対して読み取りの並列性が低い点が対義的です。
手動・半自動化のシーケンス: 多くの工程が人手または半自動で行われる手法。NGSの高度な自動化・機械化と対照的に扱われます。
古典的シーケンス技術: 伝統的な手法全般を指す語。長時間・高コスト・低スループットの特徴があり、NGSと比較されることが多い。

次世代シーケンスの共起語

NGS: 次世代シーケンスの略称で、同時に多数のDNA断片を並列に読み取る技術群を指します。
Illumina: 現在最も普及している次世代シーケンスプラットフォームの代表格。主にショートリードを高スループットで提供します。
PacBio: PacBio（Pacific Biosciences）が提供する長鎖リード対応プラットフォーム。長いリード長で複雑領域の解読に強いのが特徴です。
Oxford Nanopore: ナノポア技術を使う長鎖リードのシーケンス。ポータブル機器もあり、現場での測定にも適しています。
Roche 454: 旧来の次世代シーケンス機。現在は市場から撤退していますが、NGSの発展史でよく挙げられます。
SOLiD: ABIのSOLiD シーケンス。複数の色素で読み取る方式の古いプラットフォーム。現在は希少です。
ショートリード: 短い長さのリード（例: 50–300 bp、Illumina系が多い）。高スループットでコスト効率が良いです。
ロングリード: 長いリード（数千〜数万 bp）。PacBioやNanoporeで得られ、複雑領域の解決に有利。
リード長: 1つの読み取りの長さの指標。長いほどゲノムの組み立てや構造変異の検出に有利です。
カバレッジ: ゲノム全体が何回読み取られたかの平均。一般に高いほど変異検出の信頼性が上がります。
品質スコア: 各塩基の信頼度を表す指標。高いほど誤読の可能性が低くなります。通常はQスコアで表現します。
FASTQ: リードの配列データと品質情報を同時に格納する標準フォーマット。
FASTA: 配列データのみを格納する、古くから使われているフォーマット。
BCL: Illuminaの初期出力ファイル形式のひとつ。Base Callの略。
アダプター: ライブラリ作製時につける短いDNA配列。データ解析時には取り除くトリミング対象です。
インデックス / バーコード: 複数サンプルを一本のランで測定する際に識別するための短い識別子。
マルチプレックス: 複数サンプルを同時に解析する方式。リードとインデックスで区別します。
ライブラリ調製: DNAをシーケンス可能な小さな断片へ加工する前処理全般を指します。
DNA断片化: ゲノムDNAをシーケンス可能な断片長へ切断する工程。
PCR増幅: ライブラリを十分な量にするため断片を増幅する工程。偏りの原因となることがあります。
デノボアセンブリ: 参照ゲノムを用いずにゲノムを組み立てる解析手法。
リファレンス導きアセンブリ: 既知の参照ゲノムを基に断片を配置して組み立てる手法。
アライメント: リードを参照ゲノムや転写産物配列へ正確に並べ替える作業。
マッピング: アライメントとほぼ同義。リードの位置を決定する作業です。
BWA: 最も一般的に使われるリードアライメントツールのひとつ（Burrows-Wheeler Aligner）。
Bowtie: 高速なリードアライメントツールの一つ。
STAR: RNA-Seq向けの高速アライメントツール。大規模データに適しています。
HISAT2: RNA-Seqに適した高速アライメントツール。
GATK: 変異検出や品質評価を行う解析ワークフローの中核ツール群。
SAMtools: BAM/VCFなどのファイル処理や抽出を行う基本ツール群。
VCF: 変異情報を格納する標準フォーマット（SNP/Indelなどを格納）。
SNP: 一塩基多型。個体間の塩基の差異の代表例。
Indel: 挿入・欠失と呼ばれる小さな変異。
RNA-Seq: 転写産物の発現プロファイルを調べるためのシーケンス手法。
トランスクリプトーム: 細胞内の全RNAの集合体を指す言葉。
メタゲノム: 環境サンプル中の微生物ゲノム全体を同時に解析する手法。
16S rRNAシーケンス: 細菌の系統解析に使われる重要遺伝子のシーケンス。
アノテーション: 得られた配列データに遺伝子機能などの情報を付与する作業。
ゲノムブラウザ: IGVなど、ゲノムデータを視覚的に閲覧するツール。
ワークフロー / パイプライン: 解析手順を自動化して再現性を高める仕組み。
クラウドコンピューティング: データ処理をクラウド上で実行する選択肢。
データ形式: FASTQ、BAM、SAM、VCF など、解析で使われる標準形式の総称。
BQSR: Base Quality Score Recalibration の略。品質スコアを再計算して精度を上げる処理。
MultiQC: 複数のQCレポートを1つにまとめて比較しやすくするツール。
リファレンスゲノム: 解析の基準となる既知のゲノム配列。