

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
次世代シーケンスとは何か
次世代シーケンスとは、DNAやRNAの 配列情報を一度に大量に読み取ることができる最新の技術です。英語名は Next-Generation Sequencing で、略して NGS と呼ばれます。従来の方法に比べて、同じ時間で読取れるデータ量が飛躍的に増え、研究のスピードが大きく上がりました。初心者の人にも、ここでは難しい専門用語をできるだけ使わず、身の回りの例でイメージできるように解説します。
どうやって使われるのか
まず、DNAを 小さな断片 に分け、端に識別用のコードをつけて「ライブラリ」と呼ばれる準備をします。次に、これらの断片を一度に機械に読み取らせます。読み取られた短い文字列をコンピュータがつなぐことで、元の長いDNA配列を復元します。この一連の作業を経て、個人の遺伝子の変化や病気の原因となる場所を特定できるようになります。
NGSの特徴とメリット
NGSのこうした特徴の多くは、次の3つの点に集約されます。まず 高速性、次に コストの低下、そして データ量の多さです。これらの組み合わせにより、以前は難しかった大規模な研究が現実的になりました。また、環境サンプルから微量のDNAを検出することも可能で、医療だけでなく農業・生物学研究でも活用が進んでいます。
従来の方法との比較
以下の表は、従来の方法とNGSを比べたときの代表的な違いをまとめたものです。読み取り速度、コスト、データ量、適用範囲などの観点から理解を深める手助けになります。
| 従来法 | NGS | |
|---|---|---|
| 読み取り速度 | 遅い | 高速 |
| コスト | 高い | 低コスト化 |
| データ量 | 少量 | 大量 |
| 適用範囲 | 限定的 | 広範囲 |
まとめとして、次世代シーケンスは現代の生物学と医療の基盤となる技術です。研究者はこの技術を使って、病気の原因遺伝子の特定、進化の歴史の解明、遺伝子治療の新しい可能性の探索などを行っています。中学生でも理解できるように、まずは“DNAの読み取りをどう効率化するか”という発想を持つことが大切です。
次世代シーケンスの同意語
- 次世代シーケンス
- 現代のDNAシーケンス技術の総称。従来のサンガー法に対して、同時に多数の断片を高速に読み取り、ゲノム全体の解読を実現します。
- NGS
- Next-Generation Sequencing の略。大量のDNA断片を並列に読み取る高スループット技術の総称。
- 新世代シーケンス技術
- 次世代シーケンスと同義の表現。新しい世代のDNA配列決定技術を指します。
- 次世代DNAシーケンス
- DNAの配列決定を目的とした次世代技術。ゲノム解析の中心的手法として広く使われています。
- 次世代ゲノムシーケンス
- ゲノム全体の配列解読を指す表現。ゲノム規模の解析に適した技術群を含みます。
- 高スループットシーケンス
- 高いデータ処理能力を活かして多量の配列データを短時間で取得する技術。研究・臨床の両方で広く用いられます。
- ハイスループットシーケンシング
- 高スループットのシーケンス技術を指す表現。大量データを効率よく読み取る特徴を強調します。
- 大量並列シーケンス
- Massively parallel sequencing の和訳。多くのDNA断片を同時に読み取る方式です。
- Massively parallel sequencing
- 英語圏で用いられる呼称。大量のDNA断片を一度に並列に読み取る技術の総称。
- 大規模並列シーケンス
- 大量データを並列に取得する性質を表す別表現。NGS の特徴を指します。
次世代シーケンスの対義語・反対語
- 第一世代シーケンス
- Sanger法を代表とする従来のシーケンス技術。一本ずつ順に読み取るため低スループット・長時間・高コストになりやすい点がNGSの対義語として語られます。
- 従来のシーケンス技術
- NGS以前の一般的な手法の総称。データ量が少なく、手作業や手動化が多い傾向があります。
- サンガー法
- 第一世代の代表的なシーケンス法。高い精度は得られる一方で大量データには不向きで、NGSと対照的な位置づけになります。
- 低スループットシーケンス
- 同時に読み取れるDNA断片の数が少ない手法。データ量が限られ、検査全体の時間や費用がかさみやすい点が特徴です。
- 逐次シーケンス
- 断片を逐次的に読み取る方法で、NGSの並列読み取りに対して読み取りの並列性が低い点が対義的です。
- 手動・半自動化のシーケンス
- 多くの工程が人手または半自動で行われる手法。NGSの高度な自動化・機械化と対照的に扱われます。
- 古典的シーケンス技術
- 伝統的な手法全般を指す語。長時間・高コスト・低スループットの特徴があり、NGSと比較されることが多い。
次世代シーケンスの共起語
- NGS
- 次世代シーケンスの略称で、同時に多数のDNA断片を並列に読み取る技術群を指します。
- Illumina
- 現在最も普及している次世代シーケンスプラットフォームの代表格。主にショートリードを高スループットで提供します。
- PacBio
- PacBio(Pacific Biosciences)が提供する長鎖リード対応プラットフォーム。長いリード長で複雑領域の解読に強いのが特徴です。
- Oxford Nanopore
- ナノポア技術を使う長鎖リードのシーケンス。ポータブル機器もあり、現場での測定にも適しています。
- Roche 454
- 旧来の次世代シーケンス機。現在は市場から撤退していますが、NGSの発展史でよく挙げられます。
- SOLiD
- ABIのSOLiD シーケンス。複数の色素で読み取る方式の古いプラットフォーム。現在は希少です。
- ショートリード
- 短い長さのリード(例: 50–300 bp、Illumina系が多い)。高スループットでコスト効率が良いです。
- ロングリード
- 長いリード(数千〜数万 bp)。PacBioやNanoporeで得られ、複雑領域の解決に有利。
- リード長
- 1つの読み取りの長さの指標。長いほどゲノムの組み立てや構造変異の検出に有利です。
- カバレッジ
- ゲノム全体が何回読み取られたかの平均。一般に高いほど変異検出の信頼性が上がります。
- 品質スコア
- 各塩基の信頼度を表す指標。高いほど誤読の可能性が低くなります。通常はQスコアで表現します。
- FASTQ
- リードの配列データと品質情報を同時に格納する標準フォーマット。
- FASTA
- 配列データのみを格納する、古くから使われているフォーマット。
- BCL
- Illuminaの初期出力ファイル形式のひとつ。Base Callの略。
- アダプター
- ライブラリ作製時につける短いDNA配列。データ解析時には取り除くトリミング対象です。
- インデックス / バーコード
- 複数サンプルを一本のランで測定する際に識別するための短い識別子。
- マルチプレックス
- 複数サンプルを同時に解析する方式。リードとインデックスで区別します。
- ライブラリ調製
- DNAをシーケンス可能な小さな断片へ加工する前処理全般を指します。
- DNA断片化
- ゲノムDNAをシーケンス可能な断片長へ切断する工程。
- PCR増幅
- ライブラリを十分な量にするため断片を増幅する工程。偏りの原因となることがあります。
- デノボアセンブリ
- 参照ゲノムを用いずにゲノムを組み立てる解析手法。
- リファレンス導きアセンブリ
- 既知の参照ゲノムを基に断片を配置して組み立てる手法。
- アライメント
- リードを参照ゲノムや転写産物配列へ正確に並べ替える作業。
- マッピング
- アライメントとほぼ同義。リードの位置を決定する作業です。
- BWA
- 最も一般的に使われるリードアライメントツールのひとつ(Burrows-Wheeler Aligner)。
- Bowtie
- 高速なリードアライメントツールの一つ。
- STAR
- RNA-Seq向けの高速アライメントツール。大規模データに適しています。
- HISAT2
- RNA-Seqに適した高速アライメントツール。
- GATK
- 変異検出や品質評価を行う解析ワークフローの中核ツール群。
- SAMtools
- BAM/VCFなどのファイル処理や抽出を行う基本ツール群。
- VCF
- 変異情報を格納する標準フォーマット(SNP/Indelなどを格納)。
- SNP
- 一塩基多型。個体間の塩基の差異の代表例。
- Indel
- 挿入・欠失と呼ばれる小さな変異。
- RNA-Seq
- 転写産物の発現プロファイルを調べるためのシーケンス手法。
- トランスクリプトーム
- 細胞内の全RNAの集合体を指す言葉。
- メタゲノム
- 環境サンプル中の微生物ゲノム全体を同時に解析する手法。
- 16S rRNAシーケンス
- 細菌の系統解析に使われる重要遺伝子のシーケンス。
- アノテーション
- 得られた配列データに遺伝子機能などの情報を付与する作業。
- ゲノムブラウザ
- IGVなど、ゲノムデータを視覚的に閲覧するツール。
- ワークフロー / パイプライン
- 解析手順を自動化して再現性を高める仕組み。
- クラウドコンピューティング
- データ処理をクラウド上で実行する選択肢。
- データ形式
- FASTQ、BAM、SAM、VCF など、解析で使われる標準形式の総称。
- BQSR
- Base Quality Score Recalibration の略。品質スコアを再計算して精度を上げる処理。
- MultiQC
- 複数のQCレポートを1つにまとめて比較しやすくするツール。
- リファレンスゲノム
- 解析の基準となる既知のゲノム配列。
次世代シーケンスの関連用語
- 次世代シーケンス
- DNAやRNAを同時に大量に読み取る技術の総称。従来のSanger法より高スループットで短いリードを多数取得します。
- ライブラリ調製
- 分析対象をシーケンサーで読める形に整える前処理。断片化、アダプター付加、サイズ選択、PCR増幅などを含みます。
- 断片化
- 長いDNA/RNAを読み取り可能な短い断片へ細かく砕く作業。リード長に合わせてサイズを調整します。
- アダプター付加
- 断片の両端にシーケンサーが認識できる短いDNA配列(アダプター)を付ける工程。読取やサンプル識別に使われます。
- デュアルインデックス
- 各サンプルに固有のバーコードを両端に付け、複数サンプルの混入を防ぎつつ同時測定を可能にする方法。
- インデックス/バーコード
- サンプル識別用の短いDNA配列。複数サンプルを一度にシーケンスする際に用います。
- リード長
- 1回の読み取りで得られるDNA断片の長さ。例: 2×150 bp や 2×75 bp など、ペアエンドの場合が多いです。
- ペアエンドシーケンシング
- リードの両端を別々に読み取る方式。位置推定の精度や組み立ての精度が向上します。
- シングルエンドシーケンシング
- 片端だけを読み取る方式。コストは抑えられますが、情報量は少なくなります。
- トリミング
- アダプターや低品質領域をリードから除去する前処理。データ品質を向上させます。
- 品質管理(QC)
- データ品質を評価・監視する工程。問題を早期に把握して解析精度を保ちます。
- FastQC
- リード品質の概要を可視化する代表的なQCツール。品質分布やアダプター汚染などをチェックします。
- Cutadapt
- アダプターや低品質の末端を除去するツール。前処理の基本ツールです。
- Trimmomatic
- リードのトリミングと品質フィルタリングを行うツールの一つ。
- FASTQ
- リード配列と品質情報を格納する標準ファイル形式。多くの解析パイプラインの入口データです。
- 参照ゲノム
- 解析の基準となる、既知の完全なゲノム配列。リードのマッピング先として用います。
- マッピング/アライメント
- リードを参照ゲノム上の位置へ配置する作業。正確な位置情報を得る基本工程です。
- BWA-MEM
- DNAリードのマッピングに広く使われる代表的なアライナー。
- Bowtie2
- 短いリードのマッピングを高速・高精度に行うツール。
- STAR
- 主にRNA-seqのマッピングに用いられる高速アライナー。スプライシングを考慮します。
- HISAT2
- RNA-seq のマッピングに適した高速アライナー。
- minimap2
- 長短両方のリードに対応する汎用アライナー。
- アセンブリ
- リードをつなぎ合わせてゲノムやトランスクリプトームの長い連続配列を再構成する作業。
- de novoアセンブリ
- 参照ゲノムを使わずに、リードだけから新規配列を組み立てる方法。
- SPAdes
- デノボアセンブリに特化した代表的なソフトウェア。
- Velvet
- 古典的なデノボアセンブリのツールの一つ。
- 参照ガイドアセンブリ
- 参照ゲノムを用いてリードを組み立てる方法。参照に基づくアセンブリ。
- トランスクリプトーム解析
- RNA-seqデータを用いて、発現している遺伝子の分布・量・スプライシングなどを解析する作業。
- RNA-seq
- 転写物の発現を測るNGS手法。遺伝子の発現量を定量化します。
- 16S rRNAシーケンス
- 細菌の同定・分類に用いられる、16S rRNA遺伝子を対象としたターゲットシーケンス。
- メタゲノム
- 環境サンプル中の全微生物の遺伝情報を同時に解析する手法。
- Kraken2
- 環境サンプル中の生物種を高速に分類するツール。
- MetaPhlAn
- 環境サンプルの微生物群衆構成を推定するツール。
- scRNA-seq
- 単一細胞レベルでのRNA発現を測定する手法。細胞ごとの発現差を解析します。
- scATAC-seq
- 単一細胞レベルでクロマチンの開放状態を測る手法。
- ChIP-seq
- 特定のタンパク質が結合しているゲノム領域を特定する手法。
- ATAC-seq
- 開放的なクロマチン領域を検出する全ゲノム対応の手法。
- Hi-C
- ゲノム全体の三次元構造を捉える手法。染色体間の相互作用を読み取ります。
- ビスルファイトシーケンス
- DNAのメチル化パターンを検出するために、ビスルファイト処理を用いるシーケンス。
- エクソームシーケンス
- 遺伝子コード領域(エクソン)を富化して読み取るターゲットシーケンス。
- キャプチャ(ハイブリダイゼーションキャプチャ)
- ターゲット領域を捕捉して富化する技術。エクソームなどで使用。
- バリアントコール
- リードからDNAの変異(SNP/Indel)を検出する解析工程。
- SNP / Indel
- 一塩基置換(SNP)や小さな挿入・欠失(Indel)を指す用語。
- VCF
- 検出した変異を格納する標準ファイル形式。Variant Call Format。
- BAM / SAM
- アライメント済みリードの格納形式。BAMは圧縮版。
- TPM / FPKM / CPM
- RNA-seqデータの発現量を定量化する指標。TPMが比較的直感的。
- DESeq2 / edgeR
- RNA-seqの発現差を統計的に検出する代表的なソフトウェア。
- ワークフロー / パイプライン
- データ解析の手順を自動化した作業の流れ。
- Nextflow / Snakemake
- NGS解析のワークフローを作成・実行するツール。
- BQSR
- Base Quality Score Recalibration。品質スコアを再調整して精度を上げる手法。
- UMI
- Unique Molecular Identifier。同一分子のリードを識別して定量の biasを抑えるタグ。
- FASTQ.gz
- 圧縮されたFASTQファイル。
次世代シーケンスのおすすめ参考サイト
- NGSによる次世代シーケンスとは?基本的な解析原理や特徴について
- 次世代シーケンシング(NGS)とは | コスモ・バイオ株式会社
- 次世代シーケンシング(NGS)とは | コスモ・バイオ株式会社
- 次世代シーケンサー(NGS)とは - OlvTools
- 次世代シーケンサーとは ライフサイエンスの用語解説 リケラボ
- 初心者のためのNGS | NGSの基礎を学ぶ - イルミナ株式会社
- 次世代シーケンサーとは ライフサイエンスの用語解説 リケラボ
- 次世代シーケンスによるがんゲノム解析とは - 国立がん研究センター
- 次世代シーケンサー(NGS)とは - OlvTools



















