

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
シングルセルrna-seqとは何か
シングルセルrna-seqは 1つの細胞ごとのRNAの量と種類を測定する技術です。従来のRNA-seqでは組織全体の平均的な遺伝子発現を得ますが シングルセルrna-seq は個々の細胞がどの遺伝子をどのくらい発現しているかを知ることができます。この情報を使えば組織の中にある細胞のタイプや状態を見つけ出すことが可能です。
この技術が進むと、どの細胞が病気のときにどんな変化をするのか、発生の過程で細胞がどう分かれていくのかを詳しく追うことができます。研究者はこの情報を使って新しい治療法のヒントを探したり、薬の効果を細胞レベルで確かめたりします。
仕組みと流れ
まず研究者は分析したい組織から細胞を取り出します。次に 各細胞をできるだけ独立して扱えるように分離し、それぞれの細胞のRNAを別々に扱えるようにマークをつけます。このときバーコードと呼ばれる識別コードを細胞ごとに割り当てて混ぜても後で区別できるようにします。
続いてRNAをDNAに変換しコピー数を増やして読み取りやすくします。ここで UMIと呼ばれる短い識別子を付ける技術も使われ、同じRNA分子の重複を数えることで正確さを高めます。
増幅したDNAを機器で読み取り、得られたデータを解析して各細胞ごとの遺伝子発現を作ります。
| 説明 | |
|---|---|
| 1. 細胞の分離 | 組織を分解して単一の細胞に分ける工程 |
| 2. バーコード付与 | 細胞ごとに識別コードを割り当てる |
| 3. RNAの変換と増幅 | RNAをDNAへ変換しコピー数を増やす |
| 4. シーケンス | DNAを読み取り、遺伝子情報を取得 |
| 5. データ解析 | 発現量を細胞ごとに比較しクラスタリングなどを行う |
なぜ重要か
個々の細胞の違いを知ることで、同じ組織内でも異なる細胞タイプが混ざっていることや、病気の際にどの細胞が影響を受けるのかを特定できます。これにより新しい発見や治療法の開発につながる可能性があります。
身近な応用例
がん研究では腫瘍内の異なる細胞を詳しく見ることで治療のヒントを探します。免疫学では免疫細胞の活動を個々に追跡して反応の仕組みを理解します。発生生物学では胎児の発育過程でどの細胞がどの順序で現れるかを解明します。
初心者が押さえるポイント
データの解析は難しく、専門のソフトウェアを使います。またデータ量が大きくなるため、計算リソースやデータ管理が重要です。結果を正しく解釈するには、細胞の前処理や品質管理、バッチ効果といった問題点を理解しておく必要があります。
シングルセルrna-seqの世界は奥が深いですが、基本を押さえれば研究の扉を開く第一歩になります。興味があれば、公開データや解説動画などを見て、実際のデータを眺めてみると理解が深まります。
シングルセルrna-seqの同意語
- シングルセルRNA-seq
- 単一細胞レベルでRNAを測定し、各細胞の遺伝子発現プロファイルを作成する高スループットなシーケンス技術。細胞ごとの発現差や細胞種の同定に用いられます。
- scRNA-seq
- single-cell RNA sequencing の略。1細胞ごとのRNA発現を測定して、細胞の多様性や発現パターンを解析する技術。
- 単一細胞RNAシーケンス
- 1つの細胞のRNAをシーケンスして発現プロファイルを得る、日本語表記の同義語です。
- 単一細胞RNA測定
- 単一の細胞レベルでRNAの発現量を測定する手法。発現差を検出してクラスタリングや細胞種同定に用います。
- 単一細胞転写プロファイリング
- 1細胞の転写産物の発現プロファイルを作成・解析すること。個々の細胞の特徴をとらえるのが目的です。
- シングルセル転写解析
- シングルセルRNAデータを用いた発現パターンの解析全般。クラスタリング、差次検出、経路解析などを含みます。
- 単一細胞トランスクリプトミクス
- 単一細胞スケールでの転写物の研究・解析全般を指す用語。scRNA-seqを含むデータ解析に用いられます。
- single-cell transcriptomics
- 英語表記。1細胞スケールの転写産物を研究・解析する分野・技術。日本語では『単一細胞トランスクリプトミクス』と呼ばれます。
- 1細胞RNAシーケンス
- 1つの細胞のRNAをシーケンスして発現プロファイルを得る表現。シングルセルRNA-seqと同義です。
- 1細胞RNA-seq
- 1細胞レベルのRNA発現を測定する手法の別表記。シングルセルRNA-seqと同義です。
シングルセルrna-seqの対義語・反対語
- バルクRNA-Seq
- 複数細胞をまとめて1つのサンプルとして測定する手法。個々の細胞の発現差は捉えられず、組織全体の平均的な発現量を得るのが特徴です。
- 組織RNA-Seq
- 組織全体を1つのサンプルとしてRNAを測定する方法。細胞ごとの違いは反映されず、組織全体の発現プロファイルになります。
- 群集RNA-Seq
- バルクRNA-Seqと同義で使われる表現。多数の細胞をまとめて測定するため、単一細胞の解像度はありません。
- 全体平均型RNA-Seq
- 全細胞の発現を平均化して表現する見方・名称。細胞ごとの個別情報は失われます。
- 組織レベルRNA-Seq
- 組織全体の発現を測定するRNA-Seq。組織構成に依存しており、細胞ごとの違いは捉えられません。
- 低解像度RNA-Seq
- 解像度が低い(単一細胞レベルの解析ができない)RNA-Seqの総称。多様な細胞を1つの信号として扱います。
シングルセルrna-seqの共起語
- シングルセルRNA-seq (scRNA-seq)
- 個々の細胞ごとに転写物の量を測定する技術。集団としての平均ではなく、単一細胞の発現を解析します。
- UMI
- Unique Molecular Identifier の略。同じRNA分子を複数回カウントして過計数になるのを防ぐ、短い識別子のバーコードです。
- cell barcode
- 各細胞を識別するための短いDNAバーコード。細胞ごとの由来を区別するのに使われます。
- 10x Genomics
- 高スループットなscRNA-seqプラットフォームの一つ。マイクロ流体とビーズを使って大量の細胞を測定します。
- Drop-seq
- 細胞とビーズを用いた低コスト・高スループットのシングルセルRNA-seq法。多くの細胞を同時に分析可能です。
- Smart-seq2
- 全長cDNAを得やすいscRNA-seq法。感度は高いがスループットは比較的低いです。
- DGE
- Digital Gene Expression の略。遺伝子発現をカウントデータとして扱う分析枠組みです。
- gene expression matrix
- 遺伝子×細胞の発現量を並べた表。解析の基礎データになります。
- count matrix
- 遺伝子ごと・細胞ごとのカウントデータをまとめた表。UMIを反映することが多いです。
- normalization
- 技術的差やサンプル間のばらつきを調整して、比較可能にする処理です。
- log-normalization
- 発現量を対数変換して、値の分布を安定させる標準的な正規化手法です。
- scaling
- データを平均0・分散1へ揃える処理。特徴量の比較をしやすくします。
- dimension reduction
- 多くの遺伝子データを低次元へ圧縮して視覚化・解析を容易にする技術です。
- PCA
- 主成分分析。線形な次元削減でデータの主要変動を捉えます。
- t-SNE
- t-分布法による非線形次元削減で、データの局所構造を可視化します。
- UMAP
- Uniform Manifold Approximationの略。t-SNEより高速かつグローバル構造を保ちやすい次元削減法です。
- clustering
- 発現パターンが似ている細胞をグループ化して、細胞タイプを推定します。
- cell type
- 細胞の種類。例:免疫細胞、神経細胞など、特徴的な遺伝子で識別されます。
- cell state
- 細胞の現在の活性状態や分化段階、応答状態などを指します。
- batch effect
- 実験ロット間の差による系統的な影響。統合や補正の対象になります。
- integration
- 複数データセットを同じ空間に揃えて比較・統合する処理です。
- Seurat
- R言語の代表的なscRNA-seq解析パッケージ。クラスタリングや統合機能が豊富です。
- Scanpy
- PythonのscRNA-seq解析ライブラリ。大規模データの解析に適しています。
- doublet detection
- 二つ以上の細胞が混ざって1つの細胞データとして見えてしまうダブレットを検出します。
- quality control (QC)
- データ品質を評価・改善する前処理。低品質細胞を除外します。
- marker genes
- 特定の細胞タイプを特徴づける代表的な遺伝子の集合。細胞同定の指標になります。
- RNA velocity
- RNAの発現動態から細胞の未来の状態を推定する解析手法です。
- spliced/unspliced
- 成熟mRNA(spliced)と未成熟mRNA(unspliced)を区別して解析します。
- pseudotime
- 分化・発生の連続的順序を推定する仮想時間軸の指標です。
- read depth
- 1細胞あたりの総リード数。深さが発現検出に影響します。
- dropout
- 技術的欠測。実際には発現しているのにデータ上は0として現れる現象です。
- spike-in controls
- 外部RNAのコントロールを混ぜて正規化・品質評価に使う基準物です。
- library preparation
- cDNA作成・増幅・シーケンス用ライブラリの作成工程全般を指します。
- cell hashing
- 同じ実験で複数サンプルを識別するための細胞表面バーコード付与法です。
- multiplexing
- 複数サンプルを同時に測定・解析する技術。コスト削減に役立ちます。
シングルセルrna-seqの関連用語
- シングルセルRNA-seq
- 個々の細胞ごとの転写物発現を測定するRNAシーケンス技術。細胞間の差異やヘテロ遺伝子発現を解析でき、細胞種の同定や状態推定に有用。
- scRNA-seq
- 上記の技術の英語略称。シングルセルRNA-seqと同義で使われることが多い。
- 3'端カウント法
- 転写物の3'末端をターゲットにして細胞ごとにカウントする方式。高スループットが可能で、コストを抑えやすい。
- 全長リードのscRNA-seq
- 転写物を全長で測定する手法。感度は高いがスループットやコストのバランスがやや難しい場合がある。
- Smart-seq2
- 全長リードを用い、単一細胞の高感度な発現プロファイルを得る手法。プレートベースで実施されることが多い。
- CEL-seq
- 3'端カウントの初期手法の一つ。
- CEL-seq2
- CEL-seqの改良版で感度と再現性を改善した手法。
- MARS-seq
- 複数サンプルを同時に処理する3'端カウント法。
- Drop-seq
- マイクロ流体とバーコード化 beads を用いてドロップ内で細胞を捕捉する高スループット法。
- inDrops
- Droplet基盤のscRNA-seq法でデバイス内の液滴にバーコードを付与して転写物をキャプチャする手法。
- 10x Genomics Chromium
- 商用の高スループットDroplet-based scRNA-seqプラットフォーム。セルバーコードとUMIを用いる。
- sci-RNA-seq
- ランダム化学装置を使った大規模なシングルセルRNAシーケンス技術の総称。
- STARsolo
- STARアライナーのscRNA-seq向け機能。アライメントとカウントを一括処理する。
- Cell Ranger
- 10xデータ処理の公式ソフトウェア。アライメント、デミュテキシング、カウントなどを自動化。
- kallisto-bustools
- 擬似アライメントとバスツールを組み合わせた高速なscRNA-seqデータ処理パイプライン。
- UMI
- Unique Molecular Identifier の略。PCR重複を排除して実効的なカウントを推定するための短いバーコード。
- cell barcode
- 各細胞を識別するための固有バーコード。細胞ごとの発現を識別する要素。
- ダウンロード現象 / ドロップアウト
- 実際には発現があるはずの遺伝子が0として現れる現象。技術的ノイズと低発現の区別が課題。
- Ambient RNA / アンビエントRNA
- 試料外環境からのRNAが細胞やドロップ中に混入する現象。補正対象になる。
- SoupX
- アンビエントRNAを推定・補正するためのツール。
- 技術的ノイズ
- 測定プロセス由来のばらつき。検出限界や測定のばらつきが原因。
- 生物学的変動
- 本来の生物学的な細胞間差異。個体差や状態差などが含まれる。
- ダブルト / ダブルトット検出
- 1つのドロップまたはサンプルに2つ以上の細胞が混ざる現象。解析上の誤差要因。
- DoubletFinder
- ダブルトットを推定・除去するためのツール。
- Scrublet
- ダブルトットを検出するためのアルゴリズム。
- Hashtag oligos (HTO) / セルハッシュ
- HTOを用いて複数サンプルを同時に測定し、後でデモルティプレックスする手法。
- Multiplexing
- 1回の実験で複数サンプルを同時に測定・解析する技術。
- Plate-based scRNA-seq
- プレート上で1細胞ずつ処理する低スループットの手法。精度が高い一方でスループットは低い。
- Droplet-based vs Plate-based
- 細胞を捕捉・処理する方法の大別。前者は高スループット、後者は高感度・高精度となりやすい。
- Pseudotime
- 細胞の発生・分化の時系列的順序を推定する概念。軌跡推定の核となる指標。
- Monocle
- 細胞の発生・分化軌跡を推定する主要ツールのひとつ。
- Slingshot
- 幾何学的な手法で細胞系譜を推定するパイプライン。
- PAGA
- グラフベースの発生・分化軌跡推定アルゴリズム。
- RNA velocity
- 未成熟RNAと完成RNAの比率から転写動態を推定する手法。細胞の未来状態を予測する補助情報となる。
- Spliced / Unspliced counts
- RNA velocity 推定に用いられる、スプライス済みと未スプライスの転写物カウント。
- scVelo / velocyto
- RNA velocityを推定する代表的なツールセット。
- Normalization / 正規化
- ライブラリサイズや技術的変動を補正する前処理。適切な正規化は比較可能性を高める。
- SCTransform
- Seuratで用いられる正規化手法。遺伝子間変動を安定化させる。
- SCRAN
- Rパッケージの正規化法。サイズファクター推定を用いて比較を容易にする。
- Batch effects / バッチ効果
- 実験条件の違いによる系統的差を指す。混在データの要因となる。
- データ統合
- 異なるデータセット間の整合性を取る処理。
- Seurat v3 integration
- Seuratでのデータ統合機能。異なるサンプルの整合解析を可能にする。
- Harmony
- バッチ効果を意識せずにデータを統合するアルゴリズム。
- LIGER
- 統合解析のフレームワークのひとつ。異なるデータソースの統合に強い。
- Scanorama
- 大規模データセットの統合を支援するツール。
- 次元削減: PCA / t-SNE / UMAP
- データの高次元から低次元へ要約して可視化・解析を容易にする手法。
- クラスタリング(Leiden / Louvain)
- 細胞を類似性に基づいてグループ化する手法。細胞タイプの同定に用いられる。
- Marker genes
- 特定の細胞タイプを特徴づける指標遺伝子。
- Differential Expression (DE) 分析
- グループ間で発現差が統計的に有意かを評価する分析。
- MAST / Wilcoxon test など
- DEを検出する代表的な統計手法。
- RNA velocity の前提とデータ
- スプライス済み・未スプライスのカウントを用いて速度推定を行う前提。
- RNA velocity 推定ツール(scVelo / velocyto)
- 動的転写状態を可視化・推定する主要ソフトウェア。
- Gene annotation (GENCODE / Ensembl)
- 参照ゲノムの遺伝子アノテーション。正確な遺伝子IDと境界情報を提供。
- Counts matrix / Gene expression matrix
- 細胞×遺伝子の発現カウントまたは正規化後の発現量の行列。
- Quality Control (QC) 指標
- データ品質を評価するための指標群(nGene、nUMI、percent.mt など)。
- Metrics: nGene / nUMI / percent.mt
- 検出遺伝子数、UMI数、ミトコンドリア遺伝子割合などの代表的QC指標。
- FASTQ / BAM / Count matrix
- シーケンスデータの基本的なファイル形式。解析フローの出発点と中間形式。
シングルセルrna-seqのおすすめ参考サイト
- シングルセルRNAシーケンスの自信を築く初心者ガイド
- シングルセルRNAシーケンスの自信を築く初心者ガイド
- シングルセル装置とは?解析の原理や主な製品の仕様を紹介
- 【わかりやすく解説】シングルセル解析とは? | YOKOGAWA
- やってみよう! single cell RNA-seq 解析ことはじめ



















