

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
ボルケーノプロットとは
ボルケーノプロットは大規模データを可視化するためのグラフの一種で、主に遺伝子発現の解析などに使われます。X軸には変化の大きさを表す指標、Y軸には統計的有意性を表す指標をとり、点の色で「有意かどうか」を示すことが多いです。典型的には X軸が log2FoldChange、Y軸が -log10(pvalue) の形で表現されます。右上の領域ほど 変化が大きくて有意性が高いデータ点を示し、重要な候補を一目で探すのに役立ちます。
この図は研究の初期段階で大量のデータを整理するのにとても便利です。研究者は閾値を設定して、どの遺伝子が注目すべきかを絞り込みます。代表的な閾値は例として |log2FoldChange| > 1 と p値 < 0.05 などですが、データの性質によって変えます。有意性の閾値と変化の大きさの閾値を同時に見ることがボルケーノプロットの魅力です。
読み方のポイント
ボルケーノプロットを読むときは、まず 左右どちらに大きな変化があるかを見ます。右寄りなら遺伝子の発現が上方へ、左寄りなら下方へ変化していることを意味します。次に 縦軸の高さを見て、データ点がどれだけ有意かを判断します。最も有意で大きな変化を示す点は、研究の新発見や仮説の検証対象になりやすいです。
作成の手順の例を挙げます。まずデータは gene, log2FoldChange, pvalue の列を用意します。次に Y軸の値として -log10(pvalue) を計算します。データ点を有意性で色分けし、閾値ラインを追加します。最後に図を解釈するメモを付けて、読者がすぐ理解できるよう補足をつけます。
作成の手順の概要(R/Pythonの考え方)
R ではデータフレームを用意し、ggplot2 で geom_point を使って描画します。Python では pandas でデータを整え、 matplotlib や seaborn で描画します。どちらも X軸、Y軸、色分け、閾値ラインの設定が基本です。
例となる観察点の表
| 項目 | 意味 | 例 |
|---|---|---|
| X軸 | 変化の大きさを示す指標 | log2FoldChange |
| Y軸 | 有意性を示す指標の対数 | -log10(pvalue) |
| 色 | 有意性の判定 | 有意なら赤、そうでなければ青 |
これらの要素を揃えると、ボルケーノプロットは一目で重要な候補が分かる優れた可視化になります。
結論
ボルケーノプロットは 大規模データの変化と有意性を同時に確認できる、研究やデータ分析の強力な味方です。初めは基本的な使い方から始め、徐々にデータに合わせて閾値を調整していくとよいでしょう。
ボルケーノプロットの同意語
- ボルケーノプロット
- 遺伝子発現データなどの差異を可視化する散布図。横軸には通常対数変換した発現差(log2 fold change)、縦軸には統計的有意性を示す −log10(p値) をとり、右上・左上に大きな差がある候補を直感的に識別します。
- 火山プロット
- ボルケーノプロットの直訳表現。意味は同じで、直感的に理解しやすい日本語表現です。
- 火山状プロット
- ボルケーノプロットの形状を比喩的に表現した呼び方。大きな差と有意性の高いデータ点が山のように見えることから名付けられることがあります。
- ボルカノプロット
- 同義の別表記。英語の発音を日本語に近い形で表記したバリエーションです。
- ボルケーノ図
- ボルケーノプロットを別名で呼ぶ表現。意味は同じです。
- ボルカノ図
- 同義の別表現。地域や著者の好みによって使われる表記の一つです。
- ボルケーノチャート
- ボルケーノプロットと同じデータ可視化を指す表現。チャートは図表を意味します。
- ボルカノチャート
- 同義の別表現。ボルケーノプロットと同じ意味で使われることがあります。
- 英語表記: volcano plot
- 国際的にはこの英語表記が標準。論文や国際的な資料でそのまま使われることが多い表現です。
- volcano plot
- 英語の同義表現。日本語文献にもそのまま引用されることがあります。
ボルケーノプロットの対義語・反対語
- 有意差なしの散布図
- ボルケーノプロットは有意差と変化量を同時に強調します。対義語としては、有意差がほとんどなく、遺伝子ごとの変化も目立たない散布図を指します。点は原点付近に集まり、山の形(ボルケーノの形)が見られません。
- 効果量が小さい散布図
- 変化量(横軸)に大きな値が現れず、全体の fold change が小さい場合を指します。ボルケーノプロットのように大きく左右に広がる点が少なく、ほとんどが中心寄りに集まります。
- 平坦な散布図
- 点の分布に特定の形状がなく、山なりや谷のような特徴がなく平坦に見える散布図。ボルケーノの典型的な形が出ない状態です。
- 高p値側に偏った散布図
- y 軸が高い値を取りがちで、統計的有意性が低い点が目立つ散布図。ボルケーノの有意な点が少なく、全体が“非有意”寄りに見える例です。
- 非ボルケーノ型の散布図
- ボルケーノ型(山の形)ではなく、点の分布が不規則・均整が取れていない、または特定の形状を示さない散布図を指します。
- ノイズのみの散布図
- 信号としての意味のあるパターンがなく、データ点がばらつくだけのノイズだけの散布図。ボルケーノのような有意性の強調が見られません。
- 変化の方向性を示さない散布図
- x軸(変化量)の正負を超えた方向性が見えず、陽性・陰性の差が noticeable に表れない散布図。ボルケーノが左右対称に振る舞う様子と対照的です。
ボルケーノプロットの共起語
- p値
- 統計検定で得られる有意性を示す指標。小さいほど偶然の可能性が低いと判断され、ボルケーノプロットではデータ点の有意性を評価する基準になる。
- 陰性対数p値
- −log10(p値) の値。p値が小さいほどこの値は大きくなり、縦軸として用いられて有意性の強さを視覚的に表す。
- padj
- 調整済みp値。複数比較補正後のp値で、有意性の判断をより厳密にする指標。
- FDR
- 偽発見率(False Discovery Rate)。多重比較補正の代表的指標で、低いほど信頼性が高いとされる。
- 多重検定補正
- 同時に複数の検定を行う際に偽陽性を抑える手法。代表例にはBH法(FDR)などがある。
- log2FoldChange
- 発現量の変化を2を底とする対数。正の値は上方発現、負の値は下方発現を示す(ボルケーノプロットの横軸で特に用いられる)。
- logFC
- log2FoldChange の略称。発現変化の対数表現として広く使われる。
- FoldChange
- 発現量の倍率(対数変換前の変化量)。
- 閾値
- 有意性や変化量を判断する基準点。p値閾値やlog2FC閾値などを含む。
- p値閾値
- p値がこの値以下なら有意と判断する基準。
- log2FC閾値
- log2FoldChangeがこの閾値以上または以下なら有意な変化と判断する基準。
- 差次的発現遺伝子
- 条件間で発現が有意に異なる遺伝子。ボルケーノプロットの焦点となる対象。
- 遺伝子
- 分析対象となる生物学的要素。ボルケーノプロットは遺伝子の発現差を視覚化する図。
- 発現量
- 遺伝子の転写産物の量。RNA-Seqやマイクロアレイデータで測定される。
- RNA-Seq
- 全転写産物を高精度で測定する次世代シーケンシング技術。ボルケーノプロットでよく扱われるデータ種。
- マイクロアレイ
- 遺伝子発現を測定する古典的な技術。ボルケーノプロットの対象データとして用いられることもある。
- limma
- R言語の統計パッケージ。線形モデルを用いて差次的発現を検出し、ボルケーノプロット作成に使われる。
- DESeq2
- RNA-Seqデータの差次的発現を検出するRパッケージ。ボルケーノプロットの基礎計算に用いられることが多い。
- edgeR
- RNA-Seqデータの差次的発現を検出するRパッケージ。小規模サンプルにも適用されることがある。
- 火山図
- ボルケーノプロットの別名。山の形状に例えられることから命名された視覚図。
- 散布図
- データを2軸で点として描く図。ボルケーノプロットはこの散布図の一種。
- 色分け
- 有意性や発現変化の大きさに応じて点を色分けして視覚的に区別する表現。
- 有意
- 統計的に意味があると判断される状態。
- 非有意
- 統計的に意味がないと判断される状態。
- 正の変化
- 発現量が増加した方向の変化。
- 負の変化
- 発現量が減少した方向の変化。
- 上方発現
- 対照条件に比べ発現が増えた状態。
- 下方発現
- 対照条件に比べ発現が減った状態。
- データセット
- 解析対象となるデータの集合体。
- サンプル
- 観測データの個別の単位。
- 基準線
- 図中に引く閾値を示す水平線・垂直線のこと。
- 正規化
- 比較可能にするためデータを揃える前処理。
ボルケーノプロットの関連用語
- ボルケーノプロット
- 生物学データの発現変化と有意性を同時に示す散布図。横軸に発現の変化量(多くは fold change や log2FoldChange)、縦軸に統計的有意性を表す −log10(p値) をとり、顕著な変化をした遺伝子やタンパク質を一目で識別できます。
- 散布図
- データ点を二つの軸で表す基本的なグラフ。ボルケーノプロットはその一種です。
- 発現データ
- RNA-Seq やマイクロアレイなど、遺伝子やタンパク質の発現量データの総称。
- 発現差
- 条件間での発現レベルの差。ボルケーノプロットの主な対象となる指標です。
- フォールドチェンジ
- 発現量の比率。2倍なら2、半分なら0.5などで表します。
- log2FoldChange
- フォールドチェンジを対数2で変換した値。正の値は発現増、負の値は発現減を示します。
- p値
- 統計的仮説検定の結果が偶然である確率。小さいほど有意性が高いとされます。
- -log10(p値)
- p値を対数変換した値。大きいほど有意性が高いことを直感的に示します。
- 有意性
- 統計的に意味のある差があると判断される状態。p値や FDR で評価します。
- FDR
- 偽陽性を抑えるための多重検定補正後の指標。偽発見率とも呼ばれます。
- 調整済みp値 (padj)
- 複数検定を補正した後の p値。多重比較の影響を考慮します。
- 多重検定補正
- 多数の検定を同時に行う際の偽陽性を抑える補正方法。BH法やBonferroni法などがあります。
- Benjamini–Hochberg法
- 偽陽性を抑える代表的な多重検定補正法。FDRを制御します。
- Bonferroni補正
- 非常に保守的な多重検定補正法。閾値を検定数で割って調整します。
- X軸
- ボルケーノプロットの横軸。通常は発現変化量(fold change や log2FoldChange)をとります。
- Y軸
- ボルケーノプロットの縦軸。通常は −log10(p値) をとり、値が大きいほど有意性が高いことを示します。
- 対数スケール
- データを対数スケールで表示することで大きさの差を扱いやすくします。ボルケーノプロットでも一般的です。
- 正規化
- サンプル間の比較を公平にするための前処理。発現データを比較可能にします。
- アップレギュレーション
- 発現が上昇している遺伝子・タンパク質のこと。ボルケーノプロットの右側に現れます。
- ダウンレギュレーション
- 発現が低下している遺伝子・タンパク質のこと。ボルケーノプロットの左側に現れます。
- 閾値設定
- 有意性や発現変化の大きさの判定に用いる閾値を決める作業。一般に p値・FDR、fold change の閾値を設定します。
- 効果量
- 差の大きさを表す指標。ボルケーノプロットではフォールドチェンジや log2FoldChange がこれに相当します。
ボルケーノプロットのおすすめ参考サイト
- Volcano plotとは? - OlvTools
- 【初心者向け】Volcano plotとは何か?書き方・作り方について解説!
- Volcano plot とは? グラフの見方、読み方 【超ざっくり簡単に】



















