log2foldchangeとは?初心者が知っておくべき基礎と図解ガイド共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
log2foldchangeとは?初心者が知っておくべき基礎と図解ガイド共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


log2foldchangeとは?

log2foldchangeは、主に遺伝子の発現量の差を比べるときに使う指標です。実験では細胞を対照と処理後に分け、特定の遺伝子の発現量を測定します。発現量の差は大きくなることが多く、見やすくするために対数を使います。対数をとることで、数値の範囲を抑えつつ、上昇と下降を等しい感覚で比較できるようになります。

次に、log2foldchangeの基本的な意味を整理します。 fold change(FC)は処理後の発現量 / 処理前の発現量という比です。これを2を底とした対数にすると、log2FCになります。つまり、log2foldchange = log2(expression_treated / expression_control)です。ここで、値が正なら発現量が増えた、負なら減った、0なら差がないという直感的な解釈ができます。

計算の仕組みと解釈

具体的には、ある遺伝子の対照での発現量が10、処理後が40なら、FCは 40/10 = 4 です。log2(4) = 2、この遺伝子のlog2foldchangeは2となります。別の例では、対照が8、処理後が2なら、FCは 2/8 = 0.25、log2(0.25) = -2 となり、発現量が2段階減ったことを意味します。

このように、log2foldchangeはとても大きな範囲のデータを扱いやすくするのと同時に、正と負で上昇/下降をすぐに区別できる利点があります。テキストデータや数値データを並べるとき、1桁の差が続くと混乱しやすいですが、対数スケールにすると違いがはっきり見えやすくなります。

実例と表

以下は仮のデータを使った小さな例です。対照と処理後の発現量、そしてFCとlog2FCを並べて見せます。

遺伝子対照処理後FClog2FC
GeneA104042
GeneB820.25-2
GeneC5510
GeneD10020021

表の値だけでは不安が残りますが、実際の研究ではp値や偽探索率(FDR)などの統計指標と組み合わせて、どの遺伝子が有意に発現変化を起こしているかを判断します。log2FC自体は変化の大きさを示す指標であり、統計的有意性は別の検討が必要です。

実務では、生物学の研究者が多くの遺伝子を一度に調べるため、スプレッドシートや統計ソフトでlog2FCを一斉に算出します。結果は表やグラフにして、どの遺伝子がどの程度変化したかを一目で把握します。

注意点と使い方

注意したいのは、データの前処理です。配列データにはノイズが入りやすいので、正規化やフィルタリングを行い、比較可能な状態にしてからFCとlog2FCを計算します。また、発現量が0の場合は対数をとれないので、0を適切な小さな値に置換するなどの前処理が必要です。

実務では、生物学の研究者が多くの遺伝子を一度に調べるため、スプレッドシートや統計ソフトでlog2FCを一斉に算出します。結果は表やグラフにして、どの遺伝子がどの程度変化したかを一目で把握します。

まとめ

このページの要点は次のとおりです。log2foldchangeは発現量の差を対数スケールで表す指標であり、正の値は増加、負の値は減少、0は差がないことを意味します。計算式は log2foldchange = log2(expression_treated / expression_control) で、実務では表やグラフと組み合わせて判断します。初心者のうちは、具体例で考え方をつかみ、データの前処理と統計的有意性の理解を並行して進めると良いです。


log2foldchangeの同意語

log2FoldChange
対数2倍変化を表す指標。発現量のfold changeを底を2とした対数に変換した値。正の値は条件Aに対して発現が増えたこと、負の値は減ったことを示します。計算式はlog2(FC)で、FC = 条件Aの発現量 / 条件Bの発現量。
log2FC
log2FoldChangeの略称。論文やツールの出力で広く使われる表記。
log2 fold change
スペースを挟んだ表記。読みやすくするための同義表現。
log2-fold-change
ハイフンでつなぐ表記。論文やデータ出力でよく見かける表現。
log2foldchange
連結形の表記。別表記として使われることがある同義語。
対数2倍変化
発現量の比を底2の対数で表した変化。FCが2倍ならlog2FCは+1、半分なら-1。
基底2の対数フォールドチェンジ
底が2の対数をとったフォールドチェンジを指す正式な日本語表現。

log2foldchangeの対義語・反対語

正のlog2foldchange
表現量が上昇していることを示す。治療条件での発現が対照より高く、upregulation に対応します。
負のlog2foldchange
表現量が低下していることを示す。治療条件での発現が対照より低く、downregulation に対応します。
変化なし
発現量に有意な変化がなく、log2foldchange がほぼ0の状態(no change)を意味します。
リニアフォールドチェンジ
非対数表示のフォールドチェンジ。fold change をそのままのスケールで表す表現で、log2foldchange とは異なる表現形です。
アップレギュレーション
発現量が増える方向の生物学的変化で、log2foldchange の正の値と対応します(上方発現)。
ダウンレギュレーション
発現量が減る方向の生物学的変化で、log2foldchange の負の値と対応します(下方発現)。

log2foldchangeの共起語

foldChange
2つの条件間の発現量の比。1を基準とし、値が大きいほど発現が増え、値が小さいほど発現が減ります。
フォールドチェンジ
foldChangeの日本語表記。2条件間の発現比を表す指標です。
log2FC
foldChangeの対数2をとった値。正の値は上方発現、負の値は下方発現を示します。
log2FoldChange
log2FCの別表記。対数2を底としたフォールドチェンジの指標です。
log2変化量
発現変化を対数変換した指標。log2で表現される差のことを指します。
上方発現
比較対象の条件で遺伝子の発現が相対的に高くなる現象を指します。
下方発現
比較対象の条件で遺伝子の発現が相対的に低くなる現象を指します。
遺伝子発現
遺伝子がどの程度発現しているかという生物学的状態のこと。
発現量
遺伝子の発現の量そのもの。カウント数や正規化後の値を指すことが多いです。
RNA-seqデータ
RNAシーケンスによって得られる発現データ。遺伝子ごとのカウントを含みます。
カウントデータ
RNA-seqなどで得られる生データの遺伝子ごとの読数(カウント)データ。
正規化
発現量を比較可能にするためのスケーリング処理。バッチ劤やライブラリサイズの影響を抑えます。
p値
帰無仮説が正しいと仮定した場合に、観測データと同等以上の結果が得られる確率。
調整p値
多重検定を考慮して補正したp値。複数遺伝子を同時に検定する際の偽陽性を抑えます。
FDR
False Discovery Rateの略。偽陽性の割合を低く保つ指標の一つです。
多重検定補正
多数の検定を同時に行う際の誤検出を抑える補正処理全般の総称。
差次発現
条件間で発現量に有意な差がある遺伝子のこと。
条件比較
2つ以上の条件を比較して差を検出する解析の総称。
対照群と処理群
比較対象となるグループ。対照群は基準、処理群は実験処置を受けたグループ。
DESeq2
RNA-seqデータの差次発現解析を行うRパッケージ。log2FoldChangeなどを出力します。
limma
差次発現解析のRパッケージ。線形モデルに基づく検定を提供します。
edgeR
RNA-seqデータの差次発現解析を行うRパッケージ。カウントデータの過 dispersion を考慮します。
Wald検定
統計的仮説検定の一種。log2FoldChangeの推定に用いられることが多いです。
LRT検定
尤度比検定の略。モデル間の適合度の差を検出します。

log2foldchangeの関連用語

log2foldchange
RNA-seq などの発現量データで、2条件の発現差を対数(底2)で表した指標。正の値は処理条件での発現が高いこと、負の値は低いことを示します。
fold_change
2条件の発現量の比。直感的には「2倍になった」「半分になった」などの意味を持ち、対数変換前の指標です。
p_value
統計検定で得られる値。帰無仮説が正しいとした場合に、観測データ以上の差が起こる確率です。小さいほど有意とされます。
adjusted_p_value
複数の遺伝子を同時に検定する際に生じる偽陽性を抑えるための補正後のp値。よくFDR(偽発見率)と呼ばれます。
false_discovery_rate
偽発見率(FDR)の略。全体で偽陽性と判定される割合を示します。閾値設定の目安になります。
differential_expression_analysis
条件間で遺伝子の発現が統計的に異なるかを判定する分析の総称。DE解析と呼ばれます。
rna_seq
RNAを用いて遺伝子発現を測定する次世代シーケンス技術。データはカウントとして扱われます。
normalization
サンプル間の比較を公平にするため、ライブラリサイズや技術的差をそろえる前処理。代表例にはサイズファクターやTMMがあります。
size_factor
サンプルごとの規模を揃える指標。DESeq2 などでカウントを正規化する際の分母となります。
tmm_normalization
edgeR で用いられる正規化法。サンプル間の分布の偏りを抑え、比較を正確にします。
cpm
Counts Per Million の略。カウントを100万あたりの割合に換算して比較しやすくします。
rpkm
Reads Per Kilobase of transcript per Million mapped reads の略。遺伝子長と総リード数を考慮した正規化指標です。
fpkm
Fragments Per Kilobase of transcript per Million mapped reads の略。RNA-seqの正規化指標のひとつです。
tpm
Transcripts Per Million の略。遺伝子長と総リード数を考慮した別の正規化指標です。
pseudocount
0の対数が計算できない問題を避けるため、極小の定数を足す工夫。ログ変換時に使います。
dispersion
分散の程度を表す指標。RNA-seqの負の二項分布を使うモデルで重要です。
negative_binomial
RNA-seq のカウントデータは負の二項分布で近似されることが多く、平均と分散の関係を持ちます。
deseq2
DESeq2はRNA-seqの差次を検出するRパッケージ。負の二項分布とサイズファクターでモデル化します。
edger
edgeRは差次解析に使われるRパッケージ。TMM正規化と負の二項分布を活用します。
limma
線形モデルを用いて差次を検出する統計的手法。マイクロアレイ由来ですがRNA-seqにも適用可能です。
voom
RNA-seqデータをlimmaで扱えるように、平均-分散の関係を補正する変換手法です。
lfcShrink
log2foldchange の推定値を安定化させる縮小(shrinkage)手法。小サンプルでの過剰な振れを抑えます。
moderated_t_statistic
limma で用いられる、共同で推定した分散に基づく安定化したt統計量です。
bayesian_shrinkage
ベイズ的な縮小を用いて効果量の推定を安定化するアプローチです。
volcano_plot
横軸に log2foldchange、縦軸に −log10(p-value) をとる、差と有意性を同時に視覚化する図です。
ma_plot
M値(差)とA値(平均)の関係を示す図。発現量の傾向を直感的に把握できます。
replicates
生物学的リプリケート(再現)を確保することで、ばらつきを正しく推定します。
batch_effect
測定機器や時期などの非生物学的要因による系統的な変動。デザインや補正で対応します。
multiple_testing
多数の遺伝子を同時に検定すること。偽陽性を抑える補正が必要です。
benjamini_hochberg
偽発見率(FDR)を抑える代表的な多重検定補正法。
threshold_log2fc
|log2foldchange|が所定の閾値を超えた遺伝子を選ぶための目安。例: |log2foldchange| > 1
go_enrichment
差次遺伝子集合の機能をGOなどのカテゴリで解釈する解析です。
pathway_analysis
差次遺伝子を経路レベルで解釈する解析。KEGGやReactomeなどを用います。
differential_expression_pipeline
データ取得・品質管理・正規化・統計検定・解釈までの一連の流れを指す総称。
qc
Quality Controlの略。データ品質を評価し、問題を特定します。

log2foldchangeのおすすめ参考サイト


学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
2118viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
829viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
707viws
座標計算・とは?初心者向けガイドで完全マスター共起語・同意語・対義語も併せて解説!
686viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
576viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
561viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
554viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
520viws
k型熱電対とは?初心者にも分かる基礎解説と活用事例共起語・同意語・対義語も併せて解説!
513viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
479viws
大辞林とは?初心者にもわかる日本語辞典の使い方と特徴共起語・同意語・対義語も併せて解説!
474viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
451viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
447viws
気圧の単位とは?中学生にもわかるPa・atm・bar・Torrの違いと換算ガイド共起語・同意語・対義語も併せて解説!
440viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
424viws
励磁回路とは?初心者にもわかる基礎解説と仕組みの全体像共起語・同意語・対義語も併せて解説!
418viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
392viws
摘要とは?初心者にも分かる意味と書き方ガイド共起語・同意語・対義語も併せて解説!
387viws
100g・とは?初心者が今すぐ知っておきたい基本と使い方共起語・同意語・対義語も併せて解説!
375viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
374viws

新着記事

学問の関連記事