

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
e値は、主に生物情報学の検索結果で使われる指標です。見つかった一致が偶然に起こる確率の期待値を表します。つまり、データベースの大きさや照合の難易度が高いほど、e値は小さくなるほど“有意性が高い”と判断します。初心者の方には少し難しく感じるかもしれませんが、基本的な考え方を押さえれば、どんな結果が“信頼できる可能性が高い”のかを判断する助けになります。この記事では、中学生にも分かるように、e値の意味と使い方を丁寧に解説します。
e値とは何か?
e値は正式には「期待値(expect value)」の略称です。BLASTのような検索ツールで得られる各一致について、その一致が偶然に起こる回数の期待値を数値で表します。e値が小さいほど、偶然に起こる可能性が低く、結果として信頼性が高いとされます。
どう解釈するのか
e値は「p値」と似た考え方を持っていますが、もう少し大きな視点を取り入れています。e値はデータベースの大きさや比較の回数を組み込み、データベース全体の中でどれだけ珍しいのかを示します。小さなe値ほど有意性が高いが、0には近づきすぎないこともある点に注意してください。
p値との違いと関係
p値は「この結果が偶然に起こる確率」を単純に示します。一方のe値は、データベースのサイズや照合条件の数を考慮した“期待される偶然の回数”を表します。実務上は、e値とp値を同時に見ることは少なくなく、e値を使って有意性の目安を得つつ、スコアや一致長、生物学的意味も合わせて判断します。
実例で見る解釈のコツ
例1: 大規模なデータベースを検索して得られた一致のe値が0.1なら、この結果は偶然に起こる可能性が比較的高いと判断されることが多いです。追加データや別の指標を確認するのが良いアプローチです。
例2: 同じ検索でe値が1e-5程度なら、非常に有意と考えられる可能性が高いですが、研究設計や生物学的意味の検証が欠かせません。研究の目的に応じて、閾値を調整して解釈します。
実務での活用のコツ
・閾値は分野ごとに異なるため、所属する研究分野で推奨される値を確認することが大切です。
・e値だけで結論を出さず、スコア、マッチの長さ、アライメントの品質、データベースの質・量といった他の指標も同時に見る習慣をつけましょう。
表で見る要点
| 要素 | 意味 | 解釈の目安 |
|---|---|---|
| e値 0.1 | 偶然に一致する確率が高い | 再検討が必要 |
| e値 0.01 | 偶然性は低いがまだ注意 | 補足データ推奨 |
| e値 1e-5 | 非常に有意とみなされやすい | 生物学的意味を追加確認 |
まとめ
e値は検索結果の信頼性を示す大事な指標ですが、単独で判断せず、スコア・一致長・データベースサイズなど他の指標とともに解釈します。初心者はまず、小さすぎるe値は“有意”のサインとして捉え、どの分野の閾値が使われているかを確認するのがコツです。さらに、実際の研究では、生物学的意味の検証と再現性を意識して判断すると良いでしょう。
e値の同意語
- 期待値
- e値の正式な日本語訳。『観測されたヒット以上の一致が偶然起こると予想される回数』を表す指標で、BLAST などのバイオインフォマティクスで使われます。値が小さいほど有意性が高いと解釈されます。
- E値(英語表記)
- 英語の E-value の表記。意味は『expectation value(期待値)』。日本語の説明と同義として使われます。
- 期待される件数
- e値の意味を日常語に置き換えた表現。『偶然起こり得るヒットの件数の期待値』という意味で使われます。
- 発生確率の期待値
- e値を「発生確率の期待値」としてとらえる言い方。観測結果が偶然に起こる回数の平均的な値を指します。
- 偶然起こり得る回数
- e値を直訳した表現。『観測されたヒットが、偶然起こる回数の期待値』という意味です。
e値の対義語・反対語
- 高いE値
- E値が大きい状態。データベース内でのマッチが偶然に起こる可能性が高く、結果の信頼性が低い。
- 低いE値
- E値が小さい状態。マッチが偶然で生じる可能性が低く、結果の信頼性が高い(有意と判断されやすい)。
- 非有意
- 統計的有意性が認められない結果。E値が高い状況と同様、結論の信頼性が低いことが多い。
- 有意
- 統計的有意性が認められる結果。E値が低い状況に対応する解釈。
- P値が大きい
- P値が大きく、帰無仮説を棄却できず、結果の有意性が低い状態。E値が高い場面と似た解釈。
- P値が小さい
- P値が小さく、帰無仮説を棄却しやすい状態。E値が低い状況と同様に有意と判断されやすい。
- 偶然性が高い
- 結果が偶然の一致である可能性が高いと判断される状態。E値の高い状況に近い意味。
- 信頼性が低い
- 結果の再現性・信頼性が低い状態。高E値と関連づけて理解されることが多い。
- 信頼性が高い
- 結果の再現性・信頼性が高い状態。低E値と関連づけて理解されることが多い。
e値の共起語
- ビットスコア
- アラインメントの有意性を示す対数的な得点。高いほど意味のある一致の可能性が高いと判断され、E値の計算にも使われます。
- スコア
- 配列の一致度を表す数値で、E値やビットスコアの基礎となる指標です。
- p値
- 統計的有意性を示す指標。偽陽性が起きる確率の目安となり、E値と解釈の補助として用いられます。
- 期待値
- E値の別名として使われることがある指標。見つかる可能性のある偽陽性の期待数を表します。
- λ(ラムダ)
- Karlin–Altschulの式で使われるパラメータ。スコアとE値の関係を決める重要な定数です。
- K値
- Karlin–Altschulの式の別の定数。E値の推定に使われます。
- Karlin-Altschulの式
- 配列間セグメントの一致のE値を理論的に推定する式。BLASTの多くの基盤となる考え方です。
- BLAST
- 代表的なデータベース検索ツール。e値やスコアを出力し、ヒットを評価します。
- FASTA
- BLASTと同様に配列検索を行う代表的なアルゴリズム。E値・スコアを用いて評価します。
- データベース
- 検索対象となる配列集合。規模が大きいほどE値の解釈が難しくなることがあります。
- データベースサイズ
- データベースの総長・配列数など、E値の計算に影響する要因です。
- 相同性/相同性
- 配列間の類似度の程度。高い相同性は有意なヒットの可能性を高めます。
- ギャップペナルティ
- ギャップを挿入する際のコスト。スコアとE値に影響します。
- ペアワイズアラインメント
- 二つの配列を直接比較してアラインメントを作る手法。
- ヒット/ヒット数
- 検索結果として得られる一致の件数。E値閾値で絞られることが多いです。
- ヒットリスト
- 有意なヒットの一覧。スコア・E値で並べ替えられます。
- 参照配列/参照データ
- 比較対象となる既知の配列。ヒットの根拠となります。
- 偽陽性/偽陽性率
- 偶然の一致を意味があると誤って解釈するリスク。E値を解釈する際の注意点です。
- 統計的分布
- スコアやE値が従う分布の概念。分布を理解することで閾値の適切さが判断できます。
e値の関連用語
- e値
- 期待値のこと。BLASTなどの検索結果で、データベース内で偶然に同等以上のヒットが起こる回数の推定値です。小さいほどそのヒットが有意で信頼性が高いと考えられます。
- p値
- 統計検定における“帰無仮説が正しいとき、観測値以上の極端さが起こる確率”。e値と似ていますが、文脈が異なることが多いです。
- ビットスコア
- アラインメントの質を表す標準化されたスコア。高いほど良い。e値と関係があり、ビットスコアが上がるとE値は下がり有意性が増します。
- rawスコア
- 生のスコア。スコアリングマトリクスに従って計算され、後述のビットスコアやE値の計算に使われます。
- λ(ラムダ)
- Karlin–Altschul理論に基づくスコア分布のパラメータ。E値の算出に使われる重要な値です。
- K
- もう一つのパラメータで、E値の計算式に現れます。スコア分布の規模感を調整します。
- アラインメント
- 2つ以上の配列を、相応しい位置で並べて比較可能な形に整列した結果です。
- HSP(High-Scoring Pair)
- 局所的に得点が高い配列のペア。BLASTなどで検出される局所アラインメントの核心部分です。
- BLAST
- Basic Local Alignment Search Toolの略。局所アラインメントを素早く検出し、e値で有意性を示します。
- FASTA
- 類似検索ツールの一つ。BLASTと同様にe値で有意性を評価します。
- データベースサイズ
- 検索対象となる配列データベースの総量。大きいほどE値が大きくなる傾向があります。
- ヒット
- 検索の結果として見つかった一致(アラインメント)です。
- スコアリングマトリクス
- 一致・不一致の得点を決める表。例: BLOSUM62、PAM250。
- ギャップペナルティ
- 挿入や欠失を罰するコスト。スコアとE値に影響します。
- 閾値(カットオフ)
- e値やビットスコアの有意性判定に用いる基準値。例: e値が1e-5以下を有意とみなす等。
- 有意性
- 得られたアラインメントが偶然に起こる可能性が低いことを示す概念。
- 偽陽性率(FPR)
- 偽陽性の割合。閾値設定によって変動します。
- 偽発見率(FDR)
- 多数の検定を行う際の偽陽性の増加を抑える指標。



















