

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
gnomadとは何かを知ろう
このページでは gnomad の意味と役割を、初心者にも分かりやすく解説します。gnomad とは Genome Aggregation Database の略で、世界中の人々のゲノムデータを集めて作られた大規模なデータベースです。正式には研究者や臨床の現場で変異の頻度を調べるための参考資料として使われます。
なぜ gnomad が重要なのか
私たちの体をつくる全遺伝情報には、さまざまな「変異」が存在します。gnomad はそんな変異の頻度を大量のデータから推定し、特定の変異がどれくらい普段から見られるのかを教えてくれます。これにより研究者や医師は、ある変異が病気と関連している可能性があるかどうかを判断する手がかりを得られます。
データの構成と特徴
gnomad は主に 全ゲノムデータと 全エクソムデータ の2つのデータセットを含んでいます。エクソムは遺伝子のうちタンパク質を作る「コード領域」に対応する部分で、全ゲノムはそれ以外の領域も含みます。データは世界中のさまざまな集団から集められており、研究や実務での比較に役立ちます。とはいえ、データには人口構成の偏りがある点にも注意が必要です。ヨーロッパ系の集団が多い場合もあるため、特定の集団に偏ることがあります。
どう使うのか
使い方はとてもシンプルです。まずウェブサイトの検索機能で関心のある遺伝子や変異の位置を入力します。すると、その変異の頻度(どれくらいの人に見られるか)が表示されます。頻度が高い場合は「野性型の変異」と見なされ、病気との関連性が低いと判断されることがあります。反対に稀な変異であれば、病気の候補として検討されることがあります。研究者はこの情報を使って、候補変異を絞り込んだり、データを比較したりします。
データの留意点と限界
- 人種・集団の多様性
- データセットには特定の人口が多く含まれる場合があり、全世界の多様性を完全には反映していません。
- 更新とバージョン
- データは定期的に更新され、新しいバージョンで頻度が変わることもあります。
- 臨床適用の注意点
- gnomad の頻度情報は研究補助のための参考資料であり、臨床診断の代わりにはなりません。個別の診断判断には他の検査や専門家の判断が必要です。
実務での活用例
・難病の候補遺伝子を絞り込む際の事前チェック
・新規変異が既知の病気関連変異とどの程度近いかの比較
・研究デザインの前提検討としての頻度情報の参照
gnomad の代表的な使い方を表で見る
| 説明 | |
|---|---|
| 正式名称 | Genome Aggregation Database |
| 主なデータ種 | 全ゲノムデータと全エクソムデータ |
| 主な用途 | 変異頻度の推定、研究計画の指針、変異の優先度付け |
| 利用時の注意点 | 人口偏りや更新頻度を意識すること、臨床診断の代替ではないこと |
まとめ
gnomad は、大規模な遺伝子変異データを集約して、研究者や医師が変異の頻度を判断する際の有力な指標を提供します。しかし、データはあくまで参照情報であり、すべての集団を完全に表しているわけではありません。使う際には最新情報や背景を理解し、他の資料と組み合わせることが重要です。
この解説を通じて、gnomad がどんなデータベースなのか、どんな場面で役立つのか、基本的な使い方と注意点が理解できたと思います。遺伝研究や医療の学習を始める第一歩として、公式サイトの情報と専門家の解説を合わせて確認してみてください。
gnomadの同意語
- gnomAD
- Genome Aggregation Database の略称。ヒトの遺伝子変異データを広く集約した公開データベースの代表例です。
- Genome Aggregation Database
- gnomAD の正式名称。ExAC の拡張版で、全エクソームと全ゲノムデータを人口別に集約し、変異頻度を提供します。
- ヒト遺伝子変異データベース
- ヒトの遺伝子変異情報を集約・提供するデータベース全般を指す表現。gnomAD はこのカテゴリの重要な例です。
- 人間ゲノム変異データベース
- 人間のゲノムにおける変異データを保存・参照するデータベース。gnomAD の同義的表現として使われます。
- 人間遺伝子多型データベース
- ヒトの遺伝子多型情報を集約したデータベースの総称。gnomAD が扱うデータを示す別表現です。
- 全ゲノム・全エクソーム変異データベース
- gnomAD が提供する全ゲノムと全エクソームの変異データを扱うデータベースを指す表現です。
- 人口別アレル頻度データベース
- 集団ごとのアレル頻度を比較できるデータベースという意味。gnomAD の特徴の一つを説明する言い換えです。
- 遺伝子変異頻度データベース
- 遺伝子変異の頻度情報を集約したデータベースの総称。gnomAD を含む代表的な例として使われます。
gnomadの対義語・反対語
- 生データ
- 集約・分析前の原データ。個々のサンプルの遺伝情報をそのまま記録した状態で、すべてを結合・統計処理していないデータのこと。gnomAD の対義語としては、データが未加工・未集約である状態を指します。
- 単一ゲノムデータ
- 一人の個体のゲノム情報だけを含むデータ。gnomAD は多数の個体の集計データですが、対義語は単一のゲノムデータです。
- 非公開データ
- 公開されていない、アクセス制限のあるデータ。gnomAD の公開データとは対照的に、閲覧・利用に制限があるデータです。
- 分散データ
- データが複数の場所やソースに分散しており、一本化・統合されていない状態。gnomAD のような統合データベースの対義語として使えます。
- 小規模データセット
- サンプル数が少なく規模が小さいデータセット。gnomAD の大規模データと対比する表現です。
- 個別ゲノムファイル
- 個人ごとに分かれたゲノム情報のファイル。多数の個体を統計的に集約したデータベースの対義語として使えます。
- クローズドデータ
- アクセス制限があり公開されていないデータ。オープンに公開されているデータベース gnomAD の反対語として適切です。
gnomadの共起語
- gnomAD
- Genome Aggregation Databaseの略。ヒトのゲノム変異の頻度情報を大規模に集約したデータベースで、エクソームとゲノム全体のデータを統合しています。
- gnomADブラウザ
- gnomADのデータをウェブ上で検索・閲覧できるインターフェース。遺伝子名や座位、アレル頻度などを確認できます。
- gnomAD v2
- gnomADの第2世代データセット。主にエクソームデータと人口集団頻度が含まれます。
- gnomAD v3
- gnomADの第3世代データセット。ゲノム全体データと新しい集団情報が追加されています。
- エクソームデータ
- タンパク質コード領域の変異情報を集めたデータセット。エクソーム領域の変異頻度を扱います。
- ゲノムデータ
- 全ゲノム領域の変異情報を網羅したデータセット。ゲノムデータの頻度情報も含まれます。
- 参照ゲノム
- データの座標系となる参照ゲノム。gnomADの多くはGRCh38等に基づいたデータを提供しています。
- GRCh38
- 現在主流の参照ゲノムバージョン。gnomADのデータはこれを基準に扱われることが多いです。
- AC
- アレルカウント。特定の変異が観察されたアレルの総数を示します。
- AN
- 総アレル数。頻度計算の分母として使われます。
- AF
- アレル頻度。観測された変異が全アレルの中で占める割合です。
- 母集団別頻度
- 各人口集団ごとのアレル頻度。人種・集団差を理解するのに役立ちます。
- pLoF
- Predicted Loss-of-Functionの略。機能喪失が予測される変異のカテゴリです。
- LOF
- Loss of Function、機能喪失変異の総称。タンパク質機能を大きく損なう可能性のある変異です。
- LOEUF
- Loss-Of-Function Observed/Expected Upper bound Fraction。観察頻度と期待頻度の上限を比べ、遺伝子の機能的耐性を評価します。
- pLI
- Probability of Loss-of-Function Intolerance。遺伝子がLOFに耐性を示す程度を示す指標です。
- アノテーション
- 変異の機能的影響や関連情報を補足する説明。VEP等のツールで付与されます。
- VCF
- Variant Call Format。変異データを保存する標準的なファイル形式です。
- データセット
- gnomADが統合するデータの集合で、複数のソースからの変異情報を含みます。
- 変異
- 遺伝子座で生じる塩基の差異のこと。gnomADはこのような変異の頻度情報を提供します。
gnomadの関連用語
- Genome Aggregation Database (gnomAD)
- 世界最大級の人間ゲノム変異データベース。複数研究のエクソームとゲノムデータを統合・調整し、変異の頻度や機能情報を公開している。希少変異の調査に使われる代表的なデータ源です。
- ExAC (Exome Aggregation Consortium)
- gnomADの前身となるエクソームデータの大規模集計プロジェクト。現在はgnomADに統合・更新されています。
- 1000 Genomes Project
- 世界各地の人々のゲノムデータを集めた大規模プロジェクト。gnomADと併せて参照データとして利用されることが多いです。
- Exome data
- エクソーム領域(タンパク質をコードする部分)の変異データ。遺伝子機能に直接影響する可能性の高い領域を対象にします。
- Genome data
- 全ゲノム領域の変異データ。非コード領域も含む全体の変異情報を提供します。
- Allele Frequency (AF)
- ある変異の等位遺伝子頻度。データセット内でのaltアレルの割合を表します。
- Allele Count (AC)
- 観察されたaltアレルの総数。変異の観測数を示します。
- Allele Number (AN)
- 総アレル数。検出可能なアレルの総数で、サンプル数×2などに基づく値です。
- Global allele frequency
- データセット全体における変異の頻度。特定の集団を超えた総合値を示します。
- Population allele frequencies (NFE, FIN, AFR, AMR, EAS, SAS)
- 各人口グループ(例:NFE=非フィンランド系欧州、FIN=フィンランド系、AFR=アフリカ系、AMR=アメリカ系混成、EAS=東アジア系、SAS=南アジア系)ごとの等位頻度。
- pLI (probability of Loss-of-Function Intolerance)
- 機能喪失変異(LoF)に対する耐性の確率。値が1に近いほどLoFに対して高い制約を示します。
- LOEUF (Loss-Of-Function Observed/Expected Upper bound Fraction)
- 観測されたLoFの割合と期待される割合の上限の比。低いほどLoFに対する制約が強いことを示します。
- Missense constraint Z-score
- ミスセンス変異の制約の強さを示す指標。高い値ほど制約が強い遺伝子を示します。
- Constrained Coding Regions (CCR)
- コード領域のうち制約が強い部分を示す指標。重要な機能領域を特定するのに利用されます。
- Predicted Loss-of-Function (pLoF)
- 機械的・生物学的予測によりLoFになると予測された変異。
- High-confidence Loss-of-Function (LoF)
- gnomADで信頼性が高いと判断されたLoF変異。分析時の信頼性指標として用いられます。
- gnomAD v2
- gnomADの第2版。エクソームとゲノムデータを統合した大規模データセットとして提供されました。
- gnomAD v3
- gnomADの第3版。主にゲノムデータにフォーカスした更新版で、座標系や集合データが刷新されています。
- gnomAD-SV
- 構造変異(大きな挿入・欠失・逆位など)を対象とした別データセット。ゲノムレベルのSV情報を提供します。
- Variant Consequence / Annotation
- 変異の機能的影響を表す注釈。例:missense_variant、stop_gained、frameshift_variant、splice_site_variant など。Ensembl VEPなどで付与されます。
- VCF (Variant Call Format)
- 変異データを表す標準的なファイルフォーマット。gnomADもVCF形式でデータ提供が行われます。
- Reference genome versions GRCh37 / GRCh38
- 変異座標の基準となる参照ゲノム。gnomADはGRCh37とGRCh38の座標系を提供します。
- Population labels (AFR, AMR, EAS, FIN, NFE, SAS)
- データ中の集団コード。AFR=アフリカ系、AMR=アメリカ系混成、EAS=東アジア系、FIN=フィンランド系、NFE=非フィンランド系欧州、SAS=南アジア系。
- gnomAD Browser / web interface
- ウェブ上のデータ閲覧ツール。変異の頻度・注釈・座標などをブラウズできます。
- gnomAD API / data access
- プログラムからデータを取得できるAPIとダウンロード手段。研究用途での自動化に便利です。
- Homozygous variants / Heterozygous variants in gnomAD
- サンプル中のホモ接合体変異とヘテロ接合体変異の観測頻度。gnomADは個々のカウントを提供します。
- Quality control (QC) in gnomAD
- データ全体の品質管理プロセス。欠測値の扱い、サンプルの除外、バッチ効果の是正などを含みます。
- Use cases: rare disease gene discovery
- 稀少疾病の原因遺伝子を探索する際に、変異頻度と機能予測を組み合わせて候補を絞り込む用途。
- Clinical interpretation context with ClinVar / dbSNP
- 臨床解釈の文脈で、gnomADの頻度情報をClinVarやdbSNPなどのデータと組み合わせて評価します。
- Ensembl VEP (Variant Effect Predictor)
- 変異の機能影響を予測・注釈付けするツール。gnomADの注釈の基盤になることが多いです。



















