

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
獲得関数とは?初心者向けのやさしい解説
このページでは「獲得関数」について、難しい用語を避けてわかりやすく解説します。獲得関数は主に機械学習の分野で使われる用語で、特に「ベイズ最適化」という手法で活躍します。未知の関数を最小限の試行で評価するために、次に観察すべき点を決める“指標”として働きます。
まずは基本のアイデアから見てみましょう。私たちが何かを最適化したいとき、答えは“真ん中の最良の答え”を探す旅のようなものです。獲得関数は、まだ試していない地点を評価する価値を数値で表します。これに従って次の探索地点を選ぶと、試行回数を減らして良い解にたどり着きやすくなります。
獲得関数の役割
獲得関数の役割は、以下の2つを両立させることです。「探索」と「活用」です。探索は未知の領域を調べることで、活用はすでに見つかった良い解をさらに良くすることです。獲得関数はこの両方をバランス良く組み合わせ、次にどの点を評価するべきかを数値的に教えてくれます。
よく使われる獲得関数の種類
| 説明 | |
|---|---|
| 期待改善(EI: Expected Improvement) | 現在の最良値よりも改善される期待値を評価します。新しい点の“改善の可能性”に着目します。 |
| 確率的改善(PI: Probability of Improvement) | 現在の最良値を上回る確率を重視します。改善確率が高い点を優先します。 |
| 上限信頼区間(UCB: Upper Confidence Bound) | 予測の平均と不確実性の両方を組み合わせ、探索の幅を調整します。勇み足になりにくい安全寄りの選択にも使われます。 |
どうして獲得関数が役立つのか
現実の問題では、評価するのに時間や費用がかかることがあります。例えば、実験やシミュレーションを1回行うだけで数時間かかることも。獲得関数を使うと、最小限の実験回数で良い解を見つけやすくなり、コスト削減につながります。
小さな例でイメージをつかむ
想像してみてください。山の高さをできるだけ少ない測定で知りたいとします。まだ登っていない地点の高さを予測するためのモデルと、次に訪れるべき場所を決める指標を同時に作るイメージです。獲得関数は「この地点なら高い可能性がある」「この地点はまだよくわからないから調べよう」という判断を助けてくれます。
実装の流れ(ざっくり)
1) あらかじめデータを集め、そのデータから予測モデルを作成します。これはベイズモデルが多いです。
2) 獲得関数を使って、次に調べるべき点を決めます。
3) その点で実験・評価を行い、結果をデータに追加します。
4) 2〜3を繰り返すことで、徐々に最適解へ近づいていきます。
もしもっと詳しく知りたい場合
本記事は初心者向けの入り口です。難しい数式は最小限にし、まずは考え方をつかむことを目標にしましょう。興味が持てたら、EI・PI・UCBなどの具体的な数式や、Pythonのライブラリでの実装例へ進んでいくと良いです。
獲得関数の数式が苦手な人へ
数式は難しく感じるかもしれません。ここではイメージだけ伝えます。EIは「予測平均+不確実性の重みづけ」、UCBは「予測平均+不確実性の強さを決めるパラメータ」で表現されることが多いです。実際にはガウス過程などの確率モデルと組み合わせて計算します。
獲得関数の同意語
- 獲得関数
- Bayesian optimization(ベイズ最適化)で、次に評価すべきサンプル点を決めるための関数。予測値と不確実性を組み合わせて、次に良い点を選ぶ指標です。
- 獲得規準
- 獲得関数と同義の言い換え。次の評価点を選ぶための基準となる指標。
- 獲得基準
- 同義。新しいデータを得るべき点を決めるための基準。
- 探索関数
- 未知領域を探ることを優先する獲得指標。まだ情報が少ない領域を積極的に探索するよう設計されています。
- 探索基準
- 探索を重視する基準。未知の領域を探索する優先度を示す指標。
- 情報獲得関数
- 情報量の最大化を狙う獲得関数。予測の不確実性を活用して次の点を選ぶタイプです。
- 情報獲得基準
- 情報獲得を重視する基準。次のデータから多くの新情報を得ることを目的とします。
- 知識獲得関数
- 知識の獲得を促すことを目的とした関数。新しい知識を効率よく得る点を選ぶ指標です。
- 知識獲得基準
- 知識獲得を目的とする基準。新しい知識を得られる可能性が高い点を選ぶ指標。
- 不確実性活用関数
- 予測の不確実性を活用して次の評価点を決める指標。情報の不確かさを利用して探索を進めます。
- 不確実性活用基準
- 不確実性を活用して探索を促進する基準。未知の情報を効率よく得ることを目指します。
- サンプル選択指標
- 次にどのデータを取得するかを決定する指標。評価点の選択を自動化する役割を持ちます。
- サンプル選択基準
- データ取得の優先順位を決める基準。実験点の順序や候補を選ぶ際のガイドになります。
獲得関数の対義語・反対語
- 損失関数
- モデルの予測と実測の差を測る関数。機械学習ではこの関数を小さくするように学習しますが、獲得関数は新しいデータ点をどこで取得するかを決める指針です。対となる概念として捉えると、獲得関数が“新しい情報を得るための行動指針”なら、損失関数は“現状の誤差を減らすことを目的とした評価指標”です。
- 誤差関数
- 予測値と真値の差を数値化する指標。最適化の目的は誤差を最小化すること。獲得関数の目的(新しいデータ点の取得方針)とは別の、モデルの精度を高めるための指標です。
- 放棄関数
- 新しいデータの取得を積極的に行わない、つまり獲得を放棄する方向性を示す概念。直感的には獲得関数の反対方向として理解できますが、実務的な標準用語ではありません。
- 停止条件
- 探索を終了する判断基準。獲得関数は次の取得点を決める指針ですが、停止条件は探索そのものを止めるタイミングを示します。
- 活用重視関数
- 既知の良いデータを深く活用して最適解を早く得ようとする指標。獲得関数は探索と利用のバランスを取る設計が多いですが、こちらは利用(exploitation)を重視する考え方を表します。
獲得関数の共起語
- ベイズ最適化
- 黒箱関数を評価回数を抑えつつ最適化する手法。代理モデルと獲得関数を組み合わせ、次に評価する点を選びます。
- ガウス過程
- 未知関数を連続的な確率過程として近似するモデル。予測値と予測の不確実性を出します。
- 代理モデル
- 実関数を近似するモデル(例:ガウス過程)。実データを入力として関数を推定します。
- 事前分布
- データを観測する前に仮定する確率分布。GPでは関数値の分布を表します。
- 事後分布
- データを観測した後に更新される分布。GPでは更新された関数値の分布。
- カーネル
- ガウス過程の共分散を決める関数。滑らかさや局所性を表現します。
- 共分散関数
- GPで使われるカーネルの別名。
- 期待改善
- 次の評価点で得られる改善の期待値を最大化する獲得関数の一種。
- EI
- Expected Improvement の略。新しい点での改善の期待値を計算する獲得関数。
- PI
- Probability of Improvement の略。改善が起こる確率を評価する獲得関数。
- Upper Confidence Bound
- 予測平均と不確実性を組み合わせて最大化する獲得関数の英語表記。
- UCB
- Upper Confidence Bound の略称。
- 上限信頼区間
- UCB の日本語訳。
- 探索と搾取のトレードオフ
- 新しい点を探索するのと、現在の最良点を活用するのかのバランス。
- 獲得関数の最適化
- 獲得関数を最大化する点を求める最適化作業。
- 黒箱関数
- 内部構造が不明で評価コストが高い関数。
- 目的関数
- 最適化の対象となる関数。評価したい値を返す黒箱関数。
- 評価回数
- 関数を評価する回数。評価回数を抑えるのがベイズ最適化の目的の一つ。
- 観測ノイズ
- データに混じるノイズ成分。
- ノイズモデル
- 観測ノイズを統計的に扱うモデル(例:ガウスノイズ)。
- モンテカルロ法
- 乱数を用いて期待値や積分を近似する手法。
- モンテカルロ積分
- 獲得関数の期待値などを近似する積分をモンテカルロで行う方法。
- 次点候補
- 次に評価するべき候補点。
- 最適点
- 現時点で推定される最良の点。
- サンプル点
- 関数を評価する候補点。
- ハイパーパラメータ
- カーネルやノイズなど、GPの設定を決めるパラメータ。
- カーネルハイパーパラメータ
- 長さ尺度・信号分散など、カーネルの具体的設定。
- 事後予測分布
- 新しい点の予測値の分布(平均と不確実性)。
- 獲得関数の種類
- EI・PI・UCBなど、獲得関数のカテゴリー。
- 代理モデルの更新
- 新しいデータを得たときに代理モデルを再学習・更新すること。
- 確率分布
- GPにおける関数値の分布を表現する確率分布。
- 期待値
- 予測分布の平均。獲得関数で用いられることが多い。
獲得関数の関連用語
- 獲得関数
- Bayesian optimization(ベイズ最適化)で未評価点を選ぶときに使う指標。代理モデルの予測分布に基づき、次に評価すべき点を決定します。
- 獲得関数の最適化
- 獲得関数自体を最大化する操作。最も情報が得られる、または改善が見込める次の評価点を求めます。
- ベイズ最適化
- 確率的な代理モデルと獲得関数を用いて、評価回数を抑えつつ最適解を目指す最適化手法。
- 代理モデル
- 実世界の評価関数を近似するモデル。新しい点の値を予測し、不確実性も併せて扱います。
- ガウス過程
- 連続的な関数を確率分布で表現する代理モデルの一つ。平均と共分散を使い未知関数を推定します。
- 期待改善
- 次の評価点での改善の期待値を最大化する獲得関数の一種。EI として知られます。
- 改善確率
- 次の評価点で現状より改善できる確率を最大化する獲得関数。PI(Probability of Improvement)とも呼ばれます。
- 上限信頼区間
- 予測の上限を信頼区間として取り扱い、探索を促す獲得関数。UCB(Upper Confidence Bound)として用いられます。
- 知識勾配
- 評価から得られる情報量を最大化する獲得関数。決定すべき次点の情報価値を評価します。
- 多目的獲得関数
- 複数の目的関数を同時に最適化する場合の獲得関数。Pareto前線の探索が中心です。
- 探索-活用トレードオフ
- 新しい情報を得る探索と、現在の最良解を活用する利用とのバランスのこと。獲得関数はこのトレードオフを実現します。
- ノイズを考慮した獲得関数
- 評価がノイズを含む場合でも安定して機能するよう設計された獲得関数のこと。
- カーネル関数
- ガウス過程の共分散を決める関数。平滑性や特徴を表現します。
- 事後分布
- 観測データを得た後の関数の確率分布。獲得関数はこの事後分布を用いて計算されます。
- ハイパーパラメータ最適化
- モデルのカーネルパラメータなどを最適化して、獲得関数の性能を向上させる作業。



















