利得関数・とは？初心者でも分かる基本ガイド共起語・同意語・対義語も併せて解説！

この記事を書いた人

高岡智則

年齢：33歳性別：男性職業：Webディレクター（兼ライティング・SNS運用担当）居住地：東京都杉並区・永福町の1LDKマンション出身地：神奈川県川崎市身長：176cm 体系：細身〜普通（最近ちょっとお腹が気になる）血液型：A型誕生日：1992年11月20日最終学歴：明治大学・情報コミュニケーション学部卒通勤：京王井の頭線で渋谷まで（通勤20分）家族構成：一人暮らし、実家には両親と2歳下の妹恋愛事情：独身。彼女は2年いない（本人は「忙しいだけ」と言い張る）

利得関数・とは？

利得関数とはある状況で得られる利益や満足度を数値で表す関数のことです。経済学やゲーム理論ではこの関数を使って「どの行動が最も得になるか」を判断します。

利得関数は 2つの役割 を持つと覚えておくと分かりやすいです。まず第一に現実の行動の結果を数値で比較できるようにすること第二にその数値を最大化するような行動を探すことです。つまり利得関数を最大化する行動を選べばより良い結果を得やすくなります。

難しく聞こえるかもしれませんが基本はとてもシンプルです。利得関数は戦略の組み合わせに対して 1 つの数値を返します。例えば 2 人が同時に選ぶ戦略を A か B とします。プレイヤー 1 の利得関数を f(x,y) と書くと x と y はそれぞれの戦略を表します。このとき f(A,A) や f(A,B) などの形で値が決まります。

以下ではより身近な例として 2 人の簡単なゲームと学習時間と成績の関係を示します。

例 1 ちょっとした二人ゲームの利得表

次の表は横がプレイヤー 2 の戦略左右縦がプレイヤー 1 の戦略上下のときにプレイヤー 1 の利得 f がどうなるかを示します。

プレイヤー 1 の戦略	プレイヤー 2 の戦略	利得 f
上	左	3
上	右	1
下	左	0
下	右	2

このような表を使えばどの組み合わせが最も得になるのか一目で分かります。利得関数の値が高いほどその組み合わせは良いと判断します。

例 2 学習時間と成績の関係を表す簡単な利得関数

例えば学習時間を x 時間とおくと利得関数を f(x) = 2x − 0.1x^2 のように設定できます。これは学習時間が増えるとある程度までは成績の利得が大きくなりますがそこからはだんだん伸びが小さくなるという「利得の逓減」が起きるモデルです。これを最大化しようと考えると導関数を使って最適な学習時間を求めることができます。導関数 f'(x) = 2 − 0.2x が 0 になる点 x = 10 が最大となることがわかります。現実には体力や睡眠時間食事など他の要因も影響しますがここでは基本的な考え方を示すための簡単な例です。

要点のまとめとして利得関数は状況ごとに決まる「利得」を数値化する道具ですその数値を最大化するような選択を探すのが基本的な使い方です。利得関数を使えば複雑な意思決定も比較と計算でクリアに見えるようになります。

利得関数の同意語

ペイオフ関数: ゲーム理論や経済学、強化学習で用いられる、各戦略や行動の結果としてプレイヤーが得る利得を数値で表す関数。利得や報酬の大きさを比較する基準になります。
報酬関数: エージェントが環境から受け取る報酬を数値で表す関数。強化学習では、長期的な累積報酬を最大化するように設計します。
利益関数: 利益（収益から費用を差し引いた額）を関数として表す式。文脈によっては利得関数と同義で使われることがあります。
リターン関数: リターン（利益・報酬の総和・期待値）を表す関数として使われることがあり、分野によって意味が多少異なる点に注意が必要です。主に長期的な総利得を扱う場面で使われます。
収益関数: 企業の売上高や総収益を入力変数の関数として表す関数。文脈によっては利得関数の同義として扱われることもありますが、厳密には収益と利得は意味が異なる場合がある点に注意してください。

利得関数の対義語・反対語

損失関数: 利得関数の反対の視点で、損失や誤差を測る関数。モデルの予測がどれだけ間違っているかを数値化し、通常はその損失を minimization（最小化）する方向で学習が進みます。
コスト関数: 収益ではなく費用・支出を測る指標。最適化ではコストを最小化する観点から設計されることが多く、利得関数と対になる考え方です。
費用関数: コスト関数の別名として使われることがあり、同じ意味で解釈してOK。費用を最小化する目的で用いられます。
ペナルティ関数: 制約違反などを罰するように設計された関数。制約付き最適化で、目的関数にペナルティ項を加えて解を導く際に用いられます。
負の利得関数: 利得関数の符号を反転させた概念的な対義語。厳密な数学用語ではありませんが、利得を減らす方向性を表す表現として使われることがあります。
機会費用関数: 機会費用を数値化する観点の対義語的考え方。実務では通常「機会費用」という概念が別名として扱われますが、理論的には対概念として用いられることがあります。

利得関数の共起語

ペイオフ関数: ゲーム理論や経済学で、各プレイヤーが得られる報酬・利益を数式で表す関数。プレイヤーは自分の利得を最大化するように戦略を選ぶ。
報酬関数: 別名ペイオフ関数。機械学習・強化学習やゲーム理論で、行動の結果として得られる報酬を示す関数。
利得: 総合的な利益や報酬を指す言葉。利得関数の内容の元になる量を指すこともある。
利益: 企業や個人が得る純粋な経済的利益。利得関数の出力の一部として扱われることが多い。
収益: 売上高。利得関数の計算で用いられることがあり、コストを差し引く前の総額を表す。
コスト: 費用。利得関数は収益−コストの形で表現されることが多い。
最大化: 利得関数をできるだけ大きくすること。最適化の目的語として頻出。
最適化: 利得関数を最大化（または最小化）するための数学的手法・概念。
最適解: 利得関数を最大化する解。最適な意思決定の結果。
一階条件: 導関数を0にする条件。利得関数の局所最適点を探す際に用いる。
二階条件: 二階導関数の符号などで最適性を判定する条件。
微分: 利得関数を解析する際に用いる基本的な計算手法。最適化の第一歩。
勾配: 利得関数の傾きを示すベクトル。勾配降下法などの最適化アルゴリズムで用いられる。
制約条件: 最適化問題における制約。利得関数を最大化する解には制約が課されることが多い。
ラグランジュ乗数法: 制約条件を取り入れて利得関数を最適化する手法。現代最適化の基本技法。
プレイヤー: ゲーム理論で利得関数の対象となる意思決定主体。
戦略: プレイヤーが取る行動の計画。利得関数を最大化するための選択肢。
ゲーム理論: 複数の意思決定者が相互作用する状況を分析する理論。利得関数は基盤となる要素。
ナッシュ均衡: 全てのプレイヤーが他のプレイヤーの戦略を固定したとき、自分の利得を改善できない戦略の組み合わせ。
対数形式: 利得関数の形式の一つ。ログを用いることで滑らかな最適化を行いやすくする場合がある。
線形形式: 利得関数の形式の一つ。変数が線形に現れる場合の表現。
非線形: 利得関数が変数の冪や複雑な関係を含む場合。最適化が難しくなることが多い。
限界利益: 追加で1単位を得たときの利得の増加分。マージナルな概念。
プレイヤー集合: ゲーム理論で利得関数が適用されるプレイヤーの集合。
戦略空間: 各プレイヤーが取り得る戦略の全体像。利得関数を評価する前提となる。

利得関数の関連用語

利得関数: プレイヤー i の利得（報酬・収益）を、全プレイヤーの戦略プロファイル s に対して実数として返す関数。形式は π_i(s) のように書くことが多く、s は s_1 × ... × s_n の戦略空間で表される。
効用関数: 個人の満足度や効用を数値化した関数。ゲーム理論では利得関数の代替として使われることが多いが、経済学の効用理論とは文脈によって意味が異なることがある。
戦略: プレイヤーが取る意思決定の選択肢。純粋戦略（確定的な選択）と混合戦略（確率分布での選択）を含む。
戦略プロファイル: 全プレイヤーの戦略の組み合わせ。これにより各プレイヤーの利得 π_i(s) が決まる。
純粋戦略: 各プレイヤーが一つの具体的な戦略を固定して選ぶこと。
混合戦略: 各戦略を特定の確率で採用する確率分布。期待利得を計算する際に用いられる。
プレイヤー: ゲームに参加する意思決定主体。通常 i=1,2,...,n のように番号づけされる。
最適反応/ベストレスポンス: 他のプレイヤーの戦略が与えられたとき、自分の利得を最大化する戦略。ベストレスポンスは通常 BR_i(s_{-i}) で表される。
ベストレスポンス集合: 他プレイヤーの戦略に対して自分がとり得る最適戦略の集合。複数存在することがある。
ナッシュ均衡: 全プレイヤーが自分の戦略を変更しても利得が増えない戦略プロファイル。混合戦略を含む場合もある。
社会的利得/社会福祉関数: 社会全体の利得を一つの指標にまとめた関数。個別の利得の総和や他の集約方法で定義される。
パレート最適性: 誰かの利得を上げるときに必ず他の誰かの利得を下げる状態が存在しない状態。最適性の一つの考え方。
期待利得: 混合戦略を用いる場合の、確率分布に基づく平均的な利得。総和ではなく期待値で評価する。
確率分布: 混合戦略で各戦略をとる確率を表す分布。プレイヤー i は p_i で戦略 s_i を選ぶ。
戦略空間/戦略集合: 各プレイヤーが取り得る戦略の全体集合。離散的にも連続的にもあり得る。
連続戦略/離散戦略: 戦略が連続的に選べる場合と、離散的な選択肢のみの場合。解析手法が異なる。
費用関数/コスト関数: 利得の代わりにコストを表す関数。利得関数の符号を反転させて扱われることが多い。
正の単調変換と等価性（ordinal vs cardinal）: 利得関数と効用関数の関係。正の単調変換を施してもプレイの順序は変わらないため、順序情報が重視される場面が多い。
最適化: 利得を最大化する方策を見つける数学的な過程。利得関数の性質（連続性・凹性など）が解析を左右する。
優越関係: ある戦略が別の戦略より常に高い利得をもたらす場合の関係。
情報構造: プレイヤーが他のプレイヤーの戦略や情報をどの程度知っているかの前提。完全情報と部分情報がある。
均衡の存在条件: 利得関数の連続性、戦略空間のコンパクト性など、均衡が存在するための条件。