利得関数・とは?初心者でも分かる基本ガイド共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
利得関数・とは?初心者でも分かる基本ガイド共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


利得関数・とは?

利得関数とは ある状況で得られる利益や満足度を数値で表す関数のことです。経済学やゲーム理論では この関数を使って「どの行動が最も得になるか」を判断します。

利得関数は 2つの役割 を持つと覚えておくと分かりやすいです。まず 第一に 現実の行動の結果を数値で比較できるようにすること 第二に その数値を最大化するような行動を探すこと です。つまり 利得関数を最大化する行動を選べば より良い結果を得やすくなります

難しく聞こえるかもしれませんが 基本はとてもシンプルです。利得関数は戦略の組み合わせに対して 1 つの数値を返します。例えば 2 人が同時に選ぶ戦略を A か B とします。 プレイヤー 1 の利得関数を f(x,y) と書くと x と y はそれぞれの戦略を表します。このとき f(A,A) や f(A,B) などの形で値が決まります。

以下では より身近な例として 2 人の簡単なゲームと 学習時間と成績の関係を示します。

例 1 ちょっとした二人ゲームの利得表

次の表は 横がプレイヤー 2 の戦略 左 右 縦がプレイヤー 1 の戦略 上 下 のときに プレイヤー 1 の利得 f がどうなるかを示します。

プレイヤー 1 の戦略プレイヤー 2 の戦略利得 f
3
1
0
2

このような表を使えば どの組み合わせが最も得になるのか 一目で分かります。利得関数の値が高いほど その組み合わせは良いと判断します。

例 2 学習時間と成績の関係を表す簡単な利得関数

例えば 学習時間を x 時間とおくと 利得関数を f(x) = 2x − 0.1x^2 のように設定できます。これは 学習時間が増えると ある程度までは成績の利得が大きくなりますが そこからは だんだん伸びが小さくなる という「利得の逓減」が起きるモデルです。これを最大化しようと考えると 導関数を使って最適な学習時間を求めることができます。導関数 f'(x) = 2 − 0.2x が 0 になる点 x = 10 が 最大となることがわかります。現実には 体力や睡眠時間 食事など 他の要因も影響しますが ここでは基本的な考え方を示すための簡単な例です。

要点のまとめとして 利得関数は 状況ごとに決まる「利得」を数値化する道具です その数値を最大化するような選択を探すのが 基本的な使い方です。利得関数を使えば 複雑な意思決定も 比較と計算でクリアに見えるようになります。


利得関数の同意語

ペイオフ関数
ゲーム理論や経済学、強化学習で用いられる、各戦略や行動の結果としてプレイヤーが得る利得を数値で表す関数。利得や報酬の大きさを比較する基準になります。
報酬関数
エージェントが環境から受け取る報酬を数値で表す関数。強化学習では、長期的な累積報酬を最大化するように設計します。
利益関数
利益(収益から費用を差し引いた額)を関数として表す式。文脈によっては利得関数と同義で使われることがあります。
リターン関数
リターン(利益・報酬の総和・期待値)を表す関数として使われることがあり、分野によって意味が多少異なる点に注意が必要です。主に長期的な総利得を扱う場面で使われます。
収益関数
企業の売上高や総収益を入力変数の関数として表す関数。文脈によっては利得関数の同義として扱われることもありますが、厳密には収益と利得は意が異なる場合がある点に注意してください。

利得関数の対義語・反対語

損失関数
利得関数の反対の視点で、損失や誤差を測る関数。モデルの予測がどれだけ間違っているかを数値化し、通常はその損失を minimization(最小化)する方向で学習が進みます。
コスト関数
収益ではなく費用・支出を測る指標。最適化ではコストを最小化する観点から設計されることが多く、利得関数と対になる考え方です。
費用関数
コスト関数の別名として使われることがあり、同じ意味で解釈してOK。費用を最小化する目的で用いられます。
ペナルティ関数
制約違反などを罰するように設計された関数。制約付き最適化で、目的関数にペナルティ項を加えて解を導く際に用いられます。
負の利得関数
利得関数の符号を反転させた概念的な対義語。厳密な数学用語ではありませんが、利得を減らす方向性を表す表現として使われることがあります。
機会費用関数
機会費用を数値化する観点の対義語的考え方。実務では通常「機会費用」という概念が別名として扱われますが、理論的には対概念として用いられることがあります。

利得関数の共起語

ペイオフ関数
ゲーム理論や経済学で、各プレイヤーが得られる報酬・利益を数式で表す関数。プレイヤーは自分の利得を最大化するように戦略を選ぶ。
報酬関数
別名ペイオフ関数。機械学習・強化学習やゲーム理論で、行動の結果として得られる報酬を示す関数。
利得
総合的な利益や報酬を指す言葉。利得関数の内容の元になる量を指すこともある。
利益
企業や個人が得る純粋な経済的利益。利得関数の出力の一部として扱われることが多い。
収益
売上高。利得関数の計算で用いられることがあり、コストを差し引く前の総額を表す。
コスト
費用。利得関数は収益−コストの形で表現されることが多い。
最大化
利得関数をできるだけ大きくすること。最適化の目的語として頻出。
最適化
利得関数を最大化(または最小化)するための数学的手法・概念。
最適解
利得関数を最大化する解。最適な意思決定の結果。
一階条件
導関数を0にする条件。利得関数の局所最適点を探す際に用いる。
二階条件
二階導関数の符号などで最適性を判定する条件。
微分
利得関数を解析する際に用いる基本的な計算手法。最適化の第一歩。
勾配
利得関数の傾きを示すベクトル。勾配降下法などの最適化アルゴリズムで用いられる。
制約条件
最適化問題における制約。利得関数を最大化する解には制約が課されることが多い。
グランジュ乗数法
制約条件を取り入れて利得関数を最適化する手法。現代最適化の基本技法。
プレイヤー
ゲーム理論で利得関数の対象となる意思決定主体。
戦略
プレイヤーが取る行動の計画。利得関数を最大化するための選択肢。
ゲーム理論
複数の意思決定者が相互作用する状況を分析する理論。利得関数は基盤となる要素。
ナッシュ均衡
全てのプレイヤーが他のプレイヤーの戦略を固定したとき、自分の利得を改善できない戦略の組み合わせ。
対数形式
利得関数の形式の一つ。ログを用いることで滑らかな最適化を行いやすくする場合がある。
線形形式
利得関数の形式の一つ。変数が線形に現れる場合の表現。
非線形
利得関数が変数の冪や複雑な関係を含む場合。最適化が難しくなることが多い。
限界利益
追加で1単位を得たときの利得の増加分。マージナルな概念。
プレイヤー集合
ゲーム理論で利得関数が適用されるプレイヤーの集合。
戦略空間
プレイヤーが取り得る戦略の全体像。利得関数を評価する前提となる。

利得関数の関連用語

利得関数
プレイヤー i の利得(報酬・収益)を、全プレイヤーの戦略プロファイル s に対して実数として返す関数。形式は π_i(s) のように書くことが多く、s は s_1 × ... × s_n の戦略空間で表される。
効用関数
個人の満足度や効用を数値化した関数。ゲーム理論では利得関数の代替として使われることが多いが、経済学の効用理論とは文脈によって意味が異なることがある。
戦略
プレイヤーが取る意思決定の選択肢。純粋戦略(確定的な選択)と混合戦略(確率分布での選択)を含む。
戦略プロファイル
全プレイヤーの戦略の組み合わせ。これにより各プレイヤーの利得 π_i(s) が決まる。
純粋戦略
各プレイヤーが一つの具体的な戦略を固定して選ぶこと。
混合戦略
各戦略を特定の確率で採用する確率分布。期待利得を計算する際に用いられる。
プレイヤー
ゲームに参加する意思決定主体。通常 i=1,2,...,n のように番号づけされる。
最適反応/ベストレスポンス
他のプレイヤーの戦略が与えられたとき、自分の利得を最大化する戦略。ベストレスポンスは通常 BR_i(s_{-i}) で表される。
ベストレスポンス集合
他プレイヤーの戦略に対して自分がとり得る最適戦略の集合。複数存在することがある。
ナッシュ均衡
全プレイヤーが自分の戦略を変更しても利得が増えない戦略プロファイル。混合戦略を含む場合もある。
社会的利得/社会福祉関数
社会全体の利得を一つの指標にまとめた関数。個別の利得の総和や他の集約方法で定義される。
パレート最適
誰かの利得を上げるときに必ず他の誰かの利得を下げる状態が存在しない状態。最適性の一つの考え方。
期待利得
混合戦略を用いる場合の、確率分布に基づく平均的な利得。総和ではなく期待値で評価する。
確率分布
混合戦略で各戦略をとる確率を表す分布。プレイヤー i は p_i で戦略 s_i を選ぶ。
戦略空間/戦略集合
各プレイヤーが取り得る戦略の全体集合。離散的にも連続的にもあり得る。
連続戦略/離散戦略
戦略が連続的に選べる場合と、離散的な選択肢のみの場合。解析手法が異なる
費用関数/コスト関数
利得の代わりにコストを表す関数。利得関数の符号を反転させて扱われることが多い。
正の単調変換と等価性(ordinal vs cardinal)
利得関数と効用関数の関係。正の単調変換を施してもプレイの順序は変わらないため、順序情報が重視される場面が多い。
最適化
利得を最大化する方策を見つける数学的な過程。利得関数の性質(連続性・凹性など)が解析を左右する。
優越関係
ある戦略が別の戦略より常に高い利得をもたらす場合の関係。
情報構造
プレイヤーが他のプレイヤーの戦略や情報をどの程度知っているかの前提。完全情報と部分情報がある。
均衡の存在条件
利得関数の連続性、戦略空間のコンパクト性など、均衡が存在するための条件。

利得関数のおすすめ参考サイト


学問の人気記事

トルクの単位・とは?初心者向けに徹底解説!なぜ単位が違うのかまで分かる共起語・同意語・対義語も併せて解説!
920viws
引用・参考文献とは?初心者でもわかる使い方とポイント解説共起語・同意語・対義語も併せて解説!
491viws
示差走査熱量測定とは?初心者向けガイドで学ぶ基本と実験のポイント共起語・同意語・対義語も併せて解説!
376viws
絶縁抵抗値とは?初心者でも分かる測定の基本と安全のコツ共起語・同意語・対義語も併せて解説!
371viws
no・とは?初心者にもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
356viws
summarize・とは?初心者向け解説と使い方のコツ共起語・同意語・対義語も併せて解説!
342viws
ナイロン樹脂とは?初心者にもわかる基本と用途ガイド共起語・同意語・対義語も併せて解説!
330viws
穴加工・とは?初心者が知っておく基本と現場での活用ポイント共起語・同意語・対義語も併せて解説!
299viws
welchのt検定とは?不等分散のデータを比較する統計手法をやさしく解説共起語・同意語・対義語も併せて解説!
261viws
3/4・とは?分数の基本を分かりやすく解く完全ガイド共起語・同意語・対義語も併せて解説!
239viws
論述問題・とは?初心者にも分かる解説と解き方のコツ共起語・同意語・対義語も併せて解説!
228viws
ダーウィンの進化論とは?中学生にも分かるやさしい解説と身近な例共起語・同意語・対義語も併せて解説!
205viws
超音波探傷・とは? 初心者向けのやさしい解説と身近な活用共起語・同意語・対義語も併せて解説!
202viws
摘要とは?初心者にも分かる意味と書き方ガイド共起語・同意語・対義語も併せて解説!
193viws
z変換・とは?初心者が知っておくべき基礎と日常への応用共起語・同意語・対義語も併せて解説!
188viws
洗浄バリデーションとは?初心者が押さえる基本と実務のポイント共起語・同意語・対義語も併せて解説!
186viws
空気圧センサーとは?初めてでも分かる仕組みと身近な活用事例共起語・同意語・対義語も併せて解説!
182viws
ensureとは?初心者にもわかる意味と使い方を徹底解説共起語・同意語・対義語も併せて解説!
181viws
先にとは?初心者でもわかる意味と使い方ガイド共起語・同意語・対義語も併せて解説!
163viws
alliteration(頭韻)とは?初心者にやさしい解説と使い方のコツ共起語・同意語・対義語も併せて解説!
162viws

新着記事

学問の関連記事