Web教科書

エージェントとは何か?

エージェント

解説

エージェント(Agent)とは、人工知能(特に強化学習)において、「環境(Environment)の状態を観測し、自らの判断で行動(Action)を選択し、その結果として報酬(Reward)を得る主体」のことです。

強化学習における役割(4つの要素)

エージェントは以下のサイクルを繰り返すことで、将来得られる報酬の合計が最大になるような「行動のルール(方策:Policy)」を学習します。

  • 観測(Observation):環境がどうなっているかを見る(状態)。
  • 行動(Action):方策に基づき、何かをする。
  • 報酬(Reward):行動の結果、良かったか悪かったかのフィードバックを受け取る。
  • 学習(Learning):報酬をもとに方策を修正する。

重要なのは、エージェントは必ずしも高度な知能を持っている必要はなく、単純な温度調節器(サーモスタット)や掃除ロボット、ゲームのプレイヤーのように、「環境と相互作用する主体」であればエージェントと呼ばれます。

エージェントと環境の相互作用ループ


G検定対策

出題ポイント

  • 定義:「環境・状態・行動・報酬」のループ構造における「行動する主体」であること。
  • 具体例の対応:
    • 将棋AIなら「AI=エージェント」「盤面=環境」。
    • 掃除ロボットなら「ロボット=エージェント」「部屋=環境」。
  • 自律性(Autonomy):外部からの直接的な命令ではなく、自らの感知と規則に基づいて動作する性質。

よくあるひっかけ問題

  • × エージェントとは、人間のような意識を持った高度なAIのことである
    (解説)意識の有無は関係ありません。単純なプログラムでも環境と相互作用していればエージェントです。
  • × 強化学習において、報酬を決定するのはエージェントである
    (解説)報酬を与える(決定する)のは「環境」です。エージェントは報酬を「受け取る」側です。この主客関係は頻出です。
タイトルとURLをコピーしました