エージェント
解説
エージェント(Agent)とは、人工知能(特に強化学習)において、「環境(Environment)の状態を観測し、自らの判断で行動(Action)を選択し、その結果として報酬(Reward)を得る主体」のことです。
強化学習における役割(4つの要素)
エージェントは以下のサイクルを繰り返すことで、将来得られる報酬の合計が最大になるような「行動のルール(方策:Policy)」を学習します。
- 観測(Observation):環境がどうなっているかを見る(状態)。
- 行動(Action):方策に基づき、何かをする。
- 報酬(Reward):行動の結果、良かったか悪かったかのフィードバックを受け取る。
- 学習(Learning):報酬をもとに方策を修正する。
重要なのは、エージェントは必ずしも高度な知能を持っている必要はなく、単純な温度調節器(サーモスタット)や掃除ロボット、ゲームのプレイヤーのように、「環境と相互作用する主体」であればエージェントと呼ばれます。

G検定対策
出題ポイント
- 定義:「環境・状態・行動・報酬」のループ構造における「行動する主体」であること。
- 具体例の対応:
- 将棋AIなら「AI=エージェント」「盤面=環境」。
- 掃除ロボットなら「ロボット=エージェント」「部屋=環境」。
- 自律性(Autonomy):外部からの直接的な命令ではなく、自らの感知と規則に基づいて動作する性質。
よくあるひっかけ問題
- × エージェントとは、人間のような意識を持った高度なAIのことである
(解説)意識の有無は関係ありません。単純なプログラムでも環境と相互作用していればエージェントです。 - × 強化学習において、報酬を決定するのはエージェントである
(解説)報酬を与える(決定する)のは「環境」です。エージェントは報酬を「受け取る」側です。この主客関係は頻出です。
