エージェントとは何か？ - G検定無料問題集｜解説付きでたくさん練習できる「G検定の森」

エージェント

エージェント（Agent）とは、人工知能（特に強化学習）において、「環境（Environment）の状態を観測し、自らの判断で行動（Action）を選択し、その結果として報酬（Reward）を得る主体」のことです。

エージェントは以下のサイクルを繰り返すことで、将来得られる報酬の合計が最大になるような「行動のルール（方策：Policy）」を学習します。

重要なのは、エージェントは必ずしも高度な知能を持っている必要はなく、単純な温度調節器（サーモスタット）や掃除ロボット、ゲームのプレイヤーのように、「環境と相互作用する主体」であればエージェントと呼ばれます。

エージェントと環境の相互作用ループ

× エージェントとは、人間のような意識を持った高度なAIのことである
（解説）意識の有無は関係ありません。単純なプログラムでも環境と相互作用していればエージェントです。
× 強化学習において、報酬を決定するのはエージェントである
（解説）報酬を与える（決定する）のは「環境」です。エージェントは報酬を「受け取る」側です。この主客関係は頻出です。