强化学习是通过让 AI 与真实环境交互,对交互结果进行评估反馈,并根据结果再次迭代 AI。