《Reinforcement Learning An Introduction》Summary
Anki 卡片 第一章:强化学习问题(The Reinforcement Learning Problem)详细讲解 1. 引言:从交互中学习 强化学习的核心思想源于我们日常生活中的一种学习方式:通过与环境的交互,根据结果调整行为,从而达成某种目标。 例如,一个婴儿通过挥动手臂、观察周围,逐渐学会抓握物体;我们学开车时,通过不断尝试和调整,最终能够平稳驾驶。这种“从交互中学习”的模式,正是强化学习研究的起点。 ...