《Reinforcement Learning An Introduction》Summary
第一章:强化学习问题(The Reinforcement Learning Problem)详细讲解 1. 引言:从交互中学习 强化学习的核心思想源于我们日常生活中的一种学习方式:通过与环境的交互,根据结果调整行为,从而达成某种目标。 例如,一个婴儿通过挥动手臂、观察周围,逐渐 …
Posts + Notes
第一章:强化学习问题(The Reinforcement Learning Problem)详细讲解 1. 引言:从交互中学习 强化学习的核心思想源于我们日常生活中的一种学习方式:通过与环境的交互,根据结果调整行为,从而达成某种目标。 例如,一个婴儿通过挥动手臂、观察周围,逐渐 …
Anki 卡片 第1章“Introduction”详细讲解 本章是《Probabilistic Machine Learning: An Introduction》的开篇,旨在为读者建立机器学习的基本框架,定义核心概念,介绍三种主要的学习范式(监督学习、无监督学习、强化学习), …
Anki 卡片 《模式识别与机器学习》(PRML)第1章“引言”教学讲解 1. 本章概述与学习目标 第1章是全书的总纲,作者 Christopher M. Bishop 在这一章中系统地介绍了模式识别和机器学习的核心思想、数学工具以及基本框架。本章不涉及复杂的技术细节,而是为后 …
《The Book of Why》引言“Mind over Data”深度讲解 Anki 卡片 引言:为什么我们需要因果思维? 本章开篇即点明核心:我们正处在一场科学变革之中——因果推断。这场变革的核心,是让科学能够严谨地回答那些关于“为什么”的问题,而不仅仅是“是什么”或“有多 …
用工程视角解释 DevOps vs SRE:目标、边界与落地方式。
从焦虑与选择出发,梳理目标与路径的思考方法。
记录首次部署 Hexo 博客与 GitHub Pages 的过程。