Causal Inference

《The Book of Why》引言“Mind over Data”深度讲解 Anki 卡片引言：为什么我们需要因果思维？本章开篇即点明核心：我们正处在一场科学变革之中——因果推断。这场变革的核心，是让科学能够严谨地回答那些关于“为什么”的问题，而不仅仅是“是什么”或“有多少”。 1. 基础概念：从日常困惑到科学难题核心问题：我们每天都会问“为什么”，比如“为什么我的头痛好了？”、“为什么这家公司的销量上升了？”。这些问题都涉及因果关系。传统科学的困境：尽管人类天生就具备因果思维，但传统科学，尤其是统计学，长期以来却刻意回避谈论因果关系。统计学教科书上最著名的一句话就是：“相关关系不等于因果关系”。这句话固然正确（例如，公鸡打鸣与太阳升起相关，但公鸡不打鸣，太阳照常升起），但它只告诉你什么不是，却没有告诉你什么是。根本原因：科学家缺乏一套数学语言来表达因果关系。用传统的代数方程（如 B = kP 表示气压和气压计读数的关系），你可以随意改写方程（P = B/k），但数学上无法表达“是气压导致气压计变化，而不是反过来”这种强烈的因果信念。这种语言上的缺失，导致因果问题长期被排除在严谨的科学讨论之外。 2. 核心知识点：因果推断的框架这一章的核心是引入了一套全新的、处理因果关系的思维框架和工具。 2.1 关键术语与定义因果推断 (Causal Inference)：一门旨在从数据、假设和知识中，得出关于因果关系（如“X是Y的原因”）的科学。它试图回答那些“为什么”和“如果…会怎样”的问题。因果模型 (Causal Model)：对现实世界因果过程的一种简化表示。它编码了我们关于“什么导致什么”的现有知识。模型的形式可以是：因果图 (Causal Diagram)：用节点（变量）和箭头（因果关系）构成的点-箭头图，直观地表示变量之间的依赖关系。例如，吸烟 → 肺癌。结构方程 (Structural Equations)：用数学方程描述变量之间的函数关系。例如，肺癌发生率 = f(吸烟, 遗传因素)。变量 (Variable)：我们感兴趣的、可以取不同值的量。例如，“是否服药”（是/否）、“血压”（数值）、“寿命”（年数）。 do-算子 (do-operator)：这是因果推断中最重要的符号创新，用 do(X) 表示。它代表了对系统进行干预，即强制将变量 X 设为某个值 x，而不仅仅是被动观察到 X 为 x。观察 (Seeing): P(L | D)，即我们看到某人服用了药物 (D)，他的寿命 (L) 的概率分布。问题在于，服药的人可能本身身体就更好，所以这个概率可能不是由药物导致的。干预 (Doing): P(L | do(D))，即我们强制某人服用药物 (D)，他的寿命 (L) 的概率分布。这消除了自我选择带来的偏差，这才是我们真正想要的药物因果效应。例子：气压计与风暴。看到气压计下降 (P(风暴 | 看到气压计下降)) 会增加风暴的概率。但是，如果我们强制让气压计下降 (do(气压计下降))，比如用真空泵抽气，这绝不会引起风暴。do-算子完美地区分了“观察”和“干预”。反事实 (Counterfactual)：这是因果推理的最高层级。它问的是“如果当初…会怎样？”。定义：想象一个与事实相反的世界，并在这个世界中推断结果。例子：“乔服了药后死了。我想知道，如果他没有服药，他还会活着吗？” (P(乔活着 | 乔服了药, 乔死了, do(乔未服药)))。这个问题无法仅通过观察数据回答，因为它涉及一个没有发生的、反事实的世界。混杂 (Confounding)：一个同时影响原因 (X) 和结果 (Y) 的变量，导致 X 和 Y 之间出现虚假关联的现象。例子：冰激凌销量与犯罪率。两者高度相关，但真正的原因是第三个变量——天气炎热。天气热既导致人们吃更多冰激凌，也可能导致人们情绪烦躁、户外活动增多，从而犯罪率上升。天气就是一个混杂因子。 2.2 核心原理：因果推断引擎本章提出了全书最核心的蓝图：因果推断引擎 (图 I.1)。这个引擎清晰地展示了如何将知识、假设和数据结合起来，以严谨的方式回答因果问题。 ...