因果与相关 Causation vs Correlation
年级:7年级起 分类:批判性思维 年级入口:七至九年级 关联:科学假设与证伪 Hypothesis and Falsification | 确认偏误 Confirmation Bias
30 秒版本
- 一句话:一起出现 ≠ 一个导致另一个——相关不等于因果
- 举个例子:冰淇淋销量↑的月份溺水人数也↑——不是冰淇淋导致溺水,是夏天同时影响了两者
- 判断方法:问”有没有第三个因素同时影响了两者?“
核心概念
相关(Correlation):两件事同时出现或同步变化,但不代表一个导致另一个。
因果(Causation):一件事直接导致另一件事发生,且能通过实验或机制验证。
核心判断:相关 ≠ 因果。看到两件事一起变化,必须追问”为什么”。
信号词速查
| 信号词 | 示例 | 陷阱 |
|---|---|---|
| ”研究发现……所以……" | "研究发现喝咖啡的人更长寿,所以咖啡延寿” | 跳过了混淆变量 |
| ”数据显示……" | "数据显示 X 和 Y 正相关” | 相关不等于因果 |
| ”用了……之后就……" | "用了这个护肤品,皮肤变好了” | 时间先后 ≠ 因果 |
| ”越多……越多……" | "手机用得越多,成绩越差” | 可能有第三因素 |
👉 听到这些词,立刻问自己:“有没有第三个因素同时影响了两者?”
🔍 思维透镜
A 和 B 同时出现?四种可能
当你观察到 A 和 B 相关时,不要急着下结论,先排查四种可能:
| 可能性 | 结构 | 例子 |
|---|---|---|
| ① A 导致 B | A → B | 下雨 → 地面湿 |
| ② B 导致 A | B → A | 经常运动的人更开心(也可能是开心的人更爱运动) |
| ③ 第三因素 C 同时导致两者 | C → A + B | 夏天 → 冰淇淋销量↑ + 溺水人数↑ |
| ④ 纯属巧合(伪相关) | A ≈ B | 尼古拉斯·凯奇年出演电影数 ≈ 游泳池溺亡数 |
混淆变量(Confounding Variable):第③种情况中隐藏的 C,是最常见的陷阱。
相关 vs 因果
| 相关 | 因果 | |
|---|---|---|
| 含义 | 两件事同步变化 | 一件事直接导致另一件事 |
| 证明难度 | 容易(统计数据即可) | 困难(需要实验+排除替代解释) |
| 能做决策依据吗 | ⚠️ 仅供参考 | ✅ 可以 |
| 建立方法 | 观察即可 | 需要随机对照实验(RCT) |
🎭 成语解剖
张冠李戴
把张三的帽子戴到李四头上——张冠错放,归因错误。
| 拆解 | |
|---|---|
| 原意 | 把属于这个人的东西错误地归给另一个人 |
| 逻辑映射 | 错误归因——看到 A 和 B 一起出现,就把原因强行从 A 套到 B,忽略了真正的原因 C |
| 现实对照 | ”吃了偏方之后病好了”——真正原因可能是休息、免疫力、或同时在吃正规药 |
风马牛不相及
齐桓公攻楚,楚使者说:“你在北方,我在南方,即便跑散的马和牛也到不了对方那里,怎么会打到这来?“
| 拆解 | |
|---|---|
| 原意 | 两件事毫无关联 |
| 逻辑映射 | 伪相关——两件事在数据上”碰巧”一起出现,实际没有任何因果机制 |
| 现实对照 | ”冰淇淋销量和鲨鱼袭击数都在夏天增加”——冰淇淋和鲨鱼之间,真的是风马牛不相及 |
💡 思想史光点
| 人物 | 年代 | 关键词 |
|---|---|---|
| 休谟(David Hume) | 1739 | 因果关系的哲学质疑,“我们看到的只是先后,不是因果” |
| 塞麦尔维斯(Semmelweis) | 1847 | 用数据证明洗手降低产褥热——从相关走向因果的先驱 |
| 皮尔逊(Karl Pearson) | 1896 | 相关系数,用数学测量”两件事是否一起变” |
| 费歇尔(R. A. Fisher) | 1935 | 随机对照实验,建立因果关系的黄金标准 |
→ 延伸阅读:思想史光点 Logic Origins
📰 案例精讲
📘 日常:冰淇淋和溺水
统计数据显示:冰淇淋销量越高的月份,溺水人数也越多。
难道冰淇淋会导致溺水?当然不是。
分析:
- 冰淇淋销量↑ 和 溺水人数↑ 都是夏天高温造成的
- 天气热 → 人们买更多冰淇淋,同时也更多去游泳
- 混淆变量 = 夏天/高温
- 冰淇淋和溺水之间没有任何因果关系
这是全世界统计学入门课最经典的例子:相关 ≠ 因果。
📙 经济:麦当劳越多的国家,犯罪率越低?
有人发现:一个国家麦当劳门店越多,犯罪率往往越低。所以麦当劳降低了犯罪?
分析:
- 混淆变量 = 国家经济发展水平
- 经济发达 → 麦当劳愿意开店(有消费力)
- 经济发达 → 更好的教育、就业、社会福利 → 犯罪率更低
- 麦当劳本身不减少犯罪,是经济水平同时影响了两者
这类错误在商业和政策讨论中极为常见:把”伴随现象”当成”原因”。
📕 历史:塞麦尔维斯与洗手实验
1847 年,维也纳总医院的产科有两个病房。第一病房由医学生负责,产妇死亡率约 13-18%;第二病房由助产士负责,死亡率约 2%。
匈牙利医生塞麦尔维斯发现:医学生经常从解剖室直接来接生,而助产士不接触尸体。他怀疑是”尸体上的某种物质”导致了感染。
他要求医学生接生前用含氯石灰水洗手——第一病房死亡率从约 13-18% 降到 1-2%。
从相关到因果的过程:
- 观察到相关:哪个病房死亡率高?→ 医学生的病房
- 排查变量:两个病房有什么不同?→ 医学生接触尸体
- 实验干预:强制洗手 → 死亡率暴降
- 建立因果:不洁的手 → 感染 → 死亡
这就是科学方法的力量:不停留在相关,用实验追出因果。
💰 经济思维暗线:收益与风险
把相关当因果在经济决策中代价高昂:
- 收益:正确识别因果关系 = 找到真正有效的投入方向(投资回报)
- 风险:把相关当因果 = 投入资源在无效的方向(浪费成本)
- 成本:验证因果需要实验和时间——但不验证就行动的成本更大
- 激励:人们倾向于接受简单的因果解释(因为它给出了行动方向),即使这个因果关系是假的
商业中最贵的错误之一:“我们做了 X,然后收入增长了,所以是 X 导致了增长。“——也许增长另有原因。
📖 真实阅读
📰 “学钢琴的孩子数学更好”
某教育机构发表报告称:“调查了 2000 名中小学生,学钢琴的孩子平均数学成绩比不学钢琴的孩子高 15 分。结论:学钢琴能提高数学能力。”
一位家长看到报告后,立刻给孩子报了钢琴班,期待数学成绩提升。
逻辑分析:
- 这个报告证明了什么?(相关还是因果?)
- 有哪些可能的混淆变量?
- 家长的决策合理吗?
- 要真正证明”钢琴提高数学”,需要怎样的实验设计?
📝 参考分析
报告只证明了相关,不是因果。可能的混淆变量:① 家庭经济条件——能负担钢琴课的家庭也能提供更多教育资源;② 家庭教育重视程度——重视教育的家庭同时鼓励钢琴和数学;③ 孩子自身学习能力——学习能力强的孩子在各方面都表现更好。家长的决策基于错误的因果推断。要证明因果,需要随机对照实验:随机选取一组孩子学钢琴、一组不学,控制家庭背景等变量,一段时间后比较数学成绩。
🧪 练习
📘 识别题(2 题)
判断以下推理是否犯了”把相关当因果”的错误:
- “城市路灯越多的地方,犯罪率越低。所以多装路灯就能降低犯罪率。”
- “每次下雨前,气压都会下降。所以气压下降是下雨的前兆。”
📙 分析题(2 题)
-
“每天喝咖啡的人平均寿命更长。“列出至少两个可能的混淆变量,并解释它们如何同时影响”喝咖啡”和”长寿”。
-
尼古拉斯·凯奇每年出演的电影数量,与美国游泳池溺亡人数高度相关。用四种可能性框架分析,这属于哪一种?为什么?
📕 构建题(2 题)
- 找一条新闻或广告中的”因果声称”,用以下框架分析:
声称的因果关系:A → B
可能的混淆变量 C:______
反向因果的可能性(B → A):______
纯巧合的可能性:______
要验证真正因果,需要什么实验:______
- 以下论证把相关当因果,请重写为考虑其他可能性的分析:
“自从新校长上任后,学校的考试平均分提高了 15 分。说明新校长的管理方法非常有效。”
重写这段分析,用四种可能性框架(A→B / B→A / C→两者 / 巧合)展开讨论。
📝 练习参考答案
第 1 题:犯了错误。路灯多 和 犯罪率低 可能都是经济发展水平(混淆变量)的结果——富裕地区路灯多、治安也好。路灯本身可能有一定抑制作用,但不能从这个数据直接得出因果。
第 2 题:这个推理是合理的。气压下降和降雨之间有明确的物理机制(低气压导致空气上升、冷却、凝结成云),且有大量实验和观测验证。这是真正的因果关系。
第 3 题:混淆变量示例:① 经济条件——买得起咖啡的人往往经济条件更好,能获得更好的医疗和营养;② 生活规律性——每天喝咖啡的人往往有稳定工作和规律作息,本身就更有利于长寿。这两个因素同时促进了”喝咖啡”和”长寿”。
第 4 题:这属于第④种——纯属巧合(伪相关)。凯奇拍电影和游泳池溺亡之间没有任何合理的因果机制(A→B 不合理、B→A 不合理),也找不到合理的共同原因 C。当数据量足够大时,总能找到一些统计上高度相关但毫无意义的巧合。
第 5 题:开放题。关键检查:你是否考虑了混淆变量?是否区分了”时间先后”和”因果”?
第 6 题:原文直接把”新校长上任”当作”成绩提高”的原因。合理分析:A→B(校长管理有效)是可能的,但还需排除:C→两者(同期教育局推行了新课改,既导致校长调动也导致教学方式改进);时间巧合(成绩提高趋势可能在前任校长时期已经开始);B→A 在此场景不太适用。要确认因果,需要对比数据:同区其他学校同期成绩变化、该校前两年的成绩趋势、校长具体推行了哪些措施及其独立效果。
🔗 节点关系
批判性思维
┌────────┼────────┐
确认偏误 因果与相关 沉没成本
│
┌────────┴────────┐
混淆变量 伪相关
(隐藏的第三因素) (纯属巧合)
│
科学假设与证伪
(用实验建立真正因果)
双链跳转: 科学假设与证伪 Hypothesis and Falsification | 确认偏误 Confirmation Bias | 沉没成本 Sunk Cost Fallacy
R. S. Ang · K12 Notes · 7年级起, 2026