Skip to content

《超预测》— Philip Tetlock

一句话定位:20 年研究证明——预测不是天赋,而是可以训练的技能。超级预测者用贝叶斯思维、跨学科视角和持续校准,在预测准确率上碾压情报分析师和专家。

为什么这本书在本体系中不可替代

OPC 模式的核心竞争力之一是将宏观叙事转化为可执行的交易信号。这个过程的本质就是预测——不是算命式的"BTC 会到多少",而是概率化的"在 X 条件下,Y 发生的概率是 Z%"。

特洛克用 20 年的"良好判断力项目"(Good Judgment Project)证明了一个反直觉的结论:普通人在预测准确率上可以超过拥有机密情报的 CIA 分析师。关键不在于你知道多少信息,而在于你如何处理信息——这正是 OPC 模式所强调的"方法论 > 信息量"。

在 1.3 章节中,本书被列为"贝叶斯思维"桥接技能的入门教材;在 7.9d 章节中,它证明了跨学科思考者("狐狸型")比单一学科专家("刺猬型")更擅长预测;在 7.10 章节中,它是 OPC 预测框架的理论基础。三个引用点共同指向一个核心:OPC 操作者需要的不是更多数据,而是更好的思维方法

核心概念深度拆解

概念一:贝叶斯思维——永远在更新你的信念

李永乐式生活化例子

你早上出门,看到天空晴朗(证据1),你估计今天下雨的概率是 5%。

中午,你看到远处有乌云飘来(证据2),你把下雨概率上调到 30%。

下午,你听到雷声(证据3),你把概率上调到 70%,于是带了伞。

这就是贝叶斯更新:每获得一条新信息,你就调整一次判断。你不是在"预测"天气,而是在持续更新"下雨"这个假设的概率。

现在换成 Web3 场景:

你看到 BTC 在 60000 横盘(证据1),估计突破前高的概率是 40%。 美联储宣布暂停加息(证据2),你上调到 55%。 链上数据显示巨鲸在大量囤积(证据3),你上调到 70%。 但 Twitter 上突然出现 SEC 起诉币安的传闻(证据4),你下调到 50%。

每一步都不是"预测",而是基于新证据的概率更新

学术定义

贝叶斯思维的核心公式:

P(H|E) = P(E|H) × P(H) / P(E)

翻译成直觉语言:

  • P(H):你对假设 H 的初始信念(先验概率)
  • P(E|H):如果 H 为真,看到证据 E 的可能性
  • P(E):看到证据 E 的总体可能性
  • P(H|E):看到证据 E 后,H 为真的概率(后验概率)

关键操作意义:不要因为一条新证据就全盘推翻你的判断,也不要无视新证据固执己见。每条证据都应该让你"微调"概率,而不是"翻转"结论。

数据支撑

  • 良好判断力项目(Tetlock, 2011-2015):在 IARPA(美国情报高级研究计划局)的预测竞赛中,特洛克的"超级预测者"团队连续 4 年准确率排名第一,超过拥有机密情报的分析师团队,准确率高出 60%
  • 校准实验:当超级预测者说"70% 确信"时,实际结果确实是 70% 左右。而普通人的"70% 确信",实际准确率只有 50-55%——和抛硬币差不多。
  • 更新频率:超级预测者更新预测的频率是普通人的 3-5 倍。他们不是"定了就不改",而是持续根据新信息微调。

OPC/Web3 应用

1. 交易决策的概率化

OPC 框架要求每个交易决策都附带置信度。不是"我觉得会涨",而是"在当前宏观+链上+情绪数据下,未来 7 天上涨的概率是 65%"。AI 可以帮助计算这个概率,但最终的概率调整(贝叶斯更新)需要人类操作者的判断。

2. 决策日志与复盘

特洛克发现,预测准确率提升的最大杠杆是记录和复盘。OPC 操作者应该建立决策日志:记录每次决策的概率估计、依据、以及最终结果。AI 可以自动分析日志,计算你的"校准曲线"——你说 70% 确信时,实际准确率是多少?

3. 叙事信号的概率化

当市场出现新的叙事(如"美联储即将降息"),不要直接判断"利好"或"利空",而是问:这个叙事为真的概率是多少?如果为真,对 BTC 价格的影响幅度是多少?期望值 = 概率 × 影响幅度。


概念二:校准——知道自己知道什么

李永乐式生活化例子

考试前,两个学生都说"我这次能考 80 分"。

学生 A 实际考了 78 分——他的自我评估很准确。 学生 B 实际考了 55 分——他严重高估了自己。

学生 A 是"校准良好"的,学生 B 是"校准不良"的。

在投资领域,"校准"意味着:当你说"我 80% 确信这个项目靠谱"时,你过去说这句话的项目中,真的有 80% 是靠谱的吗?

大多数人的答案是:没有。研究表明,人们的"80% 确信",实际准确率通常只有 50-60%。这意味着你系统性地高估了自己的判断质量。

学术定义

校准(Calibration)是指一个人的主观概率估计与客观频率的匹配程度。

  • 完美校准:说"70% 确信"的事情中,70% 确实发生了
  • 过度自信:说"70% 确信"的事情中,只有 50% 发生了(最常见)
  • 过度谨慎:说"70% 确信"的事情中,85% 发生了(罕见)

校准是可以训练的。特洛克发现,经过 6 个月的训练和反馈,普通人的校准度可以提升 30-50%。

数据支撑

  • 天气预报员是校准最好的职业群体——当他们说"70% 降雨概率"时,确实有 70% 的情况会下雨。这是因为天气预报有即时、明确的反馈。
  • 医生的校准度较差——当他们说"90% 确信是 X 疾病"时,实际准确率只有 70-80%。
  • 投资者的校准度最差——散户说"80% 确信这只股票会涨"时,实际准确率通常低于 50%。

OPC/Web3 应用

1. 个人校准曲线

OPC 操作者应该定期(每月)计算自己的校准曲线。方法:回顾过去一个月的所有决策,按置信度分组(50-60%、60-70%、70-80% 等),计算每组的实际准确率。AI 可以自动完成这个分析。

2. AI 辅助校准

当人类操作者说"我 80% 确信"时,AI 可以调出该操作者的历史校准数据,提示:"你过去说 80% 确信时,实际准确率是 62%。建议将置信度调整为 62%。"

3. 预测市场的校准价值

预测市场(如 Polymarket)的价格本身就是一种"群体校准"。如果某个事件的市场定价是 70%,历史数据显示这类市场的准确率确实接近 70%。OPC 操作者可以将预测市场价格作为校准的参考基准。


概念三:狐狸型 vs 刺猬型——跨学科思维的预测优势

李永乐式生活化例子

有两种天气预报员:

刺猬型:精通大气物理学,用一个复杂的气候模型做预测。当模型说"不会下雨"时,即使窗外已经在滴水,他仍然坚持"模型说不会"。

狐狸型:了解大气物理学,但也看气压计、观察动物行为、听民间谚语、参考多个模型。当多数信号指向"下雨"时,他会说"虽然主模型说不会,但综合来看下雨概率较高"。

特洛克发现:狐狸型的长期预测准确率比刺猬型高出 50% 以上

原因很简单:世界是复杂的,没有任何单一模型能捕捉所有变量。狐狸型思考者的优势不在于"什么都懂一点",而在于能够跨学科整合信息,在不同模型之间切换和权衡

学术定义

这个分类来自哲学家以赛亚·伯林(Isaiah Berlin):

  • 刺猬型:用一个大理论解释一切。专家、学者、理论家往往是刺猬型。他们的优势是深度,劣势是固执。
  • 狐狸型:用多个小理论灵活应对。记者、商人、跨学科学习者往往是狐狸型。他们的优势是灵活,劣势是可能缺乏深度。

特洛克的实证研究发现:在长期预测中,狐狸型显著优于刺猬型。这是因为:

  1. 狐狸型更愿意更新自己的信念(贝叶斯思维)
  2. 狐狸型更善于整合不同来源的信息(跨学科思维)
  3. 狐狸型更少受到确认偏误的影响(认知灵活性)

数据支撑

  • 284 名专家、28000 次预测(Tetlock, 2005):刺猬型专家的长期预测准确率略高于随机猜测;狐狸型专家的准确率显著高于刺猬型。
  • IARPA 竞赛结果:超级预测者中,自我认同为"狐狸型"的比例是普通预测者的 2.5 倍。
  • 跨学科背景优势:超级预测者的学科背景分布比普通专家更广泛——他们不是"什么都懂一点的通才",而是"在多个领域有中等深度理解的学习者"。

OPC/Web3 应用

1. OPC 操作者就是"狐狸型"

OPC 模式天然要求跨学科思维——你需要理解宏观经济学、地缘政治、技术分析、行为心理学、博弈论等多个领域。你不需要成为每个领域的顶级专家,但你需要在每个领域都有"足够做出合理判断"的理解深度。

2. 多模型思维

在做投资决策时,不要只依赖一个模型(如技术分析)。OPC 框架建议同时使用至少 3 个独立模型:

  • 宏观模型(美联储政策 → 流动性 → 风险资产)
  • 链上模型(巨鲸行为 → 资金流向 → 供需关系)
  • 情绪模型(社交媒体 → 散户行为 → FOMO/FUD 周期)

当多个模型指向同一方向时,置信度提高;当模型之间矛盾时,降低仓位或等待更多信息。

3. AI 作为"学科翻译器"

AI 可以帮助 OPC 操作者跨越学科壁垒:当操作者需要从宏观经济学角度分析一个问题时,AI 可以提供该学科的核心框架和关键变量;当需要切换到博弈论角度时,AI 可以提供博弈论的分析工具。这使得"狐狸型"思维更加高效。


概念四:费米估计——分解不可能的问题

李永乐式生活化例子

面试官问你:"上海有多少个钢琴调音师?"

你没有数据,但你可以分解这个问题:

  1. 上海人口约 2500 万
  2. 平均每户 3 人 → 约 800 万户
  3. 假设 5% 的家庭有钢琴 → 40 万架钢琴
  4. 每架钢琴每年调音 1 次 → 每年 40 万次调音
  5. 一个调音师每天调 4 架,每年工作 250 天 → 每个调音师每年调 1000 架
  6. 40 万 / 1000 = 400 个钢琴调音师

这个答案可能不精确,但数量级是对的。这就是费米估计——把一个不可能直接回答的问题,分解成多个可以估计的子问题

在 Web3 中:这个新公链能吸引多少用户?→ 分解为:目标用户群 × 渗透率 × 留存率 × 活跃度。

学术定义

费米估计(Fermi Estimation)是以物理学家恩里科·费米命名的估算方法,核心思想是:

  1. 将一个复杂问题分解为多个简单的子问题
  2. 对每个子问题给出合理的估计范围(不需要精确数字)
  3. 将子问题的估计组合起来,得到最终答案
  4. 关键是数量级正确,而不是精确数字

费米估计的力量在于:即使每个子问题的估计都有误差,只要误差方向不同,它们会相互抵消,最终结果通常在正确答案的 2-3 倍范围内。

数据支撑

  • 超级预测者 vs 普通人:在费米估计问题上,超级预测者的准确率比普通人高出 40%。关键差异不在于单个子问题的估计更准确,而在于分解方式更合理——超级预测者会考虑更多相关变量。
  • 分解质量与预测准确率的相关性:特洛克发现,预测者对问题的分解质量(子问题的数量和相关性)与最终预测准确率的相关系数为 0.6——是所有因素中相关性最高的。

OPC/Web3 应用

1. 项目估值的费米分解

"这个 DeFi 协议的 TVL 能到多少?"→ 分解为:

  • 目标市场(哪些链?哪些资产?)
  • 市场份额(与同类协议的竞争格局)
  • 收益率吸引力(与无风险利率的对比)
  • 激励机制的可持续性(代币通胀率)

2. 宏观事件影响的费米估计

"美联储降息 50bp 对 BTC 的影响?"→ 分解为:

  • 降息 → 美元走弱幅度(历史平均)
  • 美元走弱 → 风险资产资金流入比例
  • 风险资产 → 加密市场资金流入比例
  • 加密市场资金流入 → BTC 价格影响(考虑市值和流动性)

3. AI 辅助费米估计

AI 可以自动提供每个子问题的历史基准数据和合理范围,帮助操作者做出更好的费米估计。例如,当操作者估计"降息 → 美元走弱幅度"时,AI 可以提供过去 10 次降息周期的美元指数变化数据。


概念五:预测的颗粒度——粗粒度 vs 细粒度

李永乐式生活化例子

两个学生预测期末考试成绩:

学生 A:"我觉得我能考好。" 学生 B:"我觉得我能考 75-85 分,最可能在 80 分左右。"

考试后,学生 A 说"我果然考好了"(不管实际考了多少分),学生 B 说"我预测 80 分,实际 78 分,误差很小"。

学生 A 的预测是"粗粒度"的——模糊到无法证伪。学生 B 的预测是"细粒度"的——具体到可以验证。

超级预测者的预测都是细粒度的。他们不会说"经济可能会衰退",而是说"2025 年美国 GDP 负增长的概率是 25%"。

学术定义

预测颗粒度是指预测的精确程度:

  • 粗粒度:"可能会涨"、"大概率会跌"——无法验证,无法复盘
  • 中粒度:"未来 3 个月上涨概率 60%"——可验证,但误差范围大
  • 细粒度:"未来 30 天内突破前高 69000 的概率是 35%"——可精确验证

特洛克发现,预测颗粒度与准确率没有直接关系,但细粒度预测者的校准度显著更高——因为他们被迫更精确地思考。

OPC/Web3 应用

1. 交易信号的颗粒度

OPC 框架要求交易信号具备最小颗粒度:

  • 不是"做多",而是"在 58000-60000 区间做多,止损 56000,目标 65000,置信度 65%,时间窗口 14 天"
  • 不是"风险高",而是"未来 7 天内出现 10% 以上跌幅的概率是 30%"

2. AI 作为颗粒度校验器

当操作者给出粗粒度预测时,AI 应该追问:

  • "你说'可能会涨'——具体概率是多少?"
  • "你说'近期'——具体时间窗口是多长?"
  • "你说'幅度可观'——具体目标价位是多少?"

概念六:团队的智慧——超级预测者如何协作

李永乐式生活化例子

一个房间里有 100 个人,让他们独立估计一头牛的重量。每个人的猜测都会有误差,但100 个人猜测的平均值,通常比 90% 的个人猜测更接近真实值——这就是"群体智慧"。

但群体智慧有一个前提:每个人必须独立判断。如果人们在猜测之前看到了别人的答案,就会被"锚定",群体智慧就失效了。

超级预测者团队的做法是:先独立分析,然后分享推理过程(不是结论),最后各自更新自己的概率估计。这比"开会讨论"有效得多。

学术定义

特洛克发现超级预测者团队的成功依赖于三个机制:

  1. 独立思考:先形成自己的判断,再参考他人
  2. 分享推理:分享"为什么这么想"而不是"我觉得是多少"
  3. 持续更新:根据他人的推理(而非结论)更新自己的概率

OPC/Web3 应用

1. OPC 团队的预测协作

如果 OPC 操作者有合作伙伴或社区,应该采用超级预测者的协作模式:

  • 每个人先独立给出概率估计
  • 然后分享推理过程和关键假设
  • 最后各自更新(不是投票取平均)

2. AI 作为"虚拟团队成员"

AI 可以在人类操作者之间充当"独立的第三视角"——它不会受到社会压力或从众心理的影响,始终基于数据给出独立的概率估计。


跨章节引用地图

引用章节

本书核心概念

概率化决策

校准训练

跨学科优势

问题分解

信号颗粒度

协作预测

持续更新

贝叶斯思维

校准

狐狸型思维

费米估计

预测颗粒度

团队协作

1.3 桥接技能:贝叶斯思维
概率化思考入门

7.9 跨学科交叉
狐狸型 vs 刺猬型

7.10 OPC框架
跨学科预测方法论

OPC/Web3 直接应用价值

应用场景书中概念OPC 实践Web3 映射章节关联
交易决策贝叶斯思维每个决策附带概率,持续更新概率化交易信号1.3
自我提升校准建立个人校准曲线,定期复盘决策日志分析1.3
投资分析狐狸型思维多学科模型交叉验证宏观+链上+情绪多维分析7.9d
项目估值费米估计分解复杂问题为可估计子问题TVL/用户/收入预估7.10
信号质量预测颗粒度细粒度概率化交易信号止损/目标/时间窗口明确7.10
团队协作独立思考+分享推理先独立判断,再分享推理过程AI 作为独立第三方视角7.10

关键引用点详解

为什么 1.3 章节引用这本书?

1.3 章节的"桥接技能4:贝叶斯思维"将本书列为入门教材。贝叶斯思维是跨学科衔接的核心工具——它不是某个学科的专属方法,而是一种通用的思维操作系统。特洛克用 20 年的实证研究证明:贝叶斯思维是可以训练的,而且训练后的准确率提升是持久的。这正是 OPC 模式所需要的——不是一次性学习,而是持续迭代的思维升级。

为什么 7.9d 章节引用这本书?

7.9d 章节讨论跨学科交叉。本书的核心贡献是用数据证明了跨学科思考者在预测任务上的系统性优势。"狐狸型"概念为 OPC 操作者的自我定位提供了理论依据——你不需要成为每个领域的顶级专家,但你需要在多个领域都有足够的理解深度,能够在不同模型之间灵活切换。

为什么 7.10 章节引用这本书?

7.10 章节的 OPC 框架将"跨学科预测"列为核心能力。本书提供了最完整的预测方法论:贝叶斯更新、校准训练、费米估计、颗粒度控制、团队协作。这些方法论不是抽象的理论,而是经过 28000 次预测验证的实操工具。OPC 框架中的"宏观叙事→交易信号"转换,本质上就是特洛克所说的"预测"——只不过预测的对象从"政治事件"变成了"市场走势"。

关联书籍网络

关联书籍关联维度交叉概念互补关系
《思考,快与慢》认知偏差系统1/系统2 vs 贝叶斯更新卡尼曼揭示预测误差的来源,特洛克提供修正方法
《反脆弱》极端事件预测的局限性特洛克承认极端事件不可预测,塔勒布提出应对策略
《长远的视角》情景规划概率预测 vs 情景分析斯瓦茨的"情景"是特洛克的"费米估计"的叙事版本
《策略思维》博弈论博弈中的策略预测迪克西特关注对手的反应,特洛克关注概率的校准
《国际经济学》宏观预测汇率/贸易预测克鲁格曼的模型是特洛克"多模型思维"的一个模型
《复杂》复杂系统涌现行为的预测米歇尔解释为什么某些系统本质上不可预测

延伸阅读路径

初级路径:从认识到实践

  1. 《超预测》(本书)— 建立预测的理论框架
  2. 《思考,快与慢》 — 理解预测误差的认知根源
  3. → 实践:建立个人决策日志,开始校准训练

中级路径:从预测到决策

  1. 《超预测》(本书)
  2. 《策略思维》 — 在博弈环境中做预测
  3. 《长远的视角》 — 用情景规划补充概率预测

高级路径:从预测到系统

  1. 《超预测》(本书)
  2. 《反脆弱》 — 当预测失效时怎么办
  3. 《复杂》 — 理解复杂系统的预测边界

参考与延伸

[1] Tetlock, P. & Gardner, D. "Superforecasting: The Art and Science of Prediction" (2015) — 本书原著,基于 IARPA 良好判断力项目的 20 年研究

[2] Tetlock, P. "Expert Political Judgment: How Good Is It? How Can We Know?" (2005) — 284 名专家、28000 次预测的原始研究,证明了刺猬型 vs 狐狸型的预测差异

[3] Kahneman, D. & Tversky, A. "On the Psychology of Prediction" (1973) — 认知偏差对预测的影响,与本书形成理论互补

[4] Silver, N. "The Signal and the Noise" (2012) — 五三八网站创始人对预测方法论的补充,侧重统计方法

[5] Good Judgment Project. "Forecasting Tournament Results" (2011-2015) — IARPA 预测竞赛的原始数据,超级预测者的准确率超过情报分析师 60%

[6] Friedman, J. "Fermi Problems and Estimation" (2017) — 费米估计方法的系统性介绍,与本书的"分解问题"方法论互补

OPC 超级个体实战指南