为什么我们没有预计到这次新冠病毒的爆发,哪出了错?
Future imperfect: Forecaster discusses where we went wrong with predicting this pandemic
来源: 大中报 紫馨
(大中报/096.ca讯)加拿大环球邮报日前发表了一篇专栏作家TREVOR COLE采访Philip Tetlock的文章。随着我们生活的时代越来越令人担忧,大家都在展望未来,想知道未来会发生什么?不管是那些通过模型来预测的专家还是随机的猜测得普通人, 几十年来Philip Tetlock教授的工作重点就是: 如何做预测, 如何做得更好。
Philip Tetlock博士出生于多伦多。15年前,当他还是加州大学伯克利分校(University of California,Berkeley)的教授时,他为读者出版了他的第一本书《专家的政治判断:有多好?我们怎么知道?》(Expert Political Judgement: How Good is it? How Can We Know?)。这项对预测专家的研究表明,所谓的专家在预测政治和经济趋势方面比随机的猜测好不了多少。十年后,他与记者Dan Gardner合作出版了《超级预测:预见未来的艺术与科学》(Superforecasting: The Art and Science of Prediction)一书,该书研究了Tetlock博士利用大规模预测比赛来研究和衡量参与者的预测能力。现在他是费城沃顿商学院的一名教授,Tetlock博士坚持认为他在预测未来可能发生的事情方面并不比任何人都强。他所知道的是如何提高我们的预测技能,以及如何使用这些预测,以便在未来的日子里,我们可以更好地预测未来。
今天你也许关心的话题:
2020年全球新闻自由新排行榜出台:挪威居首,中国倒数第四
加拿大两架物资运输机空手而归
美国华人购枪热背后的潜在力量
想要阅读与本文有关的话题?请点击本文末的链接!
TREVOR COLE问:大多数人对预测有什么错误的认识?
Philip Tetlock答:人们经常遇到的错误是没有意识到做预测的频率。我们经常说,“嗯,这可能会发生。如果你仔细分析一份严肃的报纸或杂志上的一个专栏,你会发现人们经常用“可能”、“也许”和“大概”这样的字眼来表示未来可能如何发展。这些都是隐含的发生概率说法。如果我说,“普京的下一步行动可能是在爱沙尼亚”,读者通常不确定如何将其转化为一个概率范围。“Tetlock说的可能是什么意思?” Tetlock并不是说它发生的概率是100%,也不是说它发生的概率是0%。他说的是在这个范围之间。那么这个范围有多宽?可能在20%到80%之间。所以,你如果做这些逐字逐句的转化练习,你就会可以发现预测是多么的模糊,以及它会导致多么的严重的误解。
问:你学习和训练“超级预测者”。什么使超级预测者这么厉害?
答:这是将预测视为一种可以培养的技能的意愿,从模糊的措辞转变为数字,如果想成为大师,就必须耐心从经验中学习。当你预测错误时,你也愿意承认。
问:你最近听说COVID-19疫情是“从武汉到华盛顿再到里约热内卢所发生的惊人的预测失败的产物”,出了什么问题?
答:那是一个很长的故事。2007年,记者David Epstein在《奇妙丛书》(the wonderful book Range)一书中引用了这样一句绝妙的话:“蝙蝠体内存在大量非典冠状病毒,加上食用山珍野味的文化,是一颗定时炸弹。”我的意思是,这简直是不能更清楚的警告声明。
问:我们的社会怎么会忽视这样一个有见识的预测?
答:这是一个长期的低概率事件。你每年都在掷骰子,而且每年都有很低的概率发生严重的流行病。假设骰子已经设置好了,那么在任何一年里,一场可怕的疫情流行出现的概率可能是3%或5%。流行病学家说,“嘿,小心点。”什么也没发生。第二年,“嘿,小心点。”什么都没发生。人们自然而然就会忽视这个声音,如同“狼来了”的故事一样。所以,人们很难应对低概率的风险。
问:现在,大多数政府和科学家都要求我们“倾听专家的意见”,你的工作在某种程度上提供了一种替代专家的方法?这种说法对吗
答:你说得真有意思。我再写《超级预测》那本书之前写的《专家的政治判断》(Expert Political Evaluation)一书,我特别提到以政治经济专家为代表的精通某一领域专家往往对自己对未来的认识过于自信。我认为精通某一领域专家是必不可少的。但我认为,他们在公开论坛上的言论需要更加谨慎。当他们提出某一论断时,需要考虑到他们的专业责任,他们的论断需要尽可能的可测试和可评估。
问:你是说人们应该根据他们的预测来生死吗?
答:不管生死。你是不是觉得有点残忍吗?
问:是的,是有一点。
答:我认为你确切指出问题的所在。如果你生活在一种把责任推给别人(blame-game)文化中,人们总是在玩一种“逮住你”的游戏,而你恰巧站在错误的一边,我会说,“你根本不是专家。”如果我生活在那样一个世界中,作为精通某一领域专家,我自然会为求自保而提供措辞模糊的预测。如果你所处的文化中,人们认为声誉大于一切,为了自保他们通常不会做出一些超常规的预测,或者做出理性判断。他们会像躲避瘟疫一样躲避此类预测,因为这简直就是是断送职业生涯。
问:所以,你是说要为了让人们提高预测能力,我们必须让他们先犯错。
答:当然。听起来很有趣,因为我确实相信责任,但我也相信心理安全。
问:那么,什么阻碍了准确预测呢?
答:有些只是植根于人类发展初期的思维。我们从新闻中过早得出结论。我们无法对新出的信息做出及时的反应。人们喜欢推卸责任,回避自己预测的责任,每当他们作出的预测看起来是有问题的时候,他们就悄然站在另一边。所以,这是人类思维和奖惩激励的结合造成预测难以积极开放。
问:在你的预测比赛中会发生什么?
答:关键是这是一个关于公平竞争的练习。因此,25岁的分析师可以与65岁的分析师同台竞争,回答同样的问题。所以,我们得看看谁能更快地准确预测结果。所以这是精英占统治地位的游戏。这不像通常的职业等级。
问:需要回答多少问题?
答:你想要多少就多少。通常是几百。
问:你如何衡量他们的结果?
答:好吧,这是其中一个棘手的问题。来自fivethirtyeight.com网站的Nate Silver遇到了这样一个问题:你如何衡量概率判断的准确性?Nate Silve是一位民意调查者。在2016年11月总统大选前几天,他汇总了所有的民意调查,并做出了深思熟虑的判断。他说,他认为希拉里赢得选举的可能性约为70%,川普获胜的可能性约为30%。现在,我们都知道发生了什么。30%的可能性实现了, Silve不得不解释为什么川普获胜并不一定意味着他汇总民调的方法是错误的。因为30%的事情发生在30%的时间里。你需要看看所有的预测, Silve分配了70%的概率。如果Silve说事情发生的可能性是70%,那么这些事情发生的几率是70%,这就说明Silve的结果校准了。为了概率的准确性,你需要评估很多判断的准确性,而不仅仅是一个。
问:有人能被训练成为一个更好的预测者吗?
答:这就是我们在预测比赛中所做的。我们已经开发了训练系统,确实可以将真实世界事件主观概率判断的准确性提高10%到15%。如果你真的想从超级预测者那里得到最好的结果,你需要创建一个加权平均值。如果你有一群预测者,你对他们的预测进行平均化,那么这个平均值往往比大多数预测者更准确,他们的判断是计算平均值的输入。如果你作为一个政策制定者的目标是得到最好的概率估计,那么你最好不要只听一个预测者的话。你最好听听一群来自不同政治观点的预测者的意见,然后把他们平均化。你看过电影《零度黑暗三十》吗?
问:是的,关于杀死本拉登。
答:是的。在这部电影中,中情局局长有一群分析师围坐在桌旁,他问他们拉登是否在Abbottabad的那个特别的院落里。现在,假设他绕着桌子问每个分析师,他在那里或不在那里的可能性有多大。他们都说,“70%”。 局长应该得出什么结论,拉登在大院里的真实可能性?大多数人认为这是个愚蠢的问题,因为答案必须是70%,对吧?但这里有一个微妙之处,这是超预测最重要的原则之一。如果且仅当在座的分析师是彼此的克隆人,并且他们利用完全相同的信息得出相同的结论,那么局长应该得出答案是70%。但如果其中一位分析师利用的是网络情报,另一位则是破译密码,另一位则是人类情报——他们掌握着各种不同的信息,独立得出的结论都是70%。局长应该得到什么结论呢?我们的数学模型得出高达80%或85%。这实际上是非常有可能的。
问:有没有一种方法可以让一家希望改善盈利前景的公司运用超预测的概念来实现这一目标?以往这一目标通常由经济分析师完成的。
答:我确实与一些公司和企业合作,我认为答案是肯定的。
问:你能给我们简单介绍一下吗?
答:不要害怕破坏陈旧的等级制度。有些公司的首席执行官不想让人们知道,
邮件收发室里的普通人在预测某些趋势方面可以做得和首席执行官一样好。这和情报界的问题是一样的,高级分析员不希望被发现初级分析员能做得一样尽善尽美。陈旧的等级制度使庞大组织在流动的业务时代变得更加难以灵活,就像现在这样。
问:那么,得到各种信息的公司更有可能成功?
答:这就是他们获取信息的方式。他们需要以一种受过训练的方式收集信息,不管谁被冒犯,都要鼓励说真话。这是一件很难完成的事。你必须为它创造一个合适的氛围。
问:当我想到预测和商业时,我有时会想到比尔盖茨,他似乎多年来做了很多正确的事情。例如,他期待着iPhone这样的产品,虽然他从来没做过。如何将预测与实际行动联系起来?
答:我认为,负责任的社会科学顾问所能做的最好的事情就是陈述事实。他们不能保证政客们会明智地根据事实行事。他们也不能保证首席执行官们会明智地根据事实行事。好的预测不能代替好的决策。这只是一个良好决策的建议。
网友评论
网友评论仅供其表达个人看法,并不表明大中资讯网立场。评论不可涉及非法、粗俗、猥亵、歧视,或令人反感的内容,本网站有权删除相关内容。