塔勒布斯金纳的鸽子、塔勒布的出租车和饶胖的喜鹊

导言:人们将噪声误认为信号的行为,在统计学上被称为「过度拟合」(overfit)。人类大脑的工作方式是捕捉规律,并且预测。一般来讲,智商高的人的神经网络学习能力更强,这意味着他捕捉规律的能力也越强。捕捉规律能力强意味着对于很少的样本中隐含的
原标题:斯金纳的鸽子、塔勒布的出租车和饶胖的喜鹊导言:人们将噪声误认为信号的行为,在统计学上被称为「过度拟合」(overfit)。人类大脑的工作方式是捕捉规律,并且预测。一般来讲,智商高的人的神经网络学习能力更强,这意味着他捕捉规律的能力也越强。捕捉规律能力强意味着对于很少的样本中隐含的不明显的「规律」他们也能捕捉出来。但从很少的样本或噪声过多的样本中总结出「规律」来是极为危险的事——自然界的运行很多时候并没有确定的规律,我们带着一双为了发现规律的眼睛去挖掘总结出了规律,结果却聪明反被聪明误了。本文来自饶叫兽说资本,作者饶胖,有关产业、金融的更多精彩内容,欢迎点击此处,一、我和喜鹊几年前,我去埃及旅游,其中一站是在红海之滨的一个度假酒店,住的房间是一楼,面对的是一个漂亮的花园,第二天早上我拉开窗帘,阳光稀疏地洒在精心修剪过的树丛上,突然我叫了起来,“快来看!”我太太赶紧跑过来问,“什么什么?”“你看,喜鹊,喜鹊!”我指着窗前草地上两只正在觅食的小鸟叫道。太太很失望地看了看我,喜鹊有什么好大惊小怪的。是的,对于太太而言,喜鹊不过是一种长得不怎么样的鸟类,尽管是在埃及,它们的长相与中国的亲戚也差不太多。但是,对于我却是不一样。记得,那一年,在高考前几天,复习了几个小时以后,妈妈叫我休息一下眼睛,妈妈陪我站在阳台上,那个年代,高考是我们唯一改变命运的机会,我很辛苦也很紧张,妈妈也很紧张也很忧虑,突然,我指着前面说到:“妈妈,你看,喜鹊!”顺着手指,两只小小的喜鹊站在对面的电线上,背是深灰,肚子是白色的,一双长长的剪刀式的长尾一上一下的扑闪着。妈妈拍手笑道:“好兆头啊,你今年高考一定能考好。”公布分数的那一天,我又在我们家门口电线上看见了2只喜鹊,分数出来,相当不错,全家人都舒了一口气。从那以后,我一旦看到喜鹊,总是会很开心,觉着有好事要来了。二、斯金纳的鸽子20世纪40年代,哈佛大学心理学家斯金纳(B.F.Skinner)做过一系列著名的实验,在关老鼠和鸽子的笼子里设置一个喂食开关,通过观察研究低等动物形成因果关联的过程。1948年,斯金纳想到一个点子,不再关注控制开关,而是把注意力放在食物供应上,他以完全随机的方式送食物给非常饥饿的鸽子。随后他观察到鸽子出现了相当惊人的行为,鸽子发展出极其复杂,有如祈雨舞蹈般的行为。有只鸽子会对着笼中特定的一角有规律地摇头,另外一只鸽子会以逆时针方向转头。几乎每只鸽子都发展出了一种与喂食联结起来的特别仪式,慢慢固定到它们的心里。从斯金纳教授的实验,我们看出,即使是鸽子,在随机送来的食物面前,也会发展出一种自信的因果关系。从我们的角度,食物完全是随机送的,或者依据喂养者的心情,也就是喂养者的意志。但是从鸽子的角度看,它完全不能观察到饲养者的“真实”模式,它唯一知道的是食物来了,而在食物来了之前,它做了些什么事情,例如正好它对着笼子的某个角落摇头,或许它又做了这样的动作,碰巧食物又送来了,它就观察到和领会到了一种规律,一种因果关系,它只要做这个动作,食物就会来。特定的舞蹈,对鸽子来说是食物。看见喜鹊,对我来说就是好事,就这么简单。三、塔勒布的出租车塔勒布在《随机漫步的傻瓜》中讲了一个他自己的故事。塔勒布刚到纽约做交易员是在瑞士第一波士顿,位于纽约52街和53街,麦迪逊大道和公园大道中间。每天早上塔勒布都是坐出租车上班,毕竟是交易员,虽然初入行也是有钱人。陈丹青曾经说过:在纽约,除非是你钱多叫得起出租,否则第一件事就要学会坐地铁。塔勒布每天坐出租是在公园大道和53街交叉口下车进公司正门。有一天,不幸,塔勒布补充道应该是很幸运,搭上了一个刚来纽约的新移民司机,不太听得懂英语,结果走错了路,兜了圈子,只好在公司位于52街的后门下了车。那一天,由于汇率剧烈波动,塔勒布的投资组合大赚一笔,塔勒布回忆说:“那是我年轻时最美好的一天。”隔了一天,一如往常,塔勒布在家门口挥手招出租车,前一天那个不会英语的哥们已经不见踪影,或许已经被驱逐回老家。可是塔勒布脑子里有个无法解释的念头,想要感谢他对自己做的好事,还想塞一大笔小费给他。上车以后,塔勒布告诉司机,载到52街的公司后门,也就是前一天塔勒布下错车的地方。塔勒布说:“我对自己说出这样的话惊讶不已。。。在公司电梯里,看着镜子里的自己,赫然发现我还打着昨天那条上面粘着咖啡污渍的领带,我体内显然有另外一个我,显然那个我相信,从这个门进入公司,打这条领带以及那个不见踪影的司机大哥,与前一天的市场走势有强烈的因果关系。。。我觉着自己是个假道学,一方面,我的谈吐像是具有明确科学标准,一个期权方面的专家,冷静的概率计算者,理性的交易员。另一方面我和其他那些交易员没什么两样,依然抱着盲目的迷信不放。”不管是不是迷信,因果联系是我们人类认识、理解、解释和预测这个世界的方式,只是有时候真是因果关系,例如自然科学,有的时候只是我们对这个世界因果关系的错觉,犹如天亮的时候鸡叫了,从我们的角度,天亮是因,鸡叫是果,如果鸡有智慧,从它的角度,也是鸡叫才是因。我的喜鹊、塔勒布的出租车、鸽子的舞蹈,我们很容易意识到,这不过是迷信的一种形式,当然,有点小信仰不是什么坏事,在这个未知世界中找到自己小确幸是一种幸福的事情,管不管用暂时放一边,塔勒布说:“迷信能在日常生活中注入一些诗意。”四、过度拟合如果,我们观察到的不再是我们心里自己明白的小迷信,而是统计显著性,这个因果关系就靠得住吗?塔勒布说:“人们认为具有统计显著性之后,一定存在因果关系,也就是说市场中发生事情,可以和某些原因扯上关系。有句话:若后者发生,必然是前者的结果。”对于这个结论,塔勒布举了个反例:“假设,统计显示,医院A接生的婴儿有52%是男孩,医院B接生的婴儿有48%的男孩,难道你会说,你之所以生下男孩,是因为在医院A生的?”具有统计显著性的现象,还有一个陷阱,就是过度拟合。有些信号是因,有些只是不相关的噪声,我们从信号里能找出因果,从噪声里也能,只是绝大多数时候,没有一个人或者有一个全知全能的上帝能事先告诉我们,哪些是噪声,哪些是信号。拟合是指模型与过去观测结果吻合的程度,你一定会说,拟合程度越好不是模型越好吗?这可不一定,因为拟合完美,也可能只是你把那些噪声也都囊括到你的模型里了,此时的模型还有什么价值?在统计学中,将噪声误认为是信号的行为被称为过度拟合。换句话说,我们总能在随机序列里找到我们认为的规律,只要数据/参数足够多,我们总能在数据里找到满足统计显著性的模型。冯.诺伊曼说:“我用4个参数就能拟合出大象,用5个参数就可以让这头大象甩动鼻子。”特纳.西尔弗在《信号与噪声中》举了一个过度拟合的例子:如果我们不知道理想的数据模型,也就是我们不知道数据背后真实的规律或者因果关系,这是真实世界的正常情况,只有在我们上统计课的时候,我们被事先给定了一个理想模型。在现实世界中,我们获得数据通常是不完整,也不知道那些是信号那些是噪声。如下图:面对上述数据,西尔弗设计了一个复杂的函数,可以追踪到每一个边缘数据点,用这个函数将这些点连接起来。如下图中实线:曲线的上下波动陡然增强,其实,这个例子西尔弗设计的本是上图中的虚线,就是一条抛物线。看起来,我们拟合的越好,离“真实”的模型距离越远。不过要留意的是,在现实的世界中,并没有一个“真实”模型在事前或者事后给与我们。西尔弗说:“这些错误常影响我们,让我们更容易被随机性愚弄。我们也可能越来越迷恋这种模型的特质,甚至会创造出一个貌似很有说服力的理论来证明这些错误的合理性,自己却没有意识到这一点。”塔勒布说:“因果关系可能非常复杂,如果有许多可能的原因存在,就很难单独挑一个出来作为原因。”五、为什么我们要何合作?十几年前,我和几个朋友搞了一家FA公司,其中有一个合伙人是一个非常漂亮和优雅的女孩子,我倒没怎么在意,当然不是说我有强哥的毛病,只是在几个合伙人中我只是负责干技术活的,打单接单谈判这些都是他们的事。直到有一次,客户是一个美国回来的中年油腻秃顶大肚博士,私下里问我:“你哪里找来这么漂亮的女人做合伙人?”至今我还能清楚记得,他说这话的时候,嘴角欲滴口水的猥琐表情。不过,这倒是让我好奇了这个问题,这个圈子里,技术好的壮劳力有的是,为什么选我做合伙人,我有一次就半开玩笑地问她,她笑笑说:“我们两个很好的。”我一时没明白。她接着说:“你属羊,我属狗,羊和狗很好的。”嗯嗯!这也是一种因果关系。六、塔利班和水井电影《威士忌、探戈、狐步舞》改编自曾前往阿富汗的前《芝加哥论坛报》女记者KimBarker的自传《混乱塔利班》。电影讲述一个美国记者被派往阿富汗首都喀布尔,在那里记录战时美国军队和当地平民的生活,充满了荒诞的故事。其中一个故事,2003年,Kim经常随一队海军战队巡逻,当时已经击败塔利班,海军陆战队的主要任务是维持军事存在的同时帮助当地村民做一些事情,搞搞社区建设。这帮美国大兵在这个村子的主要成就是帮助村民打了一口水井,这样村民们就不用步行很远到河边去取水。结果每次他们再到这个村子就会发现水井已经炸毁了,太可恨了,海军陆战队判断是塔利班干的,因为塔利班是美军的敌人,他们不希望村民们感激美军与美军合作,破坏美军修建的公共设施是自然的,村民也说塔利班有时候晚上会来。士兵们修复了水井,但是士兵们不能驻扎在村里守护水井,结果是下次又会发现水井再次被破坏,如是者三五次,大兵们很烦恼,这些塔利班太坏了。后来有一次,Kim和村里的女人们聊了一下,发现,不是塔利班炸毁的水井,而是村里的女人们炸毁的水井,而且希望Kim转告海军陆战队不要再修复水井了。海军陆战队的将军听了非常惊讶说:“我们修水井就是为了方便女人,他们要步行很久去河边打水。”Kim说:“那些女人说去河边打水是他们一天中难得的社交八卦时间,他们不想因为水井失去这段快乐的娱乐时光,并且希望不要把这事告诉村里的男人们。”塔勒布在《随机漫步的傻瓜》一书中就因果错觉总结道:“深入探讨这个问题,着实令人忧虑。我们生来不会把不同的事情独立开来看待。观察A和B两个事件时,我们很难不假定A造成了B,或者B造成了A,或者两者彼此影响,我们的(认知)偏差会立即在其间建立因果关系。”责任编辑:

本文来自投稿,不代表长河网立场,转载请注明出处: http://www.changhe99.com/a/j2rkX39mwZ.html

(0)

相关推荐