返回

股海弄潮

首页
关灯
护眼
字体:
第248章:处理“幸存者偏差”
上一章 目录 下一章
『章节错误,点此报送』
  那些已经消失的公司

  2011年3月15日,星期二,下午两点二十分。

  车公庙,三十平米的办公室。

  窗外的春天已经来了,但办公室里的人感觉不到。四面墙还是那四面墙,二手服务器还是那几台,墙上的流程图还是那些字。唯一的变化是,堆在角落里的资料又多了一倍。

  周寻坐在电脑前,盯着屏幕上的回测结果,眉头皱成一个“川”字。

  这已经是今天第三次跑同一个策略了。三次的结果都不一样。

  第一次:年化收益18.7%

  第二次:年化收益16.2%

  第三次:年化收益19.3%

  波动这么大,显然有问题。

  “陆方,”他喊了一声,“你过来看看这个。”

  陆方从另一台电脑前站起来,走过来。

  周寻指着屏幕上的回测结果:

  “同一个策略,参数没变,区间没变,为什么三次结果不一样?”

  陆方看了几秒,脸色变了。

  他走回自己的电脑前,调出一段代码,然后愣住了。

  “周老师,”他的声音有些发涩,“我们的回测数据里,没有包含已经退市的公司。”

  周寻愣了一下。

  “什么?”

  陆方指着屏幕:

  “我当初爬数据的时候,只爬了‘当前还存在’的公司。那些已经退市的、被借壳的、破产的……都没有。”

  他顿了顿:

  “所以回测的时候,系统只能看到现在还活着的公司。那些死掉的,从来没出现在数据里。”

  房间里安静了几秒。

  小林第一个反应过来:

  “那……那我们的回测结果,不是偏高了?”

  周寻点了点头,脸色很难看。

  “这就是‘幸存者偏差’。”

  他走到白板前,拿起笔,写下几个字:

  幸存者偏差

  “只看到活下来的,看不到死掉的。看到的都是成功案例,看不到失败案例。用这样的数据做回测,结果一定是偏乐观的。”

  他转过身,看着所有人:

  “你们想想,如果我们的策略,恰好喜欢选那些后来死掉的公司——但在回测数据里,那些公司根本不存在,那回测会显示什么?”

  小林脱口而出:

  “会显示这个策略很好,因为选的都是活下来的……”

  “对。”周寻说,“但实盘呢?实盘里那些公司还在,选了它们,就会亏钱。”

  陈默从角落里站起来,走到白板前。

  他看着那四个字,沉默了几秒。

  然后他问:

  “这个问题,有多大?”

  周寻想了想:

  “可能很大。具体多大,要看我们的策略偏好。”

  他走到电脑前,调出一张图:

  “这是A股过去十年的退市数据。2001年到2010年,一共有多少家公司退市?”

  他敲了几下键盘。

  屏幕上跳出一个数字:

  187家

  “187家。”周寻说,“平均每年18.7家。这些公司,在我们的数据里,一个都没有。”

  他顿了顿:

  “如果我们的策略,恰好偏好那些后来退市的公司——比如喜欢炒垃圾股、炒ST股——那回测结果和实盘结果的差距,会大得惊人。”

  陈默盯着那个数字。

  (本章未完,请点击下一页继续阅读)
第248章:处理“幸存者偏差”(1/3).继续阅读
《 加入书签,方便阅读 》
上一章 目录 下一章