解读量化投资中的常见误区


从06年开始进入股市已经快10年了,也做了快10年的量化投资,作为一个非专业人士,从一开始懵懵懂懂的不自觉的用了量化模型还不知道自己是在用量化投资开始,几乎所有初学者犯过的错误我都犯过。正好下周有个量化投资的采访,在采访前先把这些误区拿出来晒给大家:

误区一:原始数据过少。毕竟有不少原始数据和价格之间是没有直接的关系的,数据过少会导致结果有较大的偏差。一般来说,原始数据至少要经历过一个牛熊周期。如果你在牛市里收集的数据来优化的,往往到了熊市一败涂地;而仅仅在熊市里收集的数据优化的,到了牛市就显得过于保守。我自己10年里面惟一一年跑输大盘的就是09年,虽然这一年也赚了不少,但受08年大熊的影响,量化投资采取了非常保守的策略,才会在09年严重跑输大盘。如果真的觉得原始数据过少,比如在10年刚刚出来创业板,当时的数据肯定非常少,用来做量化是远远不够的,但可以慢慢积累数据,同时对于这些可靠性不强的模型,可以用模拟盘监控或者非常小的仓位参与。

误区二:用了未来函数,也就是说用未来获得的信息对现在的收益率产生了影响。我见过最多的量化模型里误用未来函数的就是用当天的收盘价对当天选择的品种产生影响,那当然是巨高无比的收益率啊,你能知道当天的收盘价,那这个世界上的财富都是你的了。另外最常见的是用下一年一季度公布的年报里的数据放到当年、分红到帐日和分红除息日混淆等等。避免的方法只有对你优化的标的加上理解,慢慢熟悉后才能避免,即使像我做了近10年的量化,都不敢说100%避免使用未来函数,只是可能bug少一些而已。

误区三:不注意当时的一些边界条件。最典型的是跌停,初学者很容易犯的毛病,回测的时候不考虑买不进,跌停卖不出。回撤的结果巨高无比,实盘一做就不行了。还有类似的停牌也是需要考虑的。

误区四:过度优化 初学者最容易犯的毛病,可变参数用的越多,优化后得到的年化收益率越高,越容易过度优化,过度优化好比做了一件非常贴身的西服,穿在这个人身上还不错,但只要换一个人马上就穿不下。往往过度优化后实盘和模型的差异非常大,最后导致否认模型。建议的办法是一方面不要过多的参数来优化模型,另一方面可以采取这样的办法,比如说现在有07年到16年10年的数据,你可以先去掉16年的数据,就“假装”回到了15年然后优化模型,再把16年的数据放到模型中去看看是否有效,如果效果非常差的,十有八九就是过度优化了。当然这只是我的经验之谈。

误区五:试图每月每周甚至每天都能战胜参照指数 上面误区四说了“假装”回到15年去看16年的情况,这里也要注意一个问题,就是再好的模型都不能保证每个月都战胜指数,甚至某一年战胜不了都是很正常的事情。初学者跟踪了某个模型后最多的问题就是,为什么今天会跑输?为什么这个月也跑输了?我可以很负责的告诉大家,我做了快10年的量化,我就从来没有遇到过一年里每个月都能跑赢参照指数的系统,将来随着散户的慢慢退出更加不可能有。

误区六:量化投资就是对冲。说实在,国外量化投资做对冲的非常多,但在国内因为一是做空品种少,无法做到完全对冲活大部分对冲,在A股上对冲效果不好,有一些类似熊宝的产品又不是场内的而且交易量也不大并且经常偏差较大,而且现在的政策也限制做空。所以我在A股市场里的模型只用概率和负相关品种而没有用对冲。当然如果是商品市场、外币市场等又是另外一码事情了,我们这里讨论的范围仅仅限于A股市场而且绝大部分小散可以做的事情。

误区七:量化投资就是高频交易 应该这样说,大部分高频交易都是量化交易,而量化交易不仅仅是高频交易,我自己因为前几年工作很忙,没有用过日线外的任何数据,交易模型也仅仅是平均一周交易一次,但依然可以获得很好的效果。

误区七:量化一定要用高大上的工具 现在主流的量化工具是Matlab、Python等。当然除此之外还有一些工具也是可以用到量化中的。

第一种:用专用的工具如Matlab、Python。打个比方,就好像机关木仓,熟悉了后效率非常高,但木仓械相对复杂,而且扫射可能有死角。

第二种:就是我现在在用的用了十年的excel,非常土,但好比一把小手木仓,因为方便,随身带着,拿出来就可以打,但可能打不远。

第三种:以flitter为代表,编写了专用的软件,动用了四台服务器,算一次化很长时间,但能找到一个最佳值。好比是狙击木仓,一次狙击要花上很长时间,要有耐心,但好的狙击手是一木仓制胜。

不管你用什么木仓,能打死敌人就是好木仓,而且现在在国内这个大刀长矛时代,有一把木仓就足够你横行江湖了。(作者:持有封基)


股票资讯网

解读量化投资中的常见误区


分享

财经股票快讯