华泰证券-华泰人工智能系列之十五:人工智能选股之卷积神经网络-190213

《华泰证券-华泰人工智能系列之十五:人工智能选股之卷积神经网络-190213(21页).pdf》由会员分享,可在线阅读,更多相关《华泰证券-华泰人工智能系列之十五:人工智能选股之卷积神经网络-190213(21页).pdf(21页精品完整版)》请在悟空智库报告文库上搜索。
卷积神经网络引领深度学习的发展,能够运用于多因子选股
卷积神经网络(CNN)是目前最为成熟的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一,其主要特点是通过卷积和池化操作进行自动的特征提取和特征降维。本文首先通过原理分析给出了CNN 运用于多因子选股的经验方法;然后在全A 股票池内对CNN 的预测结果进行单因子测试,其单因子测试结果相比对比模型具有良好表现;本文还构建了行业、市值中性全A 选股策略并进行回测,CNN 在以中证500 为基准的全A 选股测试中相比对比模型表现优秀。
本文通过原理分析总结了卷积神经网络运用于多因子选股的经验方法
将卷积神经网络运用于多因子选股时,通过分析其工作原理,我们总结出以下经验:(1)股票因子数据可以组织成二维的“图片”形式,这使得CNN具有了时间序列学习的能力。(2)当卷积核作用于股票因子数据时,本质上是在进行因子合成,因此本文只使用了一层卷积层。(3)池化层是对因子数据的“模糊化”,这对体现因子的明确意义是不利的,因此本文未使用池化层。(4)因子数据在“图片”中的排列顺序会影响到CNN 的学习结果。
卷积神经网络合成因子的单因子测试具有良好表现
我们构建了卷积神经网络、全连接神经网络、线性回归三个模型,在2011-01-31 至2019-1-31 的回测区间中分年度进行训练和测试,样本空间为全A 股。从单因子测试的角度来看,CNN 合成因子的RankIC 均值为13.62%,因子收益率均值为1.021%,略高于全连接神经网络,也要高于线性回归。在分五层测试中,CNN 合成因子的TOP 组合年化收益率为20.05%,夏普比率为0.72,信息比率为4.04,多空组合的夏普比率为4.84,表现都要优于全连接神经网络和线性回归。
卷积神经网络在以中证500 为基准的全A 选股测试中表现优秀
基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全A 选股策略并进行回测。在2011-01-31 至2019-1-31 的回测区间中,当以沪深300 为基准时,两种神经网络在年化超额收益率、信息比率和Calmar 比率上的表现都不如线性回归。当以中证500 为基准时,CNN的年化超额收益在13.69%~16.38% 之间, 超额收益最大回撤在4.80%~7.55%之间,信息比率在2.29~2.56 之间,Calmer 比率在2.16~2.85之间,CNN 在以上各项指标上的表现都优于另外两个模型,全连接神经网络略优于线性回归。
卷积神经网络仍有进一步研究的空间
随着ImageNet 旗下的大规模视觉识别挑战赛(ILSVRC)连续数年的推动,卷积神经网络正在日新月异地进步中,还有诸多技术值得我们学习和尝试,例如增大训练样本数量的“数据增强”方法;ResNet 中的残差学习方法;Inception 网络中的多种尺寸卷积核混合的方法等等。此外,在高频、海量的金融数据中使用CNN 也是一个值得尝试的方向。
风险提示:通过卷积神经网络构建的选股策略是历史经验的总结,存在失效的可能。卷积神经网络模型可解释程度较低,使用须谨慎。