上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

机器学习择时系列之三:LSTM模型市场择时策略-210909(14页).pdf

编号:61931 PDF 14页 2.70MB 下载积分:VIP专享
下载报告请您先登录!

机器学习择时系列之三:LSTM模型市场择时策略-210909(14页).pdf

1、 请仔细阅读在本报告尾部的重要法律声明 1 LSTM 模型市场择时策略 机器学习择时系列之三 投资要点投资要点: : 量化择时交易量化择时交易策略策略 机器学习量化交易策略的制定,是通过从海量历史数据中,利用计算机强大的处理能力,挖掘并分析出那些能够为投资者带来收益的各种大概率可行的投资方式来实现的。通过数学模型对这些策略进行分析并加以验证,以期望让投资者获得更高更稳定的收益,或更合理地规避风险。 长短期记忆长短期记忆模型模型通过记忆单元有效地学习长期依赖通过记忆单元有效地学习长期依赖关系,在金融市场预测中具有明显优势关系,在金融市场预测中具有明显优势 长短期记忆网络是人工神经网络的一种,具有

2、负责计算时间序列中各个观测值之间依赖性的能力,同时具有快速适应趋势中急剧变化的固有能力。所以,长短期记忆模型可以在波动的时间序列中很好地工作。在处理股票价格这样的时间序列数据时,此模型具有明显的优势。 基于基于长短期记忆长短期记忆模型的择时策略具有高收益,高模型的择时策略具有高收益,高夏普比率,低夏普比率,低回撤率等特点回撤率等特点 长短期记忆网络可以通过记忆单元有效地学习时间序列中的长期依赖关系,对股票市场变化趋势有着较高的拟合度。所以可以根据模型对股票收益的预测结果来决定交易行为。对沪深 300 指数的回测结果表明模型具有高收益,高胜率,高夏普比率,低回撤率等优点。 基于基于长短期记忆长短

3、期记忆模型择时在风险和收益两个维度模型择时在风险和收益两个维度有着很好的表现有着很好的表现 利用长短期记忆网络构建股票收益预测模型,根据预测结果决定交易行为。通过在沪深 300 上的回测表明模型具有高收益,高胜率,高夏普比率,低回撤率的优点。 风险提示风险提示 模型基于对历史数据统计,仅作为投资参考。 评级及分析师信息 证券研究报告|量化研究报告 仅供机构投资者使用 Table_Date 2021 年 09 月 09 日 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 2 正文目录 1. 长短期记忆模型基本理论. 4 1.1. 长短期记忆模型的定义 . 4 1.1.1.循环神

4、经网络 . 4 1.1.2.长短期记忆模型. 4 1.2. 长短期记忆模型的学习过程 . 5 1.2.1.正向传播 . 5 1.2.2.反向传播 . 5 1.3. 小结 . 6 2. 长短期记忆模型的择时建模 . 6 2.1. 模型合理性的讨论 . 7 2.2. 模型优缺点的讨论 . 7 2.3. 策略设计思路 . 8 2.3.1. 建模方法 . 8 2.3.2. 预测方法 . 8 2.3.3. 数据及参数选择 . 8 2.4. 策略具体过程及回测分析 . 10 2.4.1. 长短期记忆模型的优化 .10 2.4.2. 3:2 的数据划分训练模式分析.12 2.4.3. 窗长窗移滚动训练模式分

5、析 .12 2.5. 择时策略讨论 . 13 3. 总结.14 4. 风险提示 .14 dV8VzWgVmUcXyXrQpOrR6MdN8OtRpPpNpNeRmMpMfQnNoPbRrQmMuOoNtRNZpOvM 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 3 图目录 图 1 持仓时间平均收益率 . 10 图 2 5 日平均收益率 . 10 图 3 5 日和持仓期的平均成交量之比 . 10 图 4 持仓时间长度内夏普比率 . 10 图 5 数据划分训练模式累计收益 . 13 图 6 窗长窗移训练模式累计收益 . 13 图 7 数据划分训练模式累计超额收益率 . 13

6、图 8 窗长窗移训练模式累计超额收益率 . 13 表目录 表 1 3 个特征变量 1 个响应变量及其含义 . 9 表 2 长短期记忆网络层数对回测结果的影响 . 11 表 3 训练批次对回测结果的影响 . 11 表 4 长短期记忆网络层神经元个数对回测结果的影响 . 11 表 5 两种训练方式结果对比 . 12 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 4 1.1.长短期记忆模型长短期记忆模型基本理论基本理论 长短期记忆模型(Long Short-Term Memory, LSTM),是一种特殊的循环神经网络,能够学习长期依赖性。长短期记忆模型在各种各样的问题上表现非常

7、出色,现在被广泛使用,例如,文本生成、机器翻译、语音识别、时序数据预测、生成图像描述和视频标记等。这一节我们主要介绍长短期记忆模型的基本理论,包括模型定义和算法。 1.1.1.1.长短长短期期记忆模型的定义记忆模型的定义 1.1.1.1.1.1.循环神经循环神经网络网络 循环神经网络将时间的概念引入了模型中,在循环神经网络中,每个节点都是一个循环单元,循环结构的加入使得网络的层之间相连,并且是全连接的形式,每一层的节点之间也是互相连接的,网络会按照时序关系对输入及反馈的信息进行处理,即当前时刻节点的输出是由当前时刻的输入以及前一时刻的反馈共同决定的,此反馈也可称为状态或记忆。将循环单元的结构按

8、照时间顺序展开,可知此类链式结构十分适合处理时序数据。 正如其它神经网络,循环神经网络的学习同样分为前向传播以及反向传播。 (1)前向传播 t 时刻的输出由 t-1 时刻的状态和时刻的输入共同计算而得,则 t 时刻的状态:= (+1+),其中()为激活函数,U、V 均为权重且不同时刻同类型的权值是共享的,不随时间变化而产生变动,为偏置。则时刻的输出为:=+ ,其中 W 也为权重,取值规则与 U、V 相同,c 也为偏置。则最终模型预测的输出为: = ()。 (2)反向传播 损失函数的计算公式为:= ,其中,L 为 t 时刻的损失值,为 t 时刻的实际值。 反向传播就是为了使损失函数最小化,随着时

9、间以需要优化的参数的负梯度方向为准来计算累计残差的过程,最终直至损失收敛,而需要优化的参数是指 U、V 和 W。 循环神经网络加入的循环结构使得模型较之传统神经网络更为复杂,却增加了其灵活度和适应性,提高了特征学习的能力,也使得模型解决了传统神经网络难以处理时序数据的问题,同时共享的权重参数也一定程度上降低了因循环结构而增加的模型复杂度,减少了计算量,使之在理论上可以处理任意长度的时序数据问题。但是在实际问题处理的过程中,当需要处理长期依赖关系的数据时,权重参数 U、V 会在训练过程中逐渐衰减或放大:倘若梯度大于,当 t 增大时,最终的梯度则会趋于无穷大,模型参数不稳定,无法收敛,此为梯度爆炸

10、;倘若梯度小于 1,则当 t 增大时,最终的梯度会趋于 0,模型参数不更新,此为梯度消失。因此,循环神经网络往往只能处理较短的序列,而为了解决这个问题,便出现了 LSTM 网络。 1.1.2.1.1.2.长短长短期期记忆模型记忆模型 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 5 长短期记忆网络其实是循环神经网络变形中的一种,其出现就是为了弥补循环神经网络无法处理长序列数据的缺陷。长短期记忆网络神经元的结构与循环神经网络相比,主要有两大部分的变化:首先是,在长短期记忆网络神经元中多了一个存储单元用于存储长期记忆;此外,其内部还引入了三个逻辑门控单元,可以控制信息的存储与流

11、动,使得有用的信息得以被留存,无用的信息被遗忘,让模型能够以较小的成本来实现不错的记忆效果。 存储长期状态和临时状态的细胞单元分别用和表示,三个逻辑门控单元分别为输入门、遗忘门和输出门,分别用、和来表示。那么,在 t 时刻下,各门控单元的状态向量和输出向量由以下公式进行计算(当 t1 时,初始值0、0均为 0) :() = () tanh() , () = () ( 1)+ () , = tanh(h( 1) +() + ) , () = ( 1)+ () +) , () = (h( 1) +()+ ) ,() = tanh(h( 1)+ () + ) 。 其中,即表示 sigmoid 函数,

12、表示向量的对应元素相乘。、和分别为输入到三个门控单元的权重矩阵,、h和h则为隐藏层的权重矩阵,、和分别为相应门单元的偏置向量。 1.2.1.2.长短期记忆模型的学习过程长短期记忆模型的学习过程 与循环神经网络相似,长短期记忆模型的学习过程也分为正向传播和反向传播两部分,而正向传播的过程基本可以划分为三个阶段:遗忘阶段、记忆选择阶段以及输出阶段,分别对应着三个逻辑门控单元的作用过程。 1 1.2.1.2.1.正正向传播向传播 (1)遗忘阶段 t 时刻输入长短期记忆网络神经元的信息来源于三个部分:t 时刻外界的输入、t-1 时刻的长期状态1以及临时状态1, 和1中的信息在进行权值变换之后会被 si

13、gmoid 函数映射为取值范围为 0-1 的遗忘门阈值。而遗忘门的作用就是判断1对于当前内容的重要性,选择性遗忘掉1中的某些内容,以便当前 t 时刻的新信息得以被输入进来,这一过程即是数学描述中的() ( 1),其中,()中各元素均为 0-1 的小数,代表的就是存储单元中信息留存的比例,表示全部遗忘,表示状态全部保留。 (2)记忆选择阶段 此阶段由输入门发挥作用,输入门会控制信息的留存,其主要是对新输入的信息对于的重要性进行判断,即() 。此过程中中 tanh 函数的作用是对输入的信息进行缩放,生成当前 t 时刻状态更新的备选内容。 (3)输出阶段 此阶段就是由输出门确定输出的内容,对状态进行

14、更新,需要从中筛选出对 t时刻的输出有用的信息生成,作为当前的输出或进入下一时刻的学习。 1 1.2.2.2.2.反反向传播向传播 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 6 长短期记忆模型以损失函数的最小化为目标,沿着负梯度方向对各参数进行调整更新,不过 LSTM 中参数数量更多,因此此过程的计算要更为复杂。LSTM 的损失函数为:=12( )2。而决定梯度的是本层在当前 t 时刻的输出误差以及之后误差 , 所 以 := + +1= +1+1+1+1=+1+1+1+1 , = ( )() , +1=+1=+1 ()。 同 理 :+1=+1 1() ,+1=+1 ta

15、nh()() ,+1=+1 。由此可得:= = = ,= , = , = , = , = 1 , = 1 , = 1 , = 1 。 从表面上来理解,在前向传播过程中,长短期记忆网络可以判断何时让激活函数进入内部状态,而当输入门的取值为 0 的时候,激活函数就无法进入。同理,输出门学习的是何时将值输出。当两个门都处于关闭状态时,激活函数不会有任何变化,也不会对当时的输出产生任何影响。这就使得在反向传播过程中的梯度既不会消失也不会爆炸,所以从这个意义上来说,逻辑门控单元在学习何时让误差进入,何时将其输出。在实际应用中,相比于循环神经网络,门控单元的引入使得长短期记忆网络可以控制数据的传递,可以很

16、好地进行长期依赖关系的学习。 1.3.1.3.小结小结 深度学习是机器学习的一种方法。 “深度”意为含有多隐层节点的神经网络结构,是和浅层机器学习相对的概念,早期的机器学习模型如支持向量机、逻辑回归都可以理解为浅层机器学习模型,这类模型在结构上相当于只含一层或不含任何隐层节点。相比于浅层机器学习模型,深度学习可以更好的提取原始数据的特征结构,具有较好的泛化能力,深度神经网络是深度学习实现的途径,比较有代表性的深度神经网络有 卷积神经网络、循环神经网络和长短期记忆网络。其中,长短期记忆网络是循环神经网络的一种变体,相比循环神经网络,长短期记忆网络具有记忆性,能够检测数据中的长期依赖关系,因此更适

17、用于对股票价格时间序列进行预测。 股票数据采集与存储的自动化方法成本低、易于实现,存在变量多、样本量大等问题,股票的收益受到多种因素的影响。我们这里挑选出合适的特征变量和响应变量,希望通过长短期记忆模型对股票的收益趋势做出预测。模型的本质就是通过训练好的模型来对未来进行预测。我们从证券市场获得的观测数据大多都具有时间趋势,借助长短期记忆模型来进行股票收益预测是具有很强的现实意义的。 2.2.长短期记忆长短期记忆模型的择时建模模型的择时建模 量化择时是指采用数据化的方式,判断进场或者离场时机。通过计算机技术分析相关数据,得出对证券市场未来一段时间内发展趋势的分析预判,如果判定上涨则给出买入持有的

18、操盘建议,如果判定下跌则提示投资者卖出清仓规避风险,如果判定震 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 7 荡则进行高抛低吸或低吸高抛以此来降低持仓成本。可以看出,择时方法的核心在于精确找到股票走势,来进一步确定交易的信号。股票数据具有时序性特点,股票数据具有时序性特点,长短期长短期记记忆网络忆网络可以通过分层特征可以通过分层特征来表示其内在关系,并且来表示其内在关系,并且具有负责计算具有负责计算时间时间序列中各个观序列中各个观测值之间依赖性的能力测值之间依赖性的能力。所以,在预测股票市场走势时,利用长短期记忆网络更为合适。我们这里来研究基于长短期记忆模型的择时建模。

19、 2.1.2.1.模型合理性的讨论模型合理性的讨论 时间序列分析是以已有的历史数据为根据,通过数学建模进行分析和判断未来发展趋势的一种手段,被广泛地运用在证券走势的预测当中。针对复杂的金融时间序列,深度学习方法是目前最适合进行股票市场预测的算法。在众多深度神经网络模型中,长短期记忆网络被广泛应用。长短期记忆网络克服了梯度消失问题,能够通过记忆单元有效地学习时间序列中的长期依赖关系。 长短期记忆网络是人工神经网络的一种,衍生于循环人工神经网络。作为循环神经网络的变体,长短期记忆网络最大的不同之处在于它借鉴了人类大脑的选择性输入和选择性遗忘机制,引入了遗忘门、输入门和输出门三个“门”结构,以及一个

20、记忆单元来选择性接收传入神经网络的信息。属于逻辑单元的“门”结构只负责在神经网络中其它部分与记忆单元相接的边缘地带完成权值的设定工作,而不会对其他神经元节点产生影响。长短期记忆模型具有负责计算时间序列中各个观测值之间依赖性的能力,所以通常被用来实现预测目的。又因其具有快速适应发展趋势中急剧变化的固有能力,因此可以在波动的时间序列中很好地工作。传统的时间序列分析模型,如差分整合移动平均自回归模型则无法尽快适应证券价格的突然剧烈变动。所以我们利用长短期记忆模型对证券价格进行时间序列分析,选取一些重要的指标作为预测向量,再以 5 日平均收益率作为响应变量建立长短期记忆模型,以预测结果的正负作为标志,

21、在回测阶段判断进场或者离场的时机。 2.2.2.2.模型优缺点的讨论模型优缺点的讨论 长短期记忆网络是循环神经网络的一个优秀的变体模型,继承了大部分循环神经网络的特性,克服了循环神经网络的缺陷。循环神经网络的优势在于它将时序数据和神经网络相结合,并且保留了上一时刻对于现在的影响,保留了数据的时序性。但是随着时间序列的增长,研究者们发现循环神经网络对于长时间的序列处理能力较弱,也就是说循环神经网络的长期记忆效果并不是很理想。此外,随着序列长度增加,模型深度增加,在计算梯度的时候就无法避免梯度消失与梯度爆炸的问题。简单来说就是循环神经网络模型在运作到反向传递误差的过程时,由于其结构限制,前面的时间

22、步难以收到后面时间步传递的误差信号,使其难以通过学习远距离的影响来调整网络。而长短期记忆网络更真实地表征或模拟了人类行为、逻辑发展和神经组织的认知过程,继承了大部分循环神经网络的特性,同时解决了梯度反转过程中的梯度消失与梯度爆炸问题。 长短期记忆模型能够处理非线性问题,具有长期记忆能力,泛化能力强。股票数据由于受到经济因素、政治因素和环境因素的影响,使其变化规律难以捉摸,变化规律的周期难以确定,所以模型需要大量的历史数据以及筛选合适的特征变量进行分析才能够得到需要的结果。在分析复杂的股票市场时,神经网络作为深度学习领域的技术,能够很好地解决非线性的问题。长短期记忆网络在传统的神经网络上进行了优

23、化,引入了“门”的概念,增强了该模型的长期记忆能力,合适的优化算法在一定程度上提高了模型的泛化能力,在序列建模问题上具有很大优势。 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 8 然而,长短期记忆模型也有一定的局限性:循环神经网络的特性决定了其不能很好的并行化处理数据,长短期记忆模型作为循环神经网络的改进模型在并行处理上同样存在劣势。此外,长短期记忆模型本身的结构相对复杂,如果长序列数据的时间跨度很大,设置的网络层数较深,将会产生很大的计算量和时间消耗。 2.3.2.3.策略设计思路策略设计思路 我们的策略的主要设计思路如下: 1.1. 设置主要的模型构建方法,即设置主要

24、的模型构建方法,即进行进行两种方式的模型两种方式的模型训练及设置执行方案;训练及设置执行方案; 2. 根据根据长短期记忆长短期记忆模型的原理来设置预测方案模型的原理来设置预测方案; 3. 对数据及参数进行选取; 4. 通过回测来确定最优模型。 2.3.1.2.3.1.建模方法建模方法 神经网络通过对人脑工作机制的模拟,以神经元之间权重连接的方式逐层建立起网络架构,并且每个神经元都有偏置项和激活函数对数据信息进行非线性化变换,这使得运用神经网络对股票价格建模能够克服金融时序的非平稳性和非线性,从而最大限度的逼近和拟合实际的股票价格。本文将利用长短期记忆神经网络来实现沪深 300股票 5 日平均收

25、益率的预测。 我们这里采用两种方式对模型进行训练。一种是 3:2 的数据划分训练模式,即将60%的数据作为训练数据,剩余的 40%的数据作为测试数据。一种是窗长窗移滚动训练模式,即将第 1-30 天的数据用来训练,第 31 天的数据用来测试,然后将 2-31 天数据用来训练,第 32 天数据用来测试,以此类推。我们这里将会对两种方案分别进行测试。 建模过程为: 对模型进行训练,做参数估计。选取模型的训练集,如上所述,一种是 3:2 的数据划分训练模式,一种是窗长窗移滚动训练模式,将持仓时间长度平均收益率,持仓期间夏普比率,5 日和持仓期平均成交量之比作为输入变量,5 日平均收益率作为输出变量通

26、过对模型进行训练,得到估计的参数。 本策略利用长短期记忆模型对沪深 300 指数预测得出的 5 日平均收益率作为买卖信号,在回测阶段用以检验长短期记忆模型用于沪深 300 指数技术指标回归分析中的精度, 2.3.2.2.3.2.预测方法预测方法 做预测是基于未来数据和历史数据存在类似的规律假设。根据长短期记忆模型的基本原理,可以构造预测的基本方法,即准备测试数据,利用训练好的模型实现预测。我们这里将沪深 300 的 5 日平均收益率作为响应变量进行预测,如果预测值大于 0,记为 1;如果预测值小于 0,记为 0,根据此结果在回测阶段进行相应的交易操作。 2.3.3.2.3.3.数据及参数选择数

27、据及参数选择 关于预测标的的选取我们使用沪深 300 指数(000300)的日数据来进行测试。 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 9 长短期记忆模型的参数主要包括三部分,一个是长短期记忆网络本身的参数配置;一个是输入给模型的特征变量的选择;一个是模型的输出变量即响应变量的选择。 模型关键参数选择如下: (1)长短期记忆网络层神经元的个数(hidden_dim) :长短期记忆网络需要对每个神经层的神经元个数进行定义。在定义时要考虑输入数据形状,并保证模型能够正常运行,神经元个数不能设置的过大也不能过小。这里我们将神经元个数定为 32 个。 (2)随机断开输入神经元

28、比例(dropout) :该参数用来调节 dropout 层将部分神经网络单元暂时从网络中筛选出去的概率,dropout 层用于减小神经网络模型发生过拟合及性能过低的概率,减少神经网络单元的同时也减少了神经元之间的相关性,增强了神经网络在样本外进行测试时的泛化能力。这里我们将 dropout 设置为 0.2。 (3)训练批次(num_epochs) :单次 num_epochs 指的是将所有的数据输入网络进行一次完整的计算。此参数的设置会极大地影响模型的训练精度和训练时间。两种训练方式下,此参数最终分别确定为 84 和 17。 (4)输入数据维数(input_dim):因为特征变量为 3 个,

29、所以将其设置为 3。 (5)输出数据维数(output_dim) :因为响应变量为 1 个,所以将其设置为 1。 (6)损失函数(loss_fn) :常用的损失函数有 mean_squared_error 和 mean absolute error,这里选取 mean_squared_error 作为损失函数。 (7)优化器(optimiser) :优化器的目的是使损失(loss_fn)函数最小化,在所有神经网络优化器中,adam 是最为常用的优化器,这里设置优化器为 adam。 表 1 :3 个特征变量 1 个响应变量及其含义 特征变量特征变量 含义含义 持仓收益率 以持仓周期等于 10 为

30、例,即 10 日内的指数收益率 持仓期间夏普比率 夏普比率是一个衡量基金风险与收益关系的指标。以持仓周期等于 10 为例,10 日内的夏普比率即为持仓期夏普比率 5 日和持仓期平均成交量之比 以持仓周期等于 10 为例,则持仓半周期为 5。持仓半周期和持仓全周期平均成交量之比即为 5 日和持仓期平均成交量之比 响应变量响应变量 含义含义 5 日平均收益率 以持仓周期等于 10 为例,则持仓半周期为 5。5 日时间长度内股票的总收益与总成本的比值即为 5 日平均收益率(也称持仓半周期平均收益率) 资料来源:华西证券研究所 特征变量选择:股票数据指标能够在一定程度上帮助投资者判断股市的当前行情,寻

31、找行情的转折点。这里长短期记忆模型的特征变量选取了 3 个变量,它们分别是持仓收益率,持仓期间夏普比率,和 5 日和持仓期平均成交量之比。表 1 对它们做出了相应解释。 响应变量选择:本实验长短期记忆模型的响应变量选取的是股票的 5 日平均收益率,表 1 对变量做出了解释。在回测阶段我们将模型预测的 5 日平均收益率的正负作为交易行为的判断标志之一,为正表示可以获利,反之表示不能获利。已知理性的投资者选择投资标的与投资组合的主要目的为:在固定所能承受的风险下,追求最大的 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 10 报酬或在固定的预期报酬下,追求最低的风险。夏普比率是

32、一个衡量基金风险与收益关系的指标,最大回撤率是用来描述买入产品后可能出现的最糟糕的情况,它们是衡量股票投资风险的重要指标。这里我们主要以夏普率和最大回撤率这两个指标来衡量交易结果。 2.4.2.4.策略具体过程及回测分析策略具体过程及回测分析 我们这里以沪深 300 作为交易标的,首先获取观测值的时间序列,这是后续进行模型计算的基础。我们首先将特征变量分为价格类,成交量类和综合类。对于收益率类特征变量,我们选取持仓时间长度收益率作为价格类特征变量;持仓期间夏普比率作为综合类特征变量;5 日和持仓期平均成交量之比作为成交量类特征变量。响应变量我们选取沪深 300 股票的 5 日平均收益率。如图

33、1、图 2、图 3、图 4 所示,我们以持仓时间长度为 10 日为例,画出 4 个变量对应数据的频率分布直方图: 图 1 持仓时间平均收益率 图 2 5 日平均收益率 资料来源:华西证券研究所 资料来源:华西证券研究所 图 3 5 日和持仓期的平均成交量之比 图 4 持仓时间长度内夏普比率 资料来源:华西证券研究所 资料来源:华西证券研究所 2.4.1.2.4.1.长短期记忆长短期记忆模型的优化模型的优化 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 11 (1)调整长短期记忆网络的层数(num_layers) 本文在研究长短期记忆网络层数的设置对回测结果的影响时,以夏普比

34、率、最大回撤率、胜率作为评价指标,其取值为当前长短期记忆网络层数设置下的最优回测结果。初始时将长短期记忆网络的层数设置为 1,然后通过将其增加至 3 层来研究长短期记忆网络层数的设置对回测结果的影响,神经元节点数设置为 32。以 3:2 数据划分训练方式为例,研究结果如表 2 所示。 表 2:长短期记忆网络层数对回测结果的影响 长短期记忆网络层数 夏普比率 最大回撤率 胜率 1 0.52 0.3800 0.74 2 0.31 0.3800 0.75 3 0.28 0.3800 0.73 资料来源:华西证券研究所 从表 2 可以看出长短期记忆网络层数的设置对回测结果的影响较大,并且随着层数增加,

35、夏普比率有所降低。尽管已有部分研究表明适当增加长短期记忆网络层数能够提升模型预测能力,但在本文研究模型中,一层长短期记忆网络层就已经能够保证模型预测的效果。 (2)调整训练批次(num_epochs) 单次 num_epochs 指的是将划分的训练数据输入网络进行一次完整的计算,它是影响模型输入结构的重要参数之一,在每一个 num_epochs 下神经网络中的神经元权重会不断迭代更新。以 3:2 数据划分训练方式为例,研究结果如表 3 所示。 表 3:训练批次对回测结果的影响 训练批次 夏普比率 年化收益率 总收益率 最大回撤 胜率 交易次数 30 0.09 0.0458 29.2647 0.

36、4547 0.70 43 35 0.14 0.0568 36.2873 0.3122 0.71 34 55 0.30 0.1020 65.1207 0.3800 0.76 38 75 0.39 0.1246 79.5328 0.3800 0.72 43 84 0.52 0.1724 110.0464 0.3800 0.74 43 95 0.45 0.1493 95.3323 0.3800 0.77 43 基准 0.28 0.1002 63.9818 0.4670 资料来源:华西证券研究所 从表 3 可以看出长短期记忆网络训练批次的设置对回测结果的影响较大,并且随着训练批次增加,夏普比率呈现先上

37、升后下降的趋势。本文中我们将训练批次设置为84 将获得较高的夏普率和较低的最大回撤率。 (3)调整长短期记忆网络层神经元的个数(hidden_dim) 在训练过程中长短期记忆网络往往会将噪音进行放大,最终导致模型整体过拟合,长短期记忆网络层神经元个数设置的越多,模型往往有更高的过拟合可能性。因此,神经元个数是影响模型最终性能的一个重要参数。本文使长短期记忆网络的神经元个数在数组16,32,64,128中分别进行取值,探究其对回测结果的影响。以 3:2 数据划分训练方式为例,研究结果如表 4 所示。 表 4:长短期记忆网络层神经元个数对回测结果的影响 长短期记忆网络层神经元个数 夏普比率 最大回

38、撤率 胜率 16 0.28 0.3800 0.76 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 12 32 0.52 0.3800 0.74 64 0.35 0.3800 0.80 128 0.39 0.3800 0.76 资料来源:华西证券研究所 从表 4 可以看出长短期记忆网络层神经元个数的设置对夏普比率影响较大,结合最大回撤率来看,将神经元个数设置为 32 为最佳。 2.4.2.2.4.2.3:3:2 2 的数据划分训练模式分析的数据划分训练模式分析 3:2 的数据划分训练模式是在拆分数据集(由 2005 年 1 月到 2021 年 7 月的沪深300 标的计算出的

39、 3 个特征变量值)时,将 60%的数据作为训练数据,剩余的 40%的数据作为测试数据。这里通过对模型预测性能的调节,我们将模型训练过程中的训练批次确定为 84。从表 5 可以看出这种训练方式的实现结果的夏普比率和最大回撤率都是在较大程度上好于基准的,且具有较高的交易胜率。 表 5:两种训练方式结果对比 夏普比率 年化收益率 总收益率 最大回撤 胜率 交易次数 数据划分模式 0.52 0.1724 110.0464 0.3800 0.74 43 基准 0.28 0.1002 63.9818 0.4670 窗长窗移模式 0.61 0.1990 127.0886 0.2459 0.60 40 基准

40、 0.28 0.1002 63.9818 0.4670 资料来源:华西证券研究所 2.4.3.2.4.3.窗长窗移滚动训练模式分析窗长窗移滚动训练模式分析 窗长窗移滚动训练模式的实现过程是第 1-30 天的数据用来训练,第 31 天的数据用来测试,然后将 2-31 天数据用来训练,第 32 天数据用来测试,以此类推。这里通过对模型预测性能的调节,我们将模型训练过程中的训练批次确定为 17。从表 5 可以看出,这种训练方式可以获得较高的夏普比率,较低的最大回撤率,较高的收益率和交易胜率。 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 13 图 5:数据划分训练模式累计收益 图

41、 6:窗长窗移训练模式累计收益 资料来源:华西证券研究所 资料来源:华西证券研究所 图 7:数据划分训练模式累计超额收益率 图 8:窗长窗移训练模式累计超额收益率 资料来源:华西证券研究所 资料来源:华西证券研究所 2.5.2.5.择时策略讨论择时策略讨论 神经网络通过对人脑工作机制的模拟,以神经元之间权重连接的方式逐层建立起网络架构,并且每个神经元都有偏置项和激活函数对数据信息进行非线性化变换,这使得运用神经网络对股票价格建模能够克服金融时序的非平稳性和非线性,从而最大限度的逼近和拟合实际的股票价格,因此神经网络在预测股票价格的问题上优于传统的建模方法。此外,神经网络的各层神经元节点之间相互

42、连接,可训练参数量通常可以达到上千上万个,更多的可训练参数可以更有效地发现数据之间的关系从而强化模型的表达能力。因此,利用长短期记忆网络进行股票收益的预测是可行的。 长短期记忆模型主要包括两个步骤,第一是通过训练过程和优化过程求得模型的参数,第二是利用训练好的模型对沪深 300 的 5 日平均收益率做出预测。根据机器学习中的经验,我们将数据分为训练集和测试集,首先在训练集上进行模型的参数和观测变量的调优选择,之后固定调优参数在测试集上进行回测。 证券研究报告|量化研究报告 请仔细阅读在本报告尾部的重要法律声明 14 基于长短期记忆模型的择时策略主要是通过预测股票市场的 5 日平均收益率得到这样

43、的结论:预测结果为负值时,意味着市场的“负向”波动占主体直到变为正的为止;预测结果为正值时,意味着市场的“正向”波动占主体,直到变为负的为止。 3.3.总结总结 本篇报告我们提出了一个具有 3 个特征变量 1 个响应变量的长短期记忆模型来预测沪深 300 股价的 5 日平均收益率,采用两种训练方式对模型进行训练,然后确定参数进行测试并且进行了交易回测。我们介绍了长短期记忆模型关键参数的选择,特征变量的选择,响应变量的选择,并且阐述了其含义。在回测的过程中通过调整长短期记忆模型训练的训练批次,结合提出的择时策略结果证明长短期记忆模型具有高收益,高夏普比,低回撤,高胜率的优点。 总结来看长短期记忆

44、模型具有以下特点: 1. 长短期记忆模型能够处理非线性问题,具有长期记忆能力,泛化能力强。在分析复杂股票市场时,神经网络作为深度学习领域技术,能够很好地解决非线性问题。长短期记忆网络在传统的神经网络上进行了优化,引入了“门”引入了“门”的概念,增强了该模型的长期记忆能力的概念,增强了该模型的长期记忆能力,合适的优化算法在一定程度上提高了模型的泛化能力,在序列建模问题上具有很大优势; 2. 长短期记忆网络对股票价格建模能够克服金融时序的非平稳性和非线性,从而最大限度的逼近和拟合实际的股票价格; 3. 使用更多的可训练参数去拟合股价问题很容易出现过拟合现象,这使得模型对过去的股票价格有很好的解释能力,但对于未来的股票价格没有任何预测能力。因此,长短期记忆模型需要充足数据保障其能够在一定程度上缓解过拟合现象。 4. 长短期记忆网络层数越深,节点越多,训练时所花费的时间也就越长。如何加速训练过程从而缩减模型的训练时间对计算机软硬件的发展提出了更高要求。 4.4.风险提示风险提示 模型基于对历史数据统计,仅作为投资参考。 Table_AuthorTable_AuthorInfoInfo

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(机器学习择时系列之三:LSTM模型市场择时策略-210909(14页).pdf)为本站 (小时候) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部