华泰金工林晓明团队基于通用回归模型的

摘要

采用通用回归预测模型挖掘行业背后的交叉预测关系

本文实证了一种基于通用回归预测模型来挖掘行业轮动规律并指导行业配置的方法,其核心思想是利用所有行业当期收益率作为解释因子,对每个行业下期收益率做回归,考察行业收益率之间是否存在显著的交叉预测关系,进而构建轮动策略。该模型的提出主要基于两点考虑:1、各行业之间存在广泛而紧密的联系,通过回归模型,可以定量刻画行业收益率之间的传导规律;2、行业指数本身就是观测宏观经济运行状态的一个很好的窗口,而行业指数的收益率则刻画了经济体的动态变化情况,通过挖掘各行业收益率之间的传导关系,可以用来指导行业配置。

基于主成分回归模型的行业轮动策略构建与回测

基于主成分回归模型的行业轮动策略构建包括数据预处理、主成分合成、回归参数估计等步骤,最终在每个截面处,可以生成下一期各行业收益率的预测值,并指导最终的配置。实证表明,当训练窗口长度为周,全部主成分都参与回归时,该行业轮动策略的多空对冲组合年化收益率达到28.68%,年化波动率19.04%,夏普比率为1.51,而纯多头组合的年化收益率为25.28%,年化波动率27.3%,夏普比0.9,多空对冲策略表现更优。

参与回归主成分越多,训练窗口越长,策略表现越稳定

在基于主成分回归模型的行业轮动策略构建中,最核心的两个参数是训练窗口长度,以及参与回归的主成分个数。我们遍历了参数的各种可能取值,来检验该策略对参数的敏感程度。实证结果表明,当主成分个数大于3时,几乎所有训练窗口长度下,多空策略都获得了正收益,而且随着主成分增多,平均收益率也不断抬升;另一方面,当主成分个数固定时,随着训练窗口长度变长,策略表现也更优,说明通过较长训练窗口挖掘出的轮动规律更稳定,外延预测时更可靠。整体而言,该策略鲁棒性较强,对参数取值不是十分敏感。

业绩归因模型显示,主成分回归行业轮动模型获取了显著的alpha收益

我们通过构建一个5因子模型对行业轮动策略的收益率进行归因,测试其在各个因子上的风险暴露,以此来解释策略收益的来源。其中,5个因子分别是市场因子、市值因子、账面市值比因子、反转因子、流动性因子。实证结果表明,多空对冲组合在5%置信度水平下,获得了17.32%的年化超额收益,并且仅在市值因子上有轻微暴露。说明该策略的收益来源主要是alpha,而不是通过在特定风险因子上持续暴露敞口来获得收益补偿。或者说,该多空策略可能在不同市场环境下把握了占主导地位的风格因子,而不是持续押注于某一类特定的风格。

长期上升趋势不变,静待大金融和周期上游启动

通过对年5月至今这段慢牛行情进行回归建模,并绘制板块动力图,可以发现周期上游是本轮行情的动力节点,正向推动了其他板块,而进入9月以来,市场风格有所切换,作为上涨引擎的周期上游板块陷入调整,整个市场向上动力不足,出于避险的考虑,资金纷纷进入防御板块抱团取暖,所以最近消费、周期中游板块获得显著超额收益,这说明市场目前整体处于防守状态。但我们认为市场长期向上趋势不变,而防守板块没法带领市场不断冲高,调整到位后,资金大概率会回流到周期上游、大金融等主导板块。

风险提示:模型结论根据历史规律总结,历史规律可能失效。

本文研究导读

行业轮动本质上就是根据不同行业的区间表现差异性进行轮动配置,力求能够抓住区间内表现较好的行业。在整个自上而下的资产配置投资体系中,行业配置占据着重要地位,投资者如果能够把握行业轮动规律,踏准市场节奏,就能够获得显著的超额收益。因而行业轮动也一直是业界研究的热点,在现有文献中,对行业轮动的研究主要集中在以下两个方面:

1、从经济周期角度看,不同行业会随着经济状态的周期性变化出现依次上涨、下跌的轮动现象。当经济复苏时,处于产业链下游的汽车、房地产等先导性行业将率先回暖,进而带动中游投资品,制造业的发展,最终传导到上游能源、原材料行业。当经济衰退时,对基本面最为敏感的钢铁、有色等强周期行业将率先下跌,而食品饮料、医药等必需消费品行业则受影响较小。

2、从行为经济学角度看,一方面,A股是一个受政策因素影响明显的新兴市场,投资者会受到政策预期的影响,导致投资决策趋同,最终政策受益行业会呈现出“强者恒强”的动量效应;另一方面,投资者先天的比价心理会强化补涨、补跌的认知,在上涨行情中,没有涨的行业就应该补涨,同样下跌行情中,没有跌的行业也应该无条件补跌,这种比价效应会引导市场资金在分化的行业之间流转,造成一种“你方唱罢我登场”的交错涨跌状态。

无论从哪个研究角度,都得到了很多有实践意义的结论,但各自也有不足的地方:

1、从经济周期出发,优点是逻辑性强,符合经济学常识,但实践起来较难,因为经济状态的划分本身就是一个难题,实证中甚至发现经济状态会出现频繁跳跃和反复。

2、从行为经济学出发,优点是逻辑简单,可操作性强,但模式过于单一,不够灵活,很多时候行业轮动规律是复杂,而且时变的,简单的动量或反转模式难以获得持续、稳定的超额收益。

综上,我们权衡考虑可行性与灵活性,实证了一种基于通用回归预测模型来挖掘行业轮动规律并指导行业配置的方法,其核心思想是利用所有行业当期收益率作为解释因子,对每个行业下期收益率做回归,考察行业收益率之间是否存在显著的交叉预测现象,进而构建轮动策略。该模型的提出主要考虑了以下几点:

1、金融市场是一个复杂的整体,各个行业之间存在许多广泛而紧密的联系,一个行业收益率的变化可能引起其他行业的收益率变化,同时该行业也可能受到其它行业收益率变化的影响。比如钢铁行业,既有可能受益于下游需求旺盛而上涨,其本身的产能扩张也会影响到上游能源行业。通过回归模型,可以定量刻画这种行业之间的传导规律,建立起复杂的行业关联关系网络。

2、整个金融经济体是一个相互影响,联系紧密的整体,就像宏观经济指标可以用来指导投资,而股市也可以作为经济晴雨表,反映基本面状态。我们认为各行业指数本身就是观测宏观经济运行状态的一个很好的窗口,而行业指数的收益率则刻画了经济体的动态变化情况,通过挖掘各行业收益率之间的传导关系,可以用来指导行业配置。

后文中,我们主要从三个方面来实证该通用回归模型的表现:首先,我们对历史行情中比较典型的几个时间段建立回归模型,以板块动力图的形式可视化展示行业收益率之间的相互传导关系,并与板块实际表现相互印证;然后,我们基于主成分回归模型构建定价方程,指导行业轮动配置,考察策略的净值回测结果,并进行参数敏感性分析;最后,我们对策略净值进行收益归因,分析策略的主要收益来源。

基于回归预测模型挖掘行业轮动背后规律

回归预测模型构建

为了考察行业收益率之间是否存在显著的交叉预测现象,我们利用所有行业当期收益率作为解释因子,对每个行业下期收益率做回归(参考图表1),构建如下时间序列回归模型:

其中,N为行业个数,ri,j代表行业j第t期收益率。上述回归方程定量描述了一个给定行业当期收益率受所有行业上期收益率的影响程度,在所有行业上建立这种回归模型后,就能刻画整个行业集群之间错综复杂的联系了。

整个回归预测模型的构建流程如图表2所示,主要分为数据采集、预处理、多重共线性处理、回归方程显著性检验几部分,下面分别介绍。

数据采集

数据采集工作分为两步:

1.选取29个一级行业中除国防军工和综合之外的行业指数构建六大板块:周期上游、周期中游、周期下游、大金融、消费、成长。板块内,各行业指数采用等权方法合成板块指数。后文中,我们将统一基于六大板块进行分析。这里之所以不直接用一级行业指数进行回归,一方面是考虑到细分行业之间相关性更强,共线性更显著,影响回归效果;另一方面是考虑到行业数目越多,建立的行业关联网络越复杂,难以把握最核心的规律。

2.得到六大板块指数后,计算其周频对数收益率,采用对数处理是为了让收益率序列更平稳,削弱数据的异方差和共线性,而且有利于计算。

六大板块划分如下表所示(具体的板块划分方式请参见华泰金工研报《行业指数频谱分析及配置模型》)。可以看到,行业聚类结果与传统定性行业分类结果一致,说明基本的产业经济逻辑是深深的融入到金融市场的运行过程之中的。

六大板块周频收益率序列的统计结果如下表,收益率最高的两个板块是大金融和消费,波动率最低的两个板块是周期中游和消费,夏普比最高的是大金融和消费,整体而言,消费板块在风险收益比上要优于其他板块。

预处理

为了提升回归效果,在得到六大板块周频对数收益率序列之后,要进行去极值、中心化、标准化等预处理操作。本文采用“中位数去极值法”对极端值进行处理:

数据去极值后的序列再进行中心化、标准化:

多重共线性处理

共线性是指解释变量之间有精确的或者近似的线性关系。在我们的回归模型中,自变量是各个行业的收益率序列,而大部分时间里,各行业同涨齐跌的现象是比较显著的,导致其收益率序列之间相关程度较高,如图表5所示,消费、周期中游、周期下游三个板块的相关系数最高,均超过0.9,大金融和成长板块的相关系数最低,也超过了0.6。共线性的存在不会影响回归系数的唯一性和无偏性,但它会造成回归系数估计值的方差变大,使得回归系数的置信区间变得很宽,这样一方面会降低估计量的精准度,甚至改变了系数的符号;另一方面也可能会使估计量的T值变小,导致一些对因变量有显著影响的解释变量通不过假设检验。所以,共线性与否直接关系到回归方程的优良性,必须加以处理。

常见的判断共线的方法有条件数判别法和方差膨胀因子判别法:

1.条件数k解释变量相关系数矩阵的最大特征值与最小特征值之比。在应用中一般认为,若k,则共线性的程度较小;若k0,则存在严重的共线性。

2.方差膨胀因子(VIF)是指是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,VIF越大,共线性越严重。经验表明:当0VIF10,不存在多重共线性;当10≤VIF,存在较强的多重共线性;当VIF≥,存在严重多重共线性。

这里我们采用方差膨胀因子法来检测共线性,对于已经通过中心化、标准化的收益率矩阵X,计算其相关系数矩阵R,并求逆,得到如下结果:

则称其主对角元素VIFj=cjj为自变量xj的方差膨胀因子,记Rj2为自变量xj对其余N-1个自变量回归的拟合优度,容易证明:

也就是说,某个自变量xj的方差膨胀因子越大,与其余N-1个自变量的线性相关程度越强,其解释能力也越容易被其他变量替代。

六大板块方差膨胀因子计算结果如下,可以看到周期中游、周期下游、消费板块的方差膨胀因子均大于10,共线性比较明显,这与前面做相关分析的结论是一致的。

由于共线性的存在会严重影响回归效果,所以必须要进行相关处理。最直接的思路就是把共线性显著的自变量剔除,比如利用方差膨胀因子法,每次将VIF最大的自变量剔除,计算剩余自变量的VIF,直到所有自变量的VIF都在10以内,然后进行回归。实证结果显示,如果按照该方法处理,最后保留的自变量只剩下周期上游、周期中游、大金融、成长四大板块,被剔除的周期下游、消费板块对其他板块的影响就无法得到了,所以我们采用另外两种思路:

1.逐步回归法,其基本思想是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除,以确保每次引入新的变量之前回归方程中只包含显著性变量。经过逐步回归,最后保留在模型中的解释变量既是重要的,又没有严重多重共线性。后文中,我们在对历史行情典型区间段进行建模时,将采用逐步回归法。

2.主成分回归法,其原理是将原来的解释变量通过线性变换重新组合成一组新的相互无关的变量,来替代原来的解释因子,构建回归方程。其优点是可以消除原始多元线性回归模型中的共线性影响,缺点是新合成的解释因子不一定有直观的经济学含义。我们在构建行业轮动策略时,将基于主成分回归法。

显著性检验

选取合适的回归模型后,就可以进行参数估计和显著性检验了。这里我们通过t检验挑选出显著不为0的回归系数,来刻画行业之间的相互联系。举个例子,假设针对成长板块构建的回归预测方程中,消费板块的回归系数显著不为0且是正值,则说明消费板块的本期收益率对成长板块的下期收益率有显著的正向推动作用,同理,如果大金融板块的回归系数显著不为0且为负值,则说明大金融板块的本期收益率与成长板块的下期收益率有一个负相关关系。

我们采用板块动力图的形式来可视化展示这种行业之间错综复杂的交叉预测关系,假设六大板块是有向图中的六个节点,显著不为0的正回归系数用红色实线边来表示,显著不为0的负回归系数用绿色虚线边来表示,则上述例子构建的板块动力图如下所示。

该有向图能非常直观、全景式的展示六大板块收益率之间的交叉预测关系,方便我们把握行业轮动的微观规律。但理解时需要强调以下几点:

1.回归方程展示的是一种统计显著关系,而非因果关系,比如上图中,我们能得到的是在回归建模的区间段内,消费板块延迟一期的收益率序列和成长板块的当期收益率序列之间有显著的正相关关系,而不能说消费板块的涨跌和成长板块的涨跌互为因果。当然,大概率情况下,通过模型构建出的板块动力图都能和符合经济学逻辑的结论相互印证。

2.通过某条边连接的两个节点之间并非你涨我跌或你跌我涨的绝对关系,而是一个相对概念,比如上图中,并非大金融板块上周涨了,成长板块这周就会跌,因为成长板块还受到了消费板块的影响,两者谁的贡献更大可能是动态改变的。

正确的理解方式是从全局上看板块动力图,比如某个板块正向影响了多个板块,说明该板块可能有先导效应,推动了市场的演进;又比如某个板块负向影响了多个板块,说明该板块走势可能和其他板块存在一定负相关关系,大概率是防御性板块。后文介绍中,我们将结合案例详细描述。

回归预测模型实证分析

本节我们将针对历史行情中比较典型的几个区间段进行回归建模,并绘制板块动力图,考察该回归预测模型的实际表现。

年1月~年10月

首先,我们针对整个历史区间进行分析,得到六大板块的净值走势如下图所示。整体而言,各行业之间同涨齐跌的现象还是比较明显的,但也有一些值得挖掘的细节:一方面,不同阶段的主导板块是不一样的,06年至07年的大牛市明显是在大金融,周期上游等大盘板块的引领下不断冲高的,而14年至15年的大牛市主导板块则变成了成长板块;另一方面,不同局部区间也能看到各大板块的走势分化,比如年下半年,周期上游和消费板块获得了显著的超额收益,而大金融板块则处于震荡下跌的行情中,同样的分化发生在年下半年,消费、成长板块明显跑赢周期上游。投资者如果能把握住这种风格上的切换,或者轮动的规律,就能获得显著的超额收益。

进一步,我们对区间内的行业收益率做回归建模,得到回归系数估计如图表9所示。这里需要说明两点:

1.为了克服共线性影响,我们采用了逐步回归的方式,对每个板块,都只保留了解释能力最强的几个因子,因而有些因子的回归系数为空。

2.最终构建的回归方程中,拟合优度R2的量级都比较低,这是正常的,因为行业收益率的影响因子是广泛而复杂的,往往含有不可预测的成分,我们仅仅挑选各板块上期收益率作为解释因子,很容易出现欠拟合现象。但这里R2较低并不代表回归模型没有意义,CampbellandThompson()提出了一种计量方法,能够从定量角度刻画回归方程在经济学意义上的预测能力,其计算公式如下(具体推导请参见附录):

其中,Ri2代表板块i回归方程的拟合优度,Si2代表板块i的夏普比率(周频收益率均值除以标准差)。CT统计量的含义是:相比于完全忽略所有对超额收益有影响的解释变量,当投资者从风险项中剥离出一部分解释变量时,组合预期超额收益的增加幅度。更通俗一点的说,假设有两个采用均值方差模型的投资者A和B,投资者A在对风险资产的预期超额收益做预测时,仅仅利用历史的平均超额收益,不依赖任何预测模型,而投资者B则剥离出了一些对超额收益率有显著解释能力的因子,那么相比于A,投资者B能获得的预期超额收益率的增长率就是CT统计量。所以我们构建的回归模型虽然较低,但只要这些因子的解释能力在下一期能保持,那期望超额收益率都能得到显著提升。从下表能看到,解释能力最弱的大金融板块也能获得89%的提升。

得到回归方程后,我们筛选出置信度水平在5%以上的回归系数,并构建板块动力图(图表10),可以看到:

1.成长板块作为动力节点,正向影响了除周期中游之外的其他板块,这意味着成长板块当期收益率对这些受影响板块的下期收益率有一个显著的正向推动作用,成长板块当期涨得越多,受影响板块下期也大概率涨得越多,或者跌得越少,反之亦然。那么我们可以认为成长板块大多数时间内就是市场的一个先导板块,这与我们的直观印象是一致的,因为05年至17年这段时间中,小盘风格更占优,成长板块大部分时间内都在引领市场的涨跌。

2.消费板块作为防御节点,和其他所有板块的下期收益率都有一个显著的负相关关系,这意味着消费板块当期涨得越多,其他板块下期大概率涨得越少,或者跌得越多。这种轮动逻辑在市场上经常能看到,比如经济衰退,大盘向下时,消费板块中的医药、食品饮料行业由于其必需消费品属性,比较抗跌;又比如大盘经过一轮上涨行情,有调整需求时,消费板块也往往成为避险资金的集中地,所以消费板块的收益率往往和其他板块有一定的背离。

3.周期下游对周期中游,以及周期上游的正向传导关系,这和我们前文所说的基本产业链逻辑是相互印证的。当经济复苏时,处于周期下游的汽车、建筑等先导性行业将率先回暖,进而带动中游交通运输,制造业的发展,最终传导到上游能源、原材料行业。这种传导机制在实体经济中可能需要一个比较长的过程,但资本市场上炒的是预期,逻辑兑现可能更快。

年1月~年6月

图表11~图表13是我们针对年1月~年6月这段大牛市行情的回归建模结论。从净值图能看到,成长板块主导了这轮牛市,而周期上游和大金融板块的涨幅则远远落后,这是因为自08年全球金融危机之后,宏观经济基本面一直处于下行趋势中,通缩预期促使政府采取降息等宽松政策,但基本面的恶化导致绝大部分企业盈利严重受损,充裕的资金并没有合适的去向,只能流入炒预期、看未来的成长板块。从板块动力图也能看出,成长板块的收益率,正向推动了周期中游、周期下游以及消费板块的收益率,也印证了成长板块是这一轮行情的动力节点、主导板块。

年6月~年1月

图表14~图表16是我们针对年6月~年1月这段大跌行情的回归建模结论。彼时,大盘从点的高位连续杀跌,恐慌情绪释放过后,大金融板块最先止跌企稳,在整个下跌行情中也最抗跌。从板块动力图也能看出,大金融板块正向影响了其他板块,说明大金融板块跌速放缓后,其他板块也逐渐企稳,所以说大金融板块是这一轮行情的中心节点。

年5月~年10月

本节我们将针对最近一年半的板块走势进行回归建模,并发表预测观点。

年2月底,“华泰周期研究系列”的第一篇报告《市场的轮回》提出:全球股票市场(同比)普遍存在42个月周期,且于年初同步见底,建议







































白癜风医院南京哪家好
治疗白癜风有什么好办法



转载请注明地址:http://www.huataia.com/htzq/842.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章