持续赋能量化研究：从普适型数据向定制型转变

2022年2月26日，朝阳永续主办、中国银河证券和银河期货联合主办、华安基金协办的私募行业年度盛宴--2021年度(第十六届)中国私募基金风云榜颁奖盛典暨2022年(第三届)中国银河专业交易策略公开赛半年度颁奖典礼典隆重举行。

　　朝阳永续副总经理李智，为现场观众带来了《持续赋能量化研究：从普适型数据向定制型转变》主题演讲，分享了朝阳永续对数据跟私募服务行业的发展的体会与感受。500)this.width=500" align="center" hspace=10 vspace=10 rel="nofollow"/>　　以下是李智总的精彩观点：

　　大家知道，朝阳永续是做数据的，我就从这一两年在我们做数据跟私募服务过程中感受到的一些东西来体现行业的发展。

　　我最大一个感受，就是这两年私募从普适化的数据，向定制化的需求过渡了。而且追求的Beta或Smart Beta越来越细。同时，覆盖的范围从原来最简单的结构化的数据或与基本面的财务数据类似的数据，向那种包括另类、结构化、事件驱动型的数据过渡。这是我一个总体的感觉。

　　中证发了一个指数朝阳88，Alpha很高的一个基本面指数，基本是以事件为逻辑。它的主要选取方式，就是在发布业绩报表之前，找到那些上市公司发的业绩预告或研究员写的报告所反映出来的信息，预示它这个报告可能超预期。其实就是这么一个逻辑，每个季度一次。这个我们已经发布很长时间了，一直没有商业合作。直到去年，去年有大量的私募、公募来找朝阳永续，去年我们开始正式合作了一家，这是一个典型的开始抢Smart Beta的行为。同时，我们跟这些公司沟通的时候明显感受到，它对基本面因子或是基本面这个方面的Smart Beta的重视。选取过程比较简单。

　　最开始，就是报表之前用各种数据逻辑找出业绩可能将超出预期的那些上市公司，形成一个池子，然后再用多因子方式排序选出88个。应这个要求，随后某些机构让我们在88基础上进一步把基本面因子往前推，推得更完整点，毕竟每个季度找超预期，只是业绩层面的，能不能更多元的考虑这个问题？

　　这就是我们即将发行的确定性100。从原来只是业绩预期一个层面的逻辑，转向业绩、估值和市场三个维度的考量。因为一个股票能涨，要么有业绩，要么没业绩但有估值。估值其实就是PE，分两个部分，一个是从估值角度衡量，第二是从市场偏好维度导致PE波动。我们从结构化、非结构化以及数据分析，寻找业绩、估值、度量市场偏好的维度所形成的因子或事件，把它形成一个逻辑，做成指数。这是去年我们遇到的一个真实的商业事件反映的一个问题。根据三个维度，我们把市场上的一些线索、因子、事件量化，形成这么一个体系。

　　第二个维度，我们发现了第二个群体，就是一些指数增强的基金，有公募，有私募，它们也来找我们，说能不能合作。它们提出了一个维度，场景化、流程化服务。就是它们每次业绩发报表，都要做股票筛选，对沪深300或500指数本身的样本进行筛选。在这个维度，希望我们能支持一些数据逻辑，于是，我们把整个财报期精细划分了。因为报表上市最开始有预告，再有快报，最后发正式报告，最后研报论证说报告怎样，那我们直接严格按时间序列，把在业绩预告期所发生的信息，快报、正式财报以及研报的信息，把事件和因子理出来。这样就直接实现了时间序列里的一个观察和指数增强的一个小的策略。这也是我们在一步步给指数增强公司定制的一套研究流程或数据流程、清洗流程。

　　第三个维度，有很多业绩预期的客户说，能不能把分析师本身的水平研究细？我们数据库里其实有分析师的分析，预测准确度。但当把这个话题转到说正儿八经要挑出行业对这个股票乃至这个行业说得真的准或有水平的分析师的手里，这个题目就比较难了。首先第一个维度，为什么他们要这样做？他们想把行业里优秀的分析师进行分析师的分层，从分层的信息再结构化相应的信息。比如，我们分析行业景气度，到底听谁的？哪怕细化到业绩预期ROE，到底看谁的算？我听哪个研究员的？那就要做整个信息的分层。我们结合市场的影响力，比如新财富，结合研究的经验，结合研报的信息量等等。

　　首先，我们从行业角度，把行业分析师分成了“A”、“B”、“S”等层级。当我们把行业分级分层以后，形成了一个行业专家分层方式，进而基于行业的东西再把个股的专家弄出来，因为原来只是基于个股的预测，比较单一，现在我们做个股的专家，要考虑到首先他是一个行业专家，再确定他的个股。进而就形成了一个行业的分层和个股的分析师的分层。然后基于这些分层，再做数据的具像化。原来有一致预期，卖方原始预期，现在有行业专家预期，行业专家超预期，行业专家非结构化的预期和行业专家的产业研究的信息。如果所有信息片断是这样切，虽然这个东西推出来以后我们在配合他们在做分析研究，实际的实务和策略现在还没有具体的做，但我相信，这个维度可能会增加很多基本面维度的Alpha。

　　这是我们大致的一个分层体系的业务基本的流程过程。时间有限，我就不多讲了。

　　再有一个，我们也遇到比较多，很多研究机构或私募已经开始做非结构化的数据的应用，对我们报告本身的文本产生巨大的研究兴趣。之前我们结构化的一些东西，比如，这个上市公司的上升空间很大，从量化角度来说这个企业空间很大，你怎么定义？很难。但从研究员的报告文本化的角度，是可以定义出来的，因为的确文字里会描述它的发展空间、成长空间等等，这些结构化马上可以把一个上市公司打出标签来。

　　再比如，我们做研究经常说这个上市公司要有稀缺性，是A股的稀缺标的，这个量化怎么定义？很难。但一搜报告，就知道了，研究员会写，说这个产品或是它的资源是龙头，具有巨大的稀缺性，等等。假设两个上市公司，一个公司有大量的研究员说是稀缺的，而另外一个一个都没有写，典型的打标签比较多的，可以做成一个非结构化的标签——稀缺性。

　　我们做了很多偏基本面因子的，比如估值的飘移性，上市公司的估值从一个维度一个传统产业，由于跨度到另外一个新的产业，导致PE应该有个巨大的升幅，这个从传统的财务数据的角度，很难形成这样的指标，但从非结构化的角度，是可以通过文本化把它挖掘出来的。这一系列的结构化的过程，就是我们配合主动和量化投资者把基本面的数据进行定制化，进行细化。

　　这是我们一个研报系统。原来我们已经做到了把文字切分，只不过没有具体打标，只是用检索的方式把它分出来。这是我们自己根据前面已经帮别人做的标签，类似的做一个量化策略，叫伟大公司组合策略。

　　伟大公司我们觉得业绩好，行业好，且是行业龙头，还有估值飘移性，公司业绩好，比如行业龙头、空间大、标的稀缺性，没有办法用传统的建模方式建，我们就用非结构化的方式去形成策略的选择和编制。这是我们当时以结构化和非结构化数据混合的量化选股形成的伟大公司组合策略的实际表现回溯情况。

　　这几点，都是在去年的数据服务过程中涌现的越来越多的私募投资者主动找我们进行定制化数据需求所产生的实际的案例。借此机会分享给大家，也希望赢得更多私募和投研的合作。

　　谢谢大家！

持续赋能量化研究：从普适型数据向定制型转变

读图

大家都在看

新闻头条

综合