【广发金工】基于大数据开掘的观点轮动战略-

您的位置:股票配资开户 > 配资策略 > 浏览 评论

【广发金工】基于大数据开掘的观点轮动战略--互联网大数据开掘系列专题之九

  股票投资策略和方法

  原题目:【广发金工】基于大数据开采的观点轮动计谋--互联网大数据开采系列专题之(九)

  时时状况下,某个观点热门正在闪现上涨之前去往受到了投资者的平凡眷注,投资者的心思、对观点热门的眷注水平都邑对墟市涨跌起到推波帮澜的影响。

  近十几年来,互联网获得了神速的普及和进展,极大的蜕化了人们的获取讯息的方法。互联网上重淀的数据呈指数型增进。遵照汇集查找引擎构修的舆情数据很好地响应了投资者对付观点板块的眷注度。这篇讲述通过对舆情数据和观点热门之间的闭联举办切磋,研讨这些数据正在量化切磋中的行使效益。

  经由干系性分解,发端获得结论:舆情数据和观点热门行情数据之间有较强的正干系闭联,观点热门史乘行情数据和对应舆情数据的3阶滞后有很强的正干系闭联,均匀干系系数抵达0.43。当投资者对付某个板块的眷注度快速上升时,证实该板块是近期投资热门,假使还没闪现显着上涨那么就有较大或许会正在近期闪现上涨。而投资者对付某个板块的眷注度可能直接通过舆情数据响应出来。

  对观点指数舆情数据的周涨幅修立阈值A,观点指数行情数据的周涨幅修立阈值B,跌幅修立阈值C,当知足某观点指数舆情周涨幅大于阈值A,同时观点指数周涨幅幼于阈值B,跌幅幼于阈值C时,鄙人一往还日买入该观点指数。假使一周内发出买入信号的观点指数数量较多,对观点指数作进一步筛选,固定持仓一段之间,资金等权分拨于各个观点板块。

  实证结果证明,从2011年-2016年回测光阴,计谋累计净值抵达3.18,年化收益率为24.40%,胜率为58.7%。分年度呈现下,每一年的呈现都对比优异。结尾对计谋的三个阈值举办参数敏锐性分解,计谋结果对参数抉择不是很敏锐。

  本讲述提出的观点轮动计谋基于观点指数舆情数据,舆情数据仅仅是投资者投资心思的一个方面呈现,墟市行情受到其他成分影响。

  、绪言互联网大数据下的量化投资正在撷取、拘束、管造、摒挡等方面大大凌驾了古代数据库软件器材才略规模的数据集中。伴跟着环球经济一体化和环球讯息化的神速进展,以及互联网本领带来的讯息革新,“大数据”曾经成为互联网周围最炙手可热的目标。其它,大数据的影响不但仅限造于讯息本领方面,它还正在“吞噬”、重修少少古代行业,怎么诈欺大数据,开荒个中的潜正在价钱,曾经受到各行各业的平凡眷注。互联网的进展也极大地蜕化了人们的生存方法和习性,人们越来越习性于通过汇集查找、领略和眷注我方感意思的音信、热门事项等。同时互联网本领的进展也深切影响着人们的投资习性以及计划。最初,互联网本领的进展,使得数据的积蓄露出指数型速率进展,用户正在网上爆发海量数据,记实着他们的思念、动作以至激情,这是讯息期间实际社会与汇集空间深度统一的产品,蕴藏着丰饶的内在和良多秩序性讯息。通过分解干系数据,可能领略多人投资需乞降意图。其次,互联网每天源源接续爆发大方数据,假使或许更有用地构造和运用大数据举办开采分解,获取投资讯息举办分解,将给古代的投资计划等带来新的机会。纵观海表里,众银策略是什么公司对大数据干系的量化投资计谋的切磋近几年刚才兴盛,但对互联网大数据干系量化计谋的切磋已然成为量化投资新的切磋目标和热点切磋周围。2011年5月,英国对冲基金Derwent Capital Markets开发了界限为4000万美金的对冲基金,该基金是首家基于社交汇集的对冲基金,通过分解Twitter的数据实质来感知墟市心思,从而诱导举办投资。正在2012年,CAYMAN ATLANTIC公司新创建了一只基于汇集社交媒体Twitter、查找引擎Google及其他音信媒体数据的举办往还的对冲基金。遵照其官网披露的基金史乘收益数据,截止2015年12月,该基金累计收益率高达63.21%,年化收益率为15.02%,正在基金运转的42月中有32个月取得了正收益,耗损的10个月当中,均匀月耗损为-0.45%,而取得正收益的月份中,均匀月收益率为2.12%。国内各至公募基金等机构接踵与互联网公司合营,推出了少少大数据基金产物,如广发基金与百度的中证百度百发计谋100指数型基金、南方基金与新浪合营的大数据100指数型基金等。目前国内大数据量化产物网罗了指数型、股票型和搀杂型基金以及集中资产拘束计算等类型。

  跟着机构投资者对大数据这一块的珍惜性的渐渐增强,对互联网大数据的量化切磋将越发地多样化,网罗对墟市的择时、行业装备、选股、热门追踪等周围,以至是及时的大数据量化监控编造。

  互联网大数据切磋体例正在互联网数据开采与切磋方面,广发金工开发了完竣的数据抓取平台以及对互联网大数据各个数据维度的切磋视角。

  广发金工切磋了多个维度的互联网数据,比方从告示、财报角度切磋的讲述《告示披露背后荫蔽的投资机缘——互联网大数据开采系列专题之(二)》等;从股吧、社交角度切磋的讲述《聆听股吧之声,洞察大盘趋向——互联网大数据开采系列专题之(三)》等;以及从汇集媒体角度分解的讲述《基于互联网开采的热门选股计谋——互联网大数据开采系列专题之(五)》、《基于大数据开采的联系个股投资机缘——互联网大数据开采系列专题之(六)》、《基于大数据开采的Smart Beta计谋——互联网大数据开采系列专题之(七)》、《多维数据下的大数据择时计谋切磋——互联网大数据开采系列专题之(八)》等。

  基于大数据的切磋积蓄,广发金工也开荒了一系列的互联网开采幼器材,网罗上市公司告示抓取、切磋讲述抓取、查找量抓取、眷注度抓取等幼器材。

  样本数据因为正在样本回测光阴,干系的观点数据或许会对比多,正在回测光阴内统计总共的观点品种存正在必然的难度,为了或许更好地切磋观点数据与对应的舆情之前的闭联以及计谋的构修,本专题的观点板块数据泉源于wind的观点板块的数据,一共蕴涵安防监控指数等117个观点指数,观点指数的行情数据泉源于wind的观点指数的收盘价数据,样本时刻区间为2011年至2016年。干系的观点指数的史乘舆情数据则通过查找引擎、财经网站等互联网渠道取得。查找引擎、财经网站等干系的观点数据或许很好地响应了观点热门的舆情讯息。

  干系性分解通过对观点热门的史乘数据和观点热门史乘舆情的数据举办干系性分解,获得干系的结论:观点热门史乘数据和观点热门对应舆情数据正在3阶滞后有很强的正干系闭联,均匀干系系数抵达0.43,比如基因检测观点板块指数与对应的舆情指数正在滞后3阶上的干系系数为0.87,是很强的干系性。

  其它,本篇专题讲述计谋所需数据还网罗样本区间的沪深300指数收盘价。本篇讲述中将计谋的收益呈现与同期沪深300指数呈现举办对比。

  计谋道理基于观点指数和对应舆情数据的干系性分解,发觉观点指数和对应舆情数据两者之间有较强的干系性并且舆情讯息的转折要先于对应观点指数的转折。当某个观点指数的舆情指数涨幅较大时,证实该热门或许是近期的投资热门,受到了投资者的平凡眷注。假使该观点指数还未闪现显着上涨,那么它有较大或许正在将来几天闪现上涨。本专题计谋以周为统计区间,每个时刻区间内分歧统计观点指数和对应舆情数据的涨跌,为了更好地怀抱观点指数是否闪现上涨以及涨幅,本专题计谋对涨幅修立阈值。当观点指数和它对应的观点板块指数涨幅同时知足高于或低于某个阈值时发出看多信号。为了或许更好地使资金分拨于将来存正在较大上涨或许的观点板块,假使罕见目较多(多于n个)的观点指数同时发出看多信号,作进一步筛选。将发端抉择出的观点指数按涨幅排序分成三挡,同时按舆情涨幅分成三挡,抉择同时知足舆情涨幅处于最大的一档,对应观点指数行情涨幅处于最幼的一档。假使筛选不出观点热门,放宽对指数涨幅的局限,直至筛选出观点热门遏止筛选经过。抉择出观点热门后固定持仓3个往还日后平仓。守候下一买入信号发出前,持有资产。

  为更懂得地领略计谋,以2015年1月19日—1月26日这偶尔间区间为例对计谋道理做实在证实。寓目到正在2015年1月12日——2015年1月19日时刻区间内,遵照观点指数的舆情涨幅大于阈值A,观点指数涨幅幼于阈值B,跌幅幼于阈值C的抉择圭表,发端抉择出了黄金珠宝指数等10个观点热门,10个观点热门的史乘数据如下表所示:

  因为发端筛选出的观点热门数量较多,对选出的观点热门做进一步筛选,将这些热门按舆情涨幅排序分成三挡,同时按观点指数涨幅分成三挡。遵照同时知足舆情涨幅处于最大的一档,对应观点指数行情涨幅处于最幼的一档。假使筛选不出观点热门,放宽对指数涨幅的局限,直至筛选出观点热门遏止筛选经过的抉择圭表,告捷筛选出中日韩自贸区指数,筛选了结。筛选经过如下图所示:

  抉择出中日韩自贸区指数后正在1月19日买入该指数,持仓3个往还日后平仓。此时守候下一买入信号发出,正在买入信号发出前持有资产。本次往还细节如下:

  从上图中可能看出,抉择中日韩自贸区指数正在1月19日实践买入后,正在接下来的两个往还日均取得了正收益,累计收益率抵达7.64%,累计净值由2.28增进到2.45。然后正在本周糟粕往还日内持有资产,守候下一买入信号发出。

  实证结果计谋实证的史乘区间为2011年至2016年,本专题计谋呈现与沪深300指数史乘呈现举办对比,实证结果如下图所示,计谋正在史乘回测光阴内累计净值抵达3.18,年化收益率为24.40%,胜率为58.7%,讯息比率为1.28,最大回撤为21.20%,累计收益率为218.00%,累计逾额收益率为216.99%。

  观点轮动计谋分年度呈现,实证结果如下表所示,轮动计谋呈现优异,除2011年表,都获得了正的绝对收益率。分年度胜率均匀上都处于50%以上的胜率。实在细节如下表所示:

  经由对观点热门的筛选,每周选中实践买入的观点热门数量多半不进步5个,如下表所示:

  参数敏锐性测试正在上述的实证分解中,计谋测算联合运用不异的参数举办回测。为了更好地寓目观点轮动计谋对付参数的敏锐性,进一步举办参数的敏锐性干系的测试。接下来,对观点轮动计谋正在固定个中两个参数,另一个参数自正在蜕变的不怜悯形下的累计净值举办了对比,个中A的规模是0.15至0.3,以0.01为公差等差递增,B的规模是0.01至0.3,以0.01为公差等差递增,C的规模是0至0.05,以0.001为公差等差递增。

  上图中,横轴显示固定参数B、参数C条件下,参数A正在0.15至0.3之间蜕变的16种状况,纵轴显示该参数修立下的累计净值,可能看到,累计净值首要散布正在2~3.2之间,而且累计净值的颠簸不大,轮动计谋对参数A不敏锐。

  上图中,横轴显示固定参数A、参数C条件下,参数B正在0.01至0.3之间蜕变的30种状况,纵轴显示该参数下的累计净值,可能看到累计净值纠合正在2.5邻近,并且累计净值的颠簸对比安稳。

  上图中,横轴显示固定参数A、参数B条件下,参数C正在0至0.05之间蜕变的51种状况,纵轴显示该参数下的累计净值,可能看到累计净值正在1~3.2之间呈递增形态蜕变,且累计净值的颠簸不大。

  对付差异的参数,修立了差异参数蜕变区间,从参数敏锐性分解结果来看,计谋对三个参数蜕变并不太敏锐。

  观点指数轮动计谋是有用的择时计谋基于舆情数据观点板块轮动计谋,遵照舆情转折和行情转折有较强的正干系闭联,且舆情转折会当先于行情转折构修了量化择时计谋。实证结果证明诈欺观点板块舆情讯息动作买入信号源正在史乘区间内拥有优异呈现。基于观点舆情数据的观点板块轮动计谋的重点网罗:1、观点舆情或许很好地代表了舆情讯息。诈欺汇集爬虫措施抓取了观点热门干系的史乘舆情数据,wind的观点指数的史乘行情数据用于计谋构修。2、本专题计谋中对观点热门的舆情和史乘数据涨幅修立阈值,当舆情涨幅和观点指数幅冲破阈值时,发出买入信号买入观点指数,固定持有3个往还日后平仓,资金等权分拨于观点指数。对阈值参数组合举办敏锐性测试抉择出了最优参数组合,同时发觉计谋对参数蜕变不敏锐。切磋亏欠与将来目标1、本专题计谋假设观点指数是可能交易的,正在实质操作中需求交易指数对应的ETF产物或者正在观点指数下抉择它的因素股构修投资组合。2、以一周为时刻区间鉴定舆情和指数行情是否闪现上涨,抉择观点热门后持仓3个往还日,导致计谋中每周或许会有1-2个往还日处于空仓日期。将来可能厘正计谋,正在空仓日期再做不异鉴定,抉择性买入指数,节减空仓日期,正在把持住计谋的回撤的同时,加强计谋的收益。

  本讲述提出的观点轮动计谋基于观点指数舆情数据,舆情数据仅仅是投资者投资心思的一个方面呈现,墟市行情受到其他成分影响。

  周密实质请见广发金工专题计谋讲述《【广发金工】基于大数据开采的观点轮动计谋--互联网大数据开采系列专题之(九)》

  《【广发金工】多维数据下的大数据择时计谋切磋—互联网大数据开采系列专题之(八)》

  《【广发金工】基于大数据开采的Smart Beta计谋—互联网大数据开采之七》

  《【广发金工】基于互联网开采的热门选股计谋—互联网大数据开采系列专题之五》

  《【广发金工】那些年沿道追过的财经幼编选股计谋—互联网大数据开采系列专题之四》