高頻買(mǎi)賣(mài)怎樣下單?AI給出謎底→
期貨日報
在金融市場(chǎng)的高頻買(mǎi)賣(mài)范疇,收益率的可猜測性始終是學(xué)術(shù)界跟投資者存眷的核心。高頻收益率在差別市場(chǎng)情況下的可猜測性對買(mǎi)賣(mài)戰略的制訂跟履行存在深遠的影響。
在本文中,咱們將簡(jiǎn)述Yacine A?t-Sahalia、Jianqing Fan等人在其論文《How and When are High-Frequency Stock Returns Predictable?》中的重要發(fā)明,這些發(fā)明為高頻收益率的可猜測性供給了實(shí)踐基本跟實(shí)證根據。
隨后,咱們將先容咱們在海內期貨市場(chǎng)的實(shí)證研討流程,包含數據集先容、因子結構、猜測目的設定及練習方式等。
最后,咱們將剖析海內實(shí)證的成果,重要包括模子的猜測表示以及猜測區間跟日內效應答模子猜測才能的影響。別的,咱們還摸索了模子在現實(shí)下單戰略中的利用,并經(jīng)由過(guò)程模仿回測的方法比擬了其與傳統下單算法的機能差別。
參考文獻:
論文《How and When are High-Frequency Stock Returns Predictable?》應用呆板進(jìn)修方式,深刻研討了超高頻股票收益在差別維度下的可猜測性跟連續性。研討發(fā)明,與中臨時(shí)收益率比擬,高頻收益率在短期內表示出明顯、體系且廣泛的可猜測性。
詳細來(lái)說(shuō),作者先從買(mǎi)賣(mài)跟報價(jià)數據中構建了一系列猜測因子,并探究了差別市場(chǎng)情況下股票可猜測性變更的起因。跟著(zhù)高頻數據時(shí)效性進(jìn)步,可猜測性也會(huì )明顯加強,作者對這種變更停止了量化剖析。最后,作者經(jīng)由過(guò)程模仿試驗,研討了提前獲取局部訂單流偏向(即便是不完善的信息)對猜測才能的影響。這種前瞻性平日由最快的高頻買(mǎi)賣(mài)者控制,可能明顯晉升收益率的可猜測性跟連續性。
海內實(shí)證
1.數據集先容
研討種類(lèi):燃料油FU、螺紋鋼RB。
僅斟酌活動(dòng)性最好的主力合約。
時(shí)光范疇:2023/08/17—2023/11/16。
2.因子結構
在原文獻中,作者基于限價(jià)訂單簿及逐筆成交數據構建了13個(gè)因子。遺憾的是,海內期貨市場(chǎng)的高頻數據與外洋的股票高頻數據存在較年夜差別(逐筆成交數據缺掉且數據頻率存在差別),使得此中7個(gè)因子無(wú)奈復現。為了進(jìn)一步晉升模子的猜測才能,咱們啟動(dòng)了一項普遍的高頻因子網(wǎng)絡(luò )跟開(kāi)辟任務(wù)。終極,咱們收拾并開(kāi)辟了超越130個(gè)高頻因子,并將其歸入華泰期貨的高頻因子庫。對每個(gè)因子,咱們都市求其在10個(gè)回溯區間的均值作為后續呆板進(jìn)修模子的輸入(特點(diǎn)),統共有1300+特點(diǎn)作為后續呆板進(jìn)修模子的輸入。
3.猜測目的
咱們的猜測目的是將來(lái)10個(gè)Tick(5秒)的收益率,盤(pán)算方法為將來(lái)一段時(shí)光內的均勻成交價(jià)錢(qián)與以后旁邊價(jià)的比值減1:
4.模子抉擇
在實(shí)證進(jìn)程中,咱們重要應用了3種線(xiàn)性回歸模子(OLS、Ridge、Lasso)以及3種呆板進(jìn)修回歸模子(隨機叢林、XGBoost、LightGBM)停止擬合。
5.特點(diǎn)挑選
為了進(jìn)步猜測精度跟效力,咱們對每一個(gè)回歸模子(除了OLS)都停止了特點(diǎn)的預挑選:
第一步,先用小樣本(前10天)的數據停止模子擬合(全體特點(diǎn)作為輸入)。
第二步,對LASSO模子,抉擇回歸系數不即是0的特點(diǎn)作為無(wú)效特點(diǎn);對Ridge模子,抉擇回歸系數相對值排在前200的特點(diǎn)作為無(wú)效特點(diǎn);對決議樹(shù)類(lèi)模子,拔取特點(diǎn)主要性年夜于0的特點(diǎn)作為無(wú)效特點(diǎn)。
第三步,將無(wú)效特點(diǎn)作為輸入,在全樣本長(cháng)進(jìn)行模子擬合跟練習。
6.模子練習
咱們練習模子的進(jìn)程與原文獻基礎堅持分歧。練習詳細流程如下:
1.進(jìn)修階段(Learning):對每一組超參數跟tT= T, T+5, T+10,...等時(shí)光點(diǎn),應用從第T天到第T+4天(共5個(gè)買(mǎi)賣(mài)日)的數據來(lái)練習一個(gè)模子。在隨后的5天區間[T+5,T+9]內評價(jià)這個(gè)模子,并為測試會(huì )合的每一天盤(pán)算樣本外R2。
2.調參階段(Tuning):抉擇最年夜均勻R2值的超參數組合(盤(pán)算從T+5到T+19這段時(shí)光內全部測試日R2值的均勻值,共有15個(gè)測試日),并牢固這組超參數用于下一步的猜測。
3.猜測階段(Predicting):對每個(gè)T = T+20, T+21, ...等時(shí)光點(diǎn),應用從第T-5天到第T-1天的數據來(lái)練習一個(gè)模子,并應用該模子來(lái)猜測第T天的成果。
4.轉動(dòng)窗口(Rolling):將全部時(shí)光窗口向前轉動(dòng)20個(gè)買(mǎi)賣(mài)日,即T變?yōu)門(mén)+20,而后反復步調1至4。
海內實(shí)證成果
猜測表示:因為原文獻在實(shí)證成果環(huán)節中重要應用5秒作為日歷時(shí)鐘的猜測區間,因而咱們也以猜測區間5秒(10個(gè)Tick)為例,展現各模子在FU跟RB上的猜測成果。
收益率猜測:從40天測試集(Test set)的樣本外R方上看,高頻多因子模子在RB(螺紋鋼)上的猜測表示優(yōu)于FU(燃料油),最佳模子的樣本外R方分辨為20.74%及15.05%,均優(yōu)于文獻中的樣本外R方中位數10%。該成果合乎預期,由于咱們額定引入了較多新的高頻因子,使得模子更能捕獲到訂單簿數據中的微不雅特點(diǎn)。
偏向猜測:從40天測試集(Test set)的偏向正確性上看,高頻多因子模子在RB(螺紋鋼)上的猜測表示同樣略?xún)?yōu)于FU(燃料油),最佳模子的偏向正確性分辨為64.86%及62.97%,瀕臨于文獻中的樣本外偏向正確性64%。
從模子層面上看,LASSO模子在這兩個(gè)種類(lèi)上都是表示最佳的模子。
因為在參數模子中,LASSO模子表示最佳;在非參數模子中,LGBM模子團體表示最佳。因而,咱們后文進(jìn)一步的實(shí)證剖析僅針對LASSO模子跟LGBM模子。
2.猜測區間
文獻提到,高頻收益率在較短區間內的可猜測性很強,但跟著(zhù)區間的延伸而逐步削弱。咱們針對這一觀(guān)念在海內實(shí)證環(huán)節做了驗證,失掉了分歧的論斷:以種類(lèi)RB,模子LASSO為例,跟著(zhù)猜測區間從10個(gè)Tick延伸到120個(gè)Tick,樣本外R方從20.74%枯燥遞加至4.94%,樣本外偏向正確性從64.86%枯燥遞加到53.97%。
3.日內效應
咱們發(fā)明,天天凌晨跟下戰書(shū)收盤(pán)時(shí),模子的猜測表示明顯弱于其余時(shí)段。一個(gè)公道的說(shuō)明是,收盤(pán)初期的買(mǎi)賣(mài)反應了投資者對隔夜(半夜)消息、布告及寰球市場(chǎng)靜態(tài)的綜合反應,這些信息的敏捷涌入跟消化進(jìn)程中發(fā)生了較年夜的市場(chǎng)不合與穩定,存在較多噪聲,招致因子猜測后果削弱。
現實(shí)利用(以下單算法為例)
在本大節中,咱們專(zhuān)一于該模子鄙人單層面的現實(shí)利用。
1.模仿測試
模仿配景:當初,咱們假設有一投資者須要在短時(shí)光內下200手買(mǎi)單。針對這一需要,咱們經(jīng)由過(guò)程回測的方法對照差別算法下的下單本錢(qián)。
參數設定:測試的參數有兩個(gè),分辨是下單的總時(shí)光,以及拆單的次數。咱們測算了下單總時(shí)光在1分鐘、5分鐘、10分鐘,以及拆單次數在10次、20次、30次下的下單本錢(qián)。
2.下單算法
TWAP:時(shí)光距離牢固,將買(mǎi)賣(mài)訂單在一段時(shí)光內平均調配。
VWAP:時(shí)光距離牢固,但依據前5天同時(shí)段的成交量,加權調配單次的下單量
ModelPrice:基于高頻因子模子的下單算法,起首平均拆分訂單量實(shí)時(shí)間段,在每個(gè)時(shí)光段中,當模子猜測將來(lái)5秒收益率年夜于0時(shí)才下單,不然等候,假如在時(shí)光段停止時(shí)仍未觸發(fā)開(kāi)倉前提則強迫開(kāi)倉。
3.模仿成果
從最優(yōu)概率上看,基于高頻因子的下單算法在樣本外的模仿中有大概75%的概率是三者中最優(yōu)的算法。從均勻滑點(diǎn)上看,基于高頻因子的下單算法的均勻滑點(diǎn)明顯優(yōu)于TWAP算法跟VWAP算法,均勻約有0.15跳的優(yōu)化。
新浪財經(jīng)大眾號
24小時(shí)轉動(dòng)播報最新的財經(jīng)資訊跟視頻,更多粉絲福利掃描二維碼存眷(sinafinance)