大額掛單分為買單和賣單,前者可視為支撐位,後者可視為阻力位,它們對行情走向具有一定的影響。大額掛單的價格可能在限價指令薄的固定位置,也可能在一定的價格範圍內移動,可假設其在較大概率上會出現在某些特定的價格位置,從而反映出各個掛單者對行情的判斷。
本文對BitMEX交易所的XBTUSD永續合約的賣4000至買4000的市場深度數據進行統計分析,通過核密度估計得出了大額掛單在不同價格位置出現的概率密度。
從獲取市場深度數據的時效性來講,由於獲取具有一定的延遲,所有的數據其實都是過去的數據,不一定能代表當前的大額掛單的價格位置,但根據它們在不同價格位置出現的概率密度,我們可以對下一時刻它們可能出現的價格位置做出推斷,從而進行相應的策略決策。
不同的編程語言一般都有特定的不同的函數來專門運行核密度估計的計算,比較方便,但在實際情況中,為了使程序能夠準確反映我們的意圖,有必要去深入理解核密度估計的概念。
一、核密度估計[1]-[5]
(一)概率密度函數估計的簡要介紹
概率密度函數,常簡稱為密度函數以至密度,是概率論的最重要概念之一。雖然在統計學上我們常提「總體分布」這個名詞,但使用密度的概念去規定或刻畫一個統計模型不僅常見,而且比使用分布概念更合適和方便。在各種實際問題中,變數取值的分布呈現「兩頭小、中間大,左右對稱」這種「正態類似型」者為數頗多。這些特點在密度函數的圖像上一目了然,而在分布函數的圖像上則有不同。
密度估計問題,就是要通過從總體中抽得的樣本去估計其概率密度函數f。在實際操作中,總可以把問題說成:固定一已知的x軸,要估計f在x點之值f(x)。
如果概率密度函數形狀被假定或已知,那麼就用參數估計法。如果概率密度函數的形狀未知,則用非參數估計法。實際上一般不要求密度函數有某種特定的數學形式,如密度為正態分布之類,也就是說未知密度函數的所屬類型並不知道。理由很明顯:若密度函數的數學形式已知,而只含少量未知參數,則不如徑直考慮這些參數的估計問題,而不提密度估計問題。因此,密度估計問題在本質上說是非參數性的。如今最流行的非參數密度估計法是核密度估計法,也稱為Parzen密度估計法。
核密度估計作為一種非參數統計方法,在近四十餘年吸引了不少學術界的注意,通過研究發現核密度估計的方法並非建立在某種艱深的概念或數學工具的基礎上,而不過是古老的直方圖方法的自然發展,這在統計發展史上有一定的代表性。應當指出的是,密度估計的重要性並不在於它的單獨使用,而是作為統計推斷的中間環節發揮作用。著名統計學專家Silverman曾指出,概率密度函數估計在數據統計處理的所有階段都是有用的。
圖1
在關於直方圖的理論討論中,我們常假定區間分隔(即上文a、h的選擇)是在考察樣本之前就定下來的,因此無隨機性,這就使理論簡化了。但在實際操作時不一定能恪守這個規定。例如,一批樣本可能較集中在O點附近,而在較遠的地方的個數較少。這時,有條件把密度f在O點附近之值估計得細一些,而在遠處則只能滿足於較粗的估計。也就是說,我們可能取一些不等長的區間,區間長度在O附近很短而在遠離O點處則較長。然後在每一區間內按(1)式作出f的估計。這時,區間的位置、長短都是在參考了樣本以後決定的,故有隨機性。這樣的直方圖估計稱為「Data-based」的直方圖估計,其理論較a和h都比通常的直方圖估計複雜得多,這裡就不再討論了。
直方圖估計的優點在於簡單易行,且在n較大而容許h較小的情況下,所得圖像尚能顯示密度的基本特徵,但也有明顯的缺點——它不是連續函數(這可以通過適當地修勻來解決),且從統計角度看效率較低。例如,在這一方法下,每一區間中心部分密度估計較准,而邊緣部分則較差。綜合種種因素,我們仍可以說:直方圖估計不失為一個有用而基本的密度估計方法。
3、Parzen的核估計
不難看出:Rosenblatt估計仍為一個階梯函數,只不過與直方圖估計比起來,各階梯之長不一定相同而已,仍非連續曲線。另外,從Rosenblatt估計的定義中看出,為估計f在x點之值f(x),對與x在一定距離(確切地說,是h/2)內的樣本,起的作用一樣,而在此以外則毫不起作用。直觀上可以設想:為估計f(x),與x靠近的樣本,所起的作用似應比遠離x的樣本要大些。這些在Parzen於1962年提出的核估計方法中都得到了體現。
為介紹Parzen的思想,我們先將(2)式變換一個形式,引進一個函數
(三)核函數的舉例
以一維情況為例,常用的核函數見下表:
表1
根據上表所示,畫出幾類核函數的圖像如下:
圖2
二、比特幣期貨合約大額掛單的價格位置
不斷獲取BitMEX交易所的XBTUSD永續合約的賣4000至買4000的市場深度數據,將UTC時間2019-08-01 03:49:22時的數據繪圖如下所示:
圖3
將數據分為賣200至買200、賣800至買800、賣1600至買1600、賣3000至買3000、賣4000至買4000各段,分別求得各段的最大賣價和買價。只不斷地保存最近一段時間(這裡取3分鐘)各段的最大賣價和買價,這可能就是潛在的支撐位和阻力位所在的價格位置。
根據保存的數據,利用核密度估計(採用高斯核函數)來計算出各段的支撐位和阻力位所在價格位置的概率密度,概率密度最大處附近即為支撐位或阻力位的所在位置。而各支撐位和阻力位所對應的限價單數量則分別來自於所保存的數據中對應的各限價單數量的中位數。
我們可以分別畫出各段的概率密度圖,為了方便觀察,我們將各圖繪製在一起,將阻力位用偏紅色的線條表示,將支撐位用偏綠色的線條表示,可得下圖:
圖4
上圖各峰值附近即為大額掛單所形成的支撐位和阻力位,進一步將相關數據列表如下:
表2
從上表可知,各概率密度的峰值雖然不大,但在其鄰域進行積分所得到的概率的值較大,因此各概率密度的峰值對應的價格位置附近就是各支撐位和阻力位的價格位置。
此外,各深度的支撐位和阻力位有部分重合。支撐位有兩個:價格9750附近,數量(中位數)約為629.8萬張;價格9943附近,數量(中位數)約為215.4萬張;阻力位有兩個:價格10080附近,數量(中位數)約為135.6萬張;價格10200附近,數量(中位數)約為385.5萬張。
我們可根據策略需求來選用這些支撐位和阻力位,例如,只將數量600萬張以上的視為有效支撐位和阻力位,那麼在這段行情就只在價格9750附近存在一個有效支撐位。又如,只將數量1000萬張以上的視為有效支撐位和阻力位,那麼在這段行情就暫時不存在有效支撐位和阻力位。
三、結論與討論
本文對BitMEX交易所的XBTUSD永續合約的賣4000至買4000的市場深度數據進行統計分析,通過核密度估計得出了大額掛單在不同價格位置出現的概率密度,從而確定了各支撐位和阻力位的位置。在實際操作中,我們可以根據具體策略選用它們,只將限價單數量達到一定量的價格位置視為有效的支撐位和阻力位。
需要注意的是,比特幣期貨的波動性很大,支撐位或者阻力位或許只適用于震盪行情中的策略判斷,當出現瀑布行情時,巨大的交易量使得它們比較容易被突破。因此,我們往往將其與其他指標一起使用來降低風險。
參考文獻
[1] 陳希孺, 柴根象. 非參數統計教程. 上海: 華東師範大學出版社, 1993. 247-253
[2] 郭照庄. 密度核估計中最優窗寬選擇的研究. 燕山大學碩士學位論文, 2006. 1-9
[3] 張玉敏. 基於不同核函數的概率密度函數估計比較研究. 河北大學碩士學位論文, 2010. 8
[4] 茹楊. 核函數的核密度估計演算法. 哈爾濱理工大學碩士學位論文, 2016. 3-5
[5] 謝中華. MATLAB統計分析與應用:40個案例分析. 第二版. 北京:北京航空航天大學出版社, 2015. 209
冷萃財經原創,作者:Awing,轉載請註明出處:https://www.lccjd.top/2019/08/02/%e6%af%94%e7%89%b9%e5%b8%81%e6%9c%9f%e8%b4%a7%e5%90%88%e7%ba%a6%e5%a4%a7%e9%a2%9d%e6%8c%82%e5%8d%95%e4%bb%b7%e6%a0%bc%e4%bd%8d%e7%bd%ae%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%8e%a8%e6%96%ad/?variant=zh-tw
文章評論