回溯檢驗和正向檢驗:相關性的重要性

急於在活躍的市場中嘗試交易想法的交易者經常犯一個錯誤,即完全依賴於回溯測試結果來確定系統是否會盈利。雖然回溯測試可以為交易者提供有價值的資訊,但它往往具有誤導性,而且只是評估過程的一部分。...

急於在活躍的市場中嘗試交易想法的交易者經常犯一個錯誤,即完全依賴於回溯測試結果來確定系統是否會盈利。雖然回溯測試可以為交易者提供有價值的資訊,但它往往具有誤導性,而且只是評估過程的一部分。

樣本外測試和前向性能測試提供了關於系統有效性的進一步確認,並且可以在實際現金上線之前顯示系統的真實情況。回溯測試、樣本外測試和遠期效能測試結果之間的良好相關性對於確定交易系統的可行性至關重要。

回溯測試基礎

回溯測試是指將交易系統應用於歷史資料,以驗證系統在指定時間段內的表現。今天的許多交易平臺都支援反向測試。交易員只需輕敲幾下鍵盤,就可以測試想法,並洞察想法的有效性,而無需為交易賬戶中的資金冒險。回溯測試可以評估簡單的想法,比如移動平均交叉如何處理歷史資料,或者使用各種輸入和觸發器的更複雜系統。

只要一個想法可以被量化,它就可以被回溯測試。一些交易者和投資者可能會尋求一個合格程式設計師的專業知識,以將想法開發成可測試的形式。通常,這需要程式設計師將想法編碼到交易平臺託管的專有語言中。程式設計師可以合併使用者定義的輸入變數,允許交易者“調整”系統。

上面提到的簡單移動平均線交叉系統就是一個例子:交易者可以輸入(或改變)系統中使用的兩個移動平均線的長度。交易者可以進行回溯測試,以確定哪些移動平均線的長度在歷史資料上表現最好。

最佳化研究

許多交易平臺也允許進行最佳化研究。這就需要為指定的輸入輸入輸入一個範圍,並讓計算機“計算”出哪些輸入的效能最好。多變數最佳化可以對兩個或多個變數進行數學運算,以確定哪些組合可以獲得最佳結果。

例如,交易者可以告訴程式他們想在策略中加入哪些輸入;然後,根據測試的歷史資料,將其最佳化為理想權重。

回溯測試是令人興奮的,因為一個無利可圖的系統通常可以透過一些最佳化神奇地轉變成一臺賺錢的機器。不幸的是,調整一個系統以達到過去最大的盈利水平,往往會導致一個系統在實際交易中表現不佳。這種過度最佳化建立的系統只在紙面上看起來很好。

曲線擬合是使用最佳化分析,在測試期間使用的歷史資料上,以最大的利潤建立最高數量的中標交易。儘管在回溯測試結果中它看起來令人印象深刻,但曲線擬合會導致不可靠的系統,因為結果基本上是為特定的資料和時間段定製的。

回溯測試和最佳化為交易者提供了許多好處,但這隻是評估潛在交易系統過程的一部分。交易員的下一步是將系統應用於初始回測階段未使用的歷史資料。

樣本內與樣本外資料

在對歷史資料進行測試時,為測試目的保留一段時間的歷史資料是有益的。對其進行測試和最佳化的初始歷史資料稱為樣本內資料。保留的資料集稱為樣本外資料。此設定是評估過程的一個重要部分,因為它提供了一種在最佳化模型中未包含的資料上測試想法的方法。

因此,這種想法不會受到樣本外資料的任何影響,交易員將能夠確定系統在新資料上的表現,即在現實交易中的表現。

在開始任何回溯測試或最佳化之前,交易者可以留出一定比例的歷史資料用於樣本外測試。一種方法是將歷史資料分成三分之一,並將三分之一分離出來,用於樣本外測試。只有樣本中的資料才能用於初始測試和任何最佳化。

下圖顯示了一個時間線,其中三分之一的歷史資料用於樣本外測試,三分之二用於樣本內測試。儘管下圖描述了試驗開始時的樣本外資料,但典型程式將在正向效能之前有樣本外部分。

Image 1

相關性是指兩個資料集的效能和總體趨勢之間的相似性。相關性度量可用於評估在測試期間建立的戰略績效報告(大多數交易平臺都提供這一功能)。兩者之間的相關性越強,系統在遠期效能測試和實時交易中表現良好的概率就越高。

下圖說明瞭兩個不同的系統,它們在樣本內資料上進行了測試和最佳化,然後應用於樣本外資料。左邊的圖表顯示了一個系統,它的曲線擬合很好地處理了樣本內的資料,但在樣本外的資料上卻完全失敗了。右邊的圖表顯示了一個在樣本內和樣本外資料上都表現良好的系統。

Image 2

一旦使用樣本內資料開發了交易系統,就可以應用於樣本外資料了。交易員可以評估和比較樣本內和樣本外資料之間的績效結果。

如果樣本內測試和樣本外測試之間的相關性很小,如上圖中的左圖所示,那麼很可能系統已經過了最佳化,不會在現場交易中表現良好。如果效能之間有很強的相關性,如右圖所示,那麼下一階段的評估將涉及一種額外的樣本外測試,稱為前向性能測試。

正向效能測試基礎

遠期效能測試,也稱為紙面交易,為交易者提供另一組樣本外資料,以評估系統。遠期效能測試是對實際交易的模擬,包括在一個活躍的市場中遵循系統的邏輯。它也被稱為紙面交易,因為所有的交易都是紙面交易;也就是說,交易的進出和系統的任何利潤或損失一起被記錄,但是沒有真正的交易被執行。

前向性能測試的一個重要方面是準確地遵循系統的邏輯;否則,就很難(如果不是不可能的話)準確地評估該過程的這一步驟。交易者應該誠實地對待任何交易的進出口,避免像櫻桃採摘交易或不包括紙面交易這樣的行為,合理地解釋“我永遠不會做那筆交易”。如果交易是按照系統的邏輯進行的,應該記錄和評估。

許多經紀人提供一個模擬交易賬戶,在那裡可以進行交易並計算相應的損益。使用一個模擬的交易賬戶可以創造一個半現實的氛圍來練習交易和進一步評估系統。

上圖還顯示了在兩個系統上進行正向效能測試的結果。同樣,左圖中所示的系統除了對樣本資料進行初始測試之外,也沒有做得很好。然而,右圖所示的系統在所有階段都表現良好,包括前向性能測試。一個在樣本內、樣本外和前向性能測試之間顯示出良好相關性的正結果的系統已經準備好在一個活躍的市場中實施。

底線

在大多數交易平臺上,回溯測試是一種很有價值的工具。將歷史資料分為多組進行樣本內和樣本外測試,可以為交易者提供一種實用有效的方法來評估交易理念和系統。由於大多數交易者在回溯測試中採用了最佳化技術,因此在乾凈的資料上評估系統以確定其可行性是很重要的。

在將系統投入市場之前,透過前瞻性效能測試繼續進行樣本外測試可以提供另一層安全性。樣本內、樣本外後驗和前驗之間的正結果和良好相關性增加了系統在實際交易中表現良好的概率。

  • 發表於 2021-06-20 00:40
  • 閱讀 ( 33 )
  • 分類:金融

你可能感興趣的文章

案例研究(case study)和實驗(experiment)的區別

...指一種研究方法,其中有兩個特定的群體或其他變數用來檢驗一個假設。這說明案例研究和實驗是不同的。透過本文,讓我們進一步考察這種差異。 什麼是案例研究(a case study)? 如引言所述,案例研究是一種深入研究個人、事...

  • 發佈於 2020-10-23 10:49
  • 閲讀 ( 50 )

如何在excel中進行基礎資料分析

...您希望使用統計軟體。這些工具是用來做計算的,比如t檢驗、卡方檢驗、相關性等等。Excel不是用來進行資料分析的。但這並不意味著你做不到。 ...

  • 發佈於 2021-03-12 01:13
  • 閲讀 ( 50 )

雙尾檢驗

什麼是雙尾檢驗(a two-tailed test)? 在統計學中,雙尾檢驗是一種方法,在這種方法中,分佈的臨介面積是雙邊的,檢驗一個樣本是否大於或小於某一範圍的值。它用於零假設檢驗和統計顯著性檢驗。如果被測試的樣本落入任何一...

  • 發佈於 2021-05-31 08:55
  • 閲讀 ( 48 )

t檢驗

...項研究中,可以自由改變的價值觀,對於評估無效假設的重要性和有效性至關重要。這些值的計算通常取決於樣本集中可用資料記錄的數量。 相關(或配對)t檢驗 當樣本通常由相似單位的配對組成時,或當存在重覆測量的...

  • 發佈於 2021-06-04 13:19
  • 閲讀 ( 68 )

如何在excel中計算r平方?

...如果沒有進一步的測試,僅憑結果是不可能知道的。統計檢驗一點也不簡單;它會變得複雜有很多原因。簡單地說,一個關鍵的相關假設(因此R平方)是變數是獨立的,它們之間的關係是線性的。理論上,您可以測試這些宣告...

  • 發佈於 2021-06-05 17:40
  • 閲讀 ( 56 )

如何使用excel計算相關性?

...沒有進一步的測試,就不可能知道。 一個相關性的統計檢驗可能會變得複雜,原因有很多;這一點也不簡單。相關性的一個關鍵假設是變數是獨立的,並且它們之間的關係是線性的。理論上,您可以測試這些宣告,以確定相關...

  • 發佈於 2021-06-11 21:09
  • 閲讀 ( 47 )

假設(hypothesis)和目標(aim)的區別

...透過實驗來檢驗,可以是科學的,也可以是數學的。它的重要性或價值需要評估和研究,以證實或否定它。科學假設通常遵循一個數學模型,它們有時可以是存在的陳述。 有用的假設通常能夠透過推理進行預測,並且可以預測...

  • 發佈於 2021-06-23 11:35
  • 閲讀 ( 45 )

方差分析之間的差異(difference betweeen anova)和回歸(regression)的區別

...初始測試可以透過方差分析模型來完成。方差分析模型的檢驗結果可用於回歸公式相關性的F檢驗。 方差分析主要用於確定不同組的資料是否有共同的均值。回歸廣泛用於預測和預測。它還用於檢視哪個自變數與因變數相關。回...

  • 發佈於 2021-06-23 13:54
  • 閲讀 ( 42 )

t檢驗(t-test)和方差分析(anova)的區別

t檢驗與方差分析 收集和計算統計資料以獲得平均值往往是一個漫長而乏味的過程。t檢驗和單因素方差分析(ANOVA)是兩種最常用的檢驗方法。 t檢驗是一種統計假設檢驗,如果零假設得到支援,檢驗統計量遵循學生的t分佈。...

  • 發佈於 2021-06-23 14:03
  • 閲讀 ( 48 )

方差分析(anova)和t檢驗(t-test)的區別

方差分析與T檢驗 T檢驗,有時稱為學生T檢驗,當你想比較兩組的平均數,看他們是否彼此不同時進行。它主要用於當一個隨機分配是給定的,只有兩個,不超過兩個,集比較。在進行T檢驗時,需要滿足一些條件,這樣才能得...

  • 發佈於 2021-06-23 15:51
  • 閲讀 ( 54 )