回溯检验和正向检验：相关性的重要性

急于在活跃的市场中尝试交易想法的交易者经常犯一个错误，即完全依赖于回溯测试结果来确定系统是否会盈利。虽然回溯测试可以为交易者提供有价值的信息，但它往往具有误导性，而且只是评估过程的一部分。...

急于在活跃的市场中尝试交易想法的交易者经常犯一个错误，即完全依赖于回溯测试结果来确定系统是否会盈利。虽然回溯测试可以为交易者提供有价值的信息，但它往往具有误导性，而且只是评估过程的一部分。

样本外测试和前向性能测试提供了关于系统有效性的进一步确认，并且可以在实际现金上线之前显示系统的真实情况。回溯测试、样本外测试和远期性能测试结果之间的良好相关性对于确定交易系统的可行性至关重要。

回溯测试基础

回溯测试是指将交易系统应用于历史数据，以验证系统在指定时间段内的表现。今天的许多交易平台都支持反向测试。交易员只需轻敲几下键盘，就可以测试想法，并洞察想法的有效性，而无需为交易账户中的资金冒险。回溯测试可以评估简单的想法，比如移动平均交叉如何处理历史数据，或者使用各种输入和触发器的更复杂系统。

只要一个想法可以被量化，它就可以被回溯测试。一些交易者和投资者可能会寻求一个合格程序员的专业知识，以将想法开发成可测试的形式。通常，这需要程序员将想法编码到交易平台托管的专有语言中。程序员可以合并用户定义的输入变量，允许交易者“调整”系统。

上面提到的简单移动平均线交叉系统就是一个例子：交易者可以输入（或改变）系统中使用的两个移动平均线的长度。交易者可以进行回溯测试，以确定哪些移动平均线的长度在历史数据上表现最好。

优化研究

许多交易平台也允许进行优化研究。这就需要为指定的输入输入输入一个范围，并让计算机“计算”出哪些输入的性能最好。多变量优化可以对两个或多个变量进行数学运算，以确定哪些组合可以获得最佳结果。

例如，交易者可以告诉程序他们想在策略中加入哪些输入；然后，根据测试的历史数据，将其优化为理想权重。

回溯测试是令人兴奋的，因为一个无利可图的系统通常可以通过一些优化神奇地转变成一台赚钱的机器。不幸的是，调整一个系统以达到过去最大的盈利水平，往往会导致一个系统在实际交易中表现不佳。这种过度优化创建的系统只在纸面上看起来很好。

曲线拟合是使用优化分析，在测试期间使用的历史数据上，以最大的利润创建最高数量的中标交易。尽管在回溯测试结果中它看起来令人印象深刻，但曲线拟合会导致不可靠的系统，因为结果基本上是为特定的数据和时间段定制的。

回溯测试和优化为交易者提供了许多好处，但这只是评估潜在交易系统过程的一部分。交易员的下一步是将系统应用于初始回测阶段未使用的历史数据。

样本内与样本外数据

在对历史数据进行测试时，为测试目的保留一段时间的历史数据是有益的。对其进行测试和优化的初始历史数据称为样本内数据。保留的数据集称为样本外数据。此设置是评估过程的一个重要部分，因为它提供了一种在优化模型中未包含的数据上测试想法的方法。

因此，这种想法不会受到样本外数据的任何影响，交易员将能够确定系统在新数据上的表现，即在现实交易中的表现。

在开始任何回溯测试或优化之前，交易者可以留出一定比例的历史数据用于样本外测试。一种方法是将历史数据分成三分之一，并将三分之一分离出来，用于样本外测试。只有样本中的数据才能用于初始测试和任何优化。

下图显示了一个时间线，其中三分之一的历史数据用于样本外测试，三分之二用于样本内测试。尽管下图描述了试验开始时的样本外数据，但典型程序将在正向性能之前有样本外部分。

相关性是指两个数据集的性能和总体趋势之间的相似性。相关性度量可用于评估在测试期间创建的战略绩效报告（大多数交易平台都提供这一功能）。两者之间的相关性越强，系统在远期性能测试和实时交易中表现良好的概率就越高。

下图说明了两个不同的系统，它们在样本内数据上进行了测试和优化，然后应用于样本外数据。左边的图表显示了一个系统，它的曲线拟合很好地处理了样本内的数据，但在样本外的数据上却完全失败了。右边的图表显示了一个在样本内和样本外数据上都表现良好的系统。

一旦使用样本内数据开发了交易系统，就可以应用于样本外数据了。交易员可以评估和比较样本内和样本外数据之间的绩效结果。

如果样本内测试和样本外测试之间的相关性很小，如上图中的左图所示，那么很可能系统已经过了优化，不会在现场交易中表现良好。如果性能之间有很强的相关性，如右图所示，那么下一阶段的评估将涉及一种额外的样本外测试，称为前向性能测试。

正向性能测试基础

远期性能测试，也称为纸面交易，为交易者提供另一组样本外数据，以评估系统。远期性能测试是对实际交易的模拟，包括在一个活跃的市场中遵循系统的逻辑。它也被称为纸面交易，因为所有的交易都是纸面交易；也就是说，交易的进出和系统的任何利润或损失一起被记录，但是没有真正的交易被执行。

前向性能测试的一个重要方面是准确地遵循系统的逻辑；否则，就很难（如果不是不可能的话）准确地评估该过程的这一步骤。交易者应该诚实地对待任何交易的进出口，避免像樱桃采摘交易或不包括纸面交易这样的行为，合理地解释“我永远不会做那笔交易”。如果交易是按照系统的逻辑进行的，应该记录和评估。

许多经纪人提供一个模拟交易账户，在那里可以进行交易并计算相应的损益。使用一个模拟的交易账户可以创造一个半现实的氛围来练习交易和进一步评估系统。

上图还显示了在两个系统上进行正向性能测试的结果。同样，左图中所示的系统除了对样本数据进行初始测试之外，也没有做得很好。然而，右图所示的系统在所有阶段都表现良好，包括前向性能测试。一个在样本内、样本外和前向性能测试之间显示出良好相关性的正结果的系统已经准备好在一个活跃的市场中实施。

底线

在大多数交易平台上，回溯测试是一种很有价值的工具。将历史数据分为多组进行样本内和样本外测试，可以为交易者提供一种实用有效的方法来评估交易理念和系统。由于大多数交易者在回溯测试中采用了优化技术，因此在干净的数据上评估系统以确定其可行性是很重要的。

在将系统投入市场之前，通过前瞻性性能测试继续进行样本外测试可以提供另一层安全性。样本内、样本外后验和前验之间的正结果和良好相关性增加了系统在实际交易中表现良好的概率。

发表于 2021-06-20 00:40
阅读 ( 179 )
分类：商业金融

你可能感兴趣的文章

如何在excel中进行基础数据分析

...件。这些工具是用来做计算的，比如t检验、卡方检验、相关性等等。Excel不是用来进行数据分析的。但这并不意味着你做不到。 ...

发布于 2021-03-12 01:13
阅读 ( 474 )

双尾检验

什么是双尾检验(a two-tailed test)？在统计学中，双尾检验是一种方法，在这种方法中，分布的临界面积是双边的，检验一个样本是否大于或小于某一范围的值。它用于零假设检验和统计显著性检验。如果被测试的样本落入任何一...

发布于 2021-05-31 08:55
阅读 ( 412 )

t检验

...项研究中，可以自由改变的价值观，对于评估无效假设的重要性和有效性至关重要。这些值的计算通常取决于样本集中可用数据记录的数量。相关（或配对）t检验当样本通常由相似单位的配对组成时，或当存在重复测量的...

发布于 2021-06-04 13:19
阅读 ( 247 )

t检验(t-test)和方差分析(anova)的区别

...·费舍尔爵士才在一篇题为《孟德尔遗传假设中亲属间的相关性》的文章中提出了方差分析的形式化建议。此后，方差分析的范围和应用范围不断扩大。方差分析实际上是一个误称，因为它不是来自差异的差异，而是来自不同组...

发布于 2021-06-23 14:03
阅读 ( 447 )

假设(hypothesis)和理论(theory)的区别

...设。假设的目的是检验两个或多个现象之间的因果关系和相关性，并将其发展成一种理论。假设既不成立也不可靠。这是因为这不是一个已被证实的事实，而仅仅是一个观察，可以受到偏见和限制的观察者。发展一个假设不需要...

发布于 2021-07-07 05:56
阅读 ( 1164 )

z-检验(z-test)和p值(p-value)的区别

Z检验和P值虽然是两个统计检验，但这是两个独立的东西，前者是一个统计检验，说明一个人是否应该拒绝零假设，而后者是一个概率检验，表明有一个概率，零假设将被拒绝。Z检验(ztest) vs. P值(pvalue)Z检验和P值的区别在于，Z检...

发布于 2021-07-09 14:44
阅读 ( 2182 )

z-检验(z-test)和卡方(chi-square)的区别

Z检验和卡方检验是两种不同的统计假设检验。这两个测试都为空值假设提供了另一种观点。Z检验(ztest) vs. chisquare公司(chisquare)Z检验与卡方检验的区别在于，Z检验是检验两个总体均值的结果是否存在差异的一种统计检验。另一方...

发布于 2021-07-09 14:50
阅读 ( 1177 )

t检验(t-test)和线性回归(linear regression)的区别

...于线性回归是用来解释一条直线上一个或两个变量之间的相关性。而T检验是假设检验的工具之一，适用于斜率系数或由简单线性回归导出的回归系数。T检验是假设检验中使用的检验方法之一，而线性回归是回归分析的一种类型...

发布于 2021-07-09 15:30
阅读 ( 2248 )

t检验(t-test)和p值(p-value)的区别

在统计的世界里，计算、假设和结论占上风。在所有的检验和结果中，t检验和p值是两种最令人困惑的假设方法。而这两者是在同一个统计子集中发现的，并提供了进一步的假设度量，同时又是相互关联的。这两个测试不一样！...

发布于 2021-07-09 15:46
阅读 ( 2164 )

配对t检验(paired t-test)和非配对t检验(unpaired t-test)的区别

...式，以确保从同一主题采取两次措施的方式之间的区别的重要性。参考文献https://libguides.library.kent.edu/spss/pairedsamplesttesthttps://libguides.library.kent.edu/spss/independentttest

发布于 2021-07-09 20:14
阅读 ( 3169 )