серийная зависимость
При проведении проверки по критерию Стьюдента исходят из
предположения, что данные соответствуют нормальному распределению. В реальности
распределение показателей прибылей и убытков торговой системы таким не бывает,
особенно при наличии защитных остановок и целевых прибылей, как показано на
рис. 4- 1. Дело в том, что прибыль выше, чем целевая, возникает редко.
Фактически большинство прибыльных сделок будут иметь прибыль, близкую к
целевой. С другой стороны, кое- какие сделки закроются с убытком,
соответствующим уровню защитной остановки, а между ними будут разбросаны другие
сделки, с прибылью, зависящей от методики выхода. Следовательно, это будет
совсем непохоже на колоколообразную кривую, которая описывает нормальное
распределение. Это составляет нарушение правил, лежащих в основе проверки по
критерию Стьюдента. Впрочем, в данном случае спасает так называемая центральная
предельная теорема: с ростом числа точек данных в выборке распределение
стремится к нормальному. Если размер выборки составит 10, то ошибки будут
небольшими; если же их будет 20 — 30, ошибки будут иметь исчезающе малое
значение для статистических заключений. Следовательно, многие виды
статистического анализа можно с уверенностью применять при адекватном размере
выборки, например при n = 47 и выше, не опасаясь за достоверность заключений.
Что, если существует серийная зависимость? Более серьезным
нарушением, способным сделать неправомочным вышеописанное применение проверки
по критерию Стьюдента, является серийная зависимость — случай, когда данные в
выборке не являются независимыми друг от друга. Сделки совершаются в виде
временного ряда. Последовательность сделок, совершенных в течение некоторого
периода времени, нельзя назвать случайной выборкой — подлинно случайная выборка
состояла бы, например, из 100 сделок, выбранных случайным образом из всей
популяции данных — от начала рынка (например, 1983 г. для S&P 500) до
отдаленного будущего. Такая выборка не только была бы защищена от серийной
зависимости, но и являлась бы более представительной для популяции.
Однако при разработке торговых систем выборка сделок обычно
производится на ограниченном временном отрезке; следовательно, может
наблюдаться корреляция каждой сделки с соседними, что сделает данные
зависимыми.
Практический эффект этого явления состоит в уменьшении
размеров выборки. Если между данными существует серийная зависимость, то, делая
статистические выводы, следует считать, что выборка в два или в четыре раза
меньше реального количества точек данных. Вдобавок определить достоверным
образом степень зависимости данных невозможно, можно только сделать грубую
оценку — например, рассчитав серийную корреляцию точки данных с предшествующей
и предыдущей точками.
Статья размещена в рубрике: Виды торговых систем
|