Оценка тестов на данных в пределах выборки
Каким образом можно оценивать систему, которая подвергалась
подгонке параметров (т.е. оптимизации) по некоторой выборке данных? Трейдеры
часто оптимизируют системы для улучшения результатов. В данном аспекте
применение статистики особенно важно, поскольку позволяет анализировать
результаты, компенсируя этим большое количество тестовых прогонов во время
оптимизации. В табл. 4- 2 приведены показатели прибыли/убытка и различные
статистические показатели для тестов в пределах выборки (т.е. на данных, использовавшихся
для оптимизации системы). Система подвергалась оптимизации на данных за период
с 1.01.1990г. по 1.02.1995г.
Большая часть статистики в табл. 4- 2 идентична
показателями табл. 4- 1 из примера 1. Добавлены два дополнительных показателя —
Количество тестов оптимизации и Скорректировано по оптимизации. Первый
показатель — просто количество различных комбинаций параметров, т.е. число
испытаний системы по выборке данных с различными параметрами. Поскольку первый
параметр системы на лунном цикле, L1, принимал значения от 1 до 20 с шагом в 1,
было проведено 20 тестов и соответственно получено 20 значений t- критерия.
Количество тестов, использованных для коррекции вероятности
(значимости) по лучшему показателю t- критерия, определяется следующим образом:
от 1 отнимается статистическая значимость лучшего теста, результат возводится в
степень m (где т— число прогонок тестов). Затем этот результат вычитается из
единицы. Это показывает вероятность обнаружения в т тестах (в данном случае т =
20) по крайней мере одного значения t- критерия, как минимум не уступающего
действительно обнаруженному в данном решении. Некорректированная вероятность
случайного происхождения результатов составляет менее 2% — весьма впечатляющий
показатель. После коррекции по множественным тестам (оптимизации) картина в
корне меняется. Результаты с такой прибыльностью системы могли быть достигнуты
чисто случайно в 31% случаев! Впрочем, все не так плохо. Настройка была крайне
консервативной и исходила из полной независимости тестов друг от друга. На
самом же деле между тестами будет идти значительная серийная корреляция,
поскольку в большинстве традиционных систем небольшие изменения параметров
вызывают небольшие изменения результатов. Это в точности напоминает серийную
зависимость в выборках данных: эффективный размер снижается, если снижается
эффективное количество проведенных тестов. Поскольку многие из тестов
коррелируют друг с другом, 20 проведенных соответствуют 5—10 реальным
независимым тестам. Учитывая серийную зависимость между тестами, вероятность с
поправкой на оптимизацию составит около 0,15, а не 0,3104. Поскольку природа и
точная величина серийной зависимости тестов неизвестны, менее консервативное
заключение об оптимизации не может быть рассчитано напрямую, а только может быть
примерно оценено.
В некоторых случаях, например в моделях множественной
регрессии, существуют точные математические формулы для расчета статистических
параметров с учетом процесса подгонки (оптимизации), что делает излишними
поправки на оптимизацию.
Статья размещена в рубрике: Анализ входов и выходов в сделки на финансовых рынках
|