большой набор свободных параметров
Излишне большой набор свободных параметров или правил
влияет на попытку оптимизации так же, как и недостаточное количество точек
данных. Когда количество элементов, подвергающихся оптимизации, повышается,
пропорционально растет способность модели подгонять их под любые неоднородности
тестовой выборки, а следовательно, увеличивается вклад артефактов в
эффективность модели. Результат оптимизации большого количества параметров или
правил будет хорошо работать на тестовых данных, но плохо на данных вне выборки
и в реальной торговле.
Важно учитывать не общее количество параметров оптимизации,
а отношение количества этих параметров к объему данных. Здесь также
эвристически достоверна описанная выше формула для малых выборок:
она показывает, как соотношение числа точек данных и
параметров системы влияет на результат. При наличии избыточного количества
параметров решение, полученное в результате оптимизации, будет оптимальным
только для тестовой выборки данных.
Отсутствие
подтверждения
Один из лучших способов попасть в беду — не проверить
результаты при помощи тестов на данных, взятых вне оптимизационной выборки. Без
такого подтверждения ошибочные решения, вызванные недостаточной выборкой или
избытком параметров, не говоря уж о менее ясных причинах, будут не замечены
вовремя. Торговая система, дающая на некотором образце данных высокие
результаты, будет применена к реальной торговле, и в результате вы понесете
тяжелые убытки. Трейдер, разрабатывающий системы без проверки на данных вне
выборки, похож на пилота, управляющего неизвестной ему моделью самолета с
завязанными глазами.
КАК ДОСТИЧЬ
УСПЕХА ПРИ ОПТИМИЗАЦИИ
Во избежании провала и для увеличения вероятности успеха при
оптимизации следует предпринять четыре шага. Во- первых, оптимизировать систему
на максимально доступном представительном образце данных и использовать для
анализа большое число виртуальных сделок. Во- вторых, использовать небольшое
количество параметров (особенно с учетом размера выборки данных). В- третьих,
провести тестирование на данных вне выборки, т.е. на данных, которые вы не
использовали при оптимизации и, более того, не видели в глаза. В- четвертых,
стоит провести оценку статистической значимости результатов.
Статья размещена в рубрике: Торговые системы
|