Методология тестирования модели на основе обращенного Медленного %К
Модель
выполняется со значением mode — 1 для получения набора фактов. Набор
фактов загружается в N -TRAIN — набор для разработки нейронных сетей
Scientific Consultant Services (516-696-3333), масштабируется и
перетасовывается, как это необходимо при разработке нейронной сети. Затем
обучается набор сетей, начиная с маленькой и кончая весьма большой; в основном
это простые 3-слойные сети. Также обучаются две 4-слойные сети. Все сети
тренируются до максимальной конвергентнос-ти и затем полируются для удаления
мелких отклонений или сдвигов. Процесс полировки обеспечивается снижением
интенсивности обучения до очень низкой и еще примерно 50 прогонами после
этого.
В
табл. 11-1 приводится информация о всех сетях, обучавшихся для этой модели, с
коэффициентами корреляции и другими показателями. В таблице указаны название
файла, содержащего сеть, размер — число слоев и число нейронов в каждом
из слоев, число связей в сети, оптимизированных при обучении (подобно
количеству коэффициентов регрессии при множественной регрессии и их связи с
излишней подгонкой под исторические данные), и корреляция —
множественная корреляция выхода сети с его целевым значением. Скорректированные
на излишнюю подгонку под входные данные значения корреляции занимают два
столбца: в левом — коррекция исходя из обучения на наборе в 40 000 точек
данных, в правом — исходя из 13 000 точек. Последние строки содержат реальное
количество точек данных, а также их количество, предполагаемое при
расчете коррекции.
Количество точек данных,
использованное при расчете коррекции коэффициентов корреляции, меньше, чем
реальное их количество в наборе для обучения. Причина в повторяемости фактов,
а именно в том, что факт, основанный на некоторой точке данных, с большой
вероятностью будет весьма подобен факту, основанному на соседней точке. Из-за
этого эффективное число точек данных в отношении статистически независимой
информации будет уступать реальному. Мы использовали два разных прореживания
данных, представленных в двух столбцах. Процесс коррекции корреляций подобен
процессу коррекции вероятностей множественных тестов при оптимизации: при
прогонке параметра через ряд значений полученные результаты для соседних
значений, скорее всего, будут подобны, что снижает эффективное количество
тестов по сравнению с реальным.
Результаты обучения для
модели обращенного во времени Медленного % К
Как следует из табл. 11-1,
значения некорректированной корреляции неуклонно возрастали с увеличением сети
в отношении количества связей. Если же провести коррекцию коэффициентов
корреляции, то для эффективной выборки величиной 13 000 точек картина
драматически меняется: наиболее эффективными оказываются малые 3-слойные сети с
6 нейронами в среднем слое и наименьшая из двух 4-слойных сетей. При более
умеренной коррекции ожидаемая прогностическая способность оказалась наибольшей
для двух 4-слойных сетей, как видно из множественных корреляций результата с
целью.
При
более консервативной оценке (с меньшей эффективной выборкой и, следовательно,
с большей коррекцией коэффициентов корреляции) на основе данных табл. 11 -1 для
работы в модели было выбрано две сети — сеть 18-6-1 (rm 2.net ) и сеть
18-14-4-1 (nn 8.net ). Они были признаны лучшими из сетей, способными
потенциально эффективно работать вне пределов выборки. Для теста модели входа
в рынок программа прогонялась со значением mode = 2; как обычно,
тестировались все входы — по цене открытия, по лимитному приказу и по
стоп-приказу.
Статья размещена в рубрике: Анализ входов и выходов в сделки на финансовых рынках
|