оценка коррекции коэффициента корреляции
Как и в случае с регрессией, при разработке нейронной сети
можно произвести оценку коррекции коэффициента корреляции (т.е. показателя,
обратного генерализации). Фактически, нейронная сеть представляет собой систему
уравнений множественной регрессии, хотя и нелинейных, и корреляция
выходныхзначений сети может рассматриваться как множественный коэффициент
корреляции. Множественная корреляция между выходными и целевыми значениями
может быть скорректирована для прогнозирования поведения системы на данных вне
выборки. Такая скорректированная множественная корреляция должна постоянно
использоваться для определения того, является ли эффективность нейронной сети
случайной или она вызвана обнаружением реальной закономерности в ценовом
поведении рынка. Формула коррекции коэффициента множественной корреляции
приведена ниже:
RC
= SQRT (1.0 - ( (N - 1.0) / (N - Р) ) * (1.0 - R*R) )
Формула приведена в стиле языка FORTRAN.
Здесь SORT означает квадратный корень;
N — количество точек данных или фактов в случае нейронной
сети;
Р— количество коэффициентов регрессии или (в случае
нейронной сети) весов связей;
R — некорректированную множественную корреляцию;
RC — скорректированную корреляцию.
Хотя эта формула строго приложима только к линейной
множественной регрессии (для которой, собственно, и разрабатывалась), она неплохо
работает с нейронными сетями и может быть использована для того, чтобы оценить,
какая часть эффективности системы обусловлена вредной подгонкой на данном
образце. Эта формула описывает связь между размером выборки, количеством
параметров и снижением эффективности результатов. Статистическая коррекция,
рассчитываемая по данной формуле, будет использована в главе о входах систем на
нейронных сетях.
РАЗМЕР ВЫБОРКИ И
РЕПРЕЗЕНТАТИВНОСТЬ
Хотя из статистических соображений разработчику следует
искать самые большие из возможных выборки данных, при работе с финансовыми
рынками между размером и представительностью образца существуют неоднозначные
связи. Большие выборки означают, что данные уходят назад, в такие периоды
времени, когда рынок был фундаментально иным — вспомните S&P 500 в 1983 г.!
Это означает, что в некоторых случаях больший образец данных может быть менее
представительным или включать смесь из нескольких различных популяций данных!
Следовательно, нельзя забывать, что хотя цель — максимальный размер выборки,
столь же важно, чтобы данные отображали тот рынок, который система должна
прогнозировать.
СТАТИСТИЧЕСКАЯ
ОЦЕНКА СИСТЕМЫ
Разобравшись с некоторыми основными положениями, рассмотрим
применение статистики при разработке и оценке торговых систем. Примеры,
приведенные ниже, основаны на системе, которая была оптимизирована на некоторой
выборке данных и затем тестировалась вне пределов выборки. Оценка на данных вне
пределов выборки будет рассмотрена перед оценкой на основе выборки, поскольку
ее статистический анализ проще (и аналогичен анализу неоптимизированной
системы), в
DefineDLLFunc:"SCSIWA.DLL",LONG,"SA_MoonPhaseDate",LONG,LONG;
Inputs:
Ll(0);
Vars:
FullMoonDate(O) , NewMoonDate(0) , Trend(O);
{ Функция возвращает дату следующей полной или новой луны
)
FullMoonDate
= SA_MoonPhaseDate (Date[5], 2);
NewMoonDate
= SA_MoonPhaseDate (Date[5], 0) ;
Value1
= 0;
If
(Date < FullMoonDate) And (Date Tomorrow >= FullMoonDate)
Then Valuel = 1; (Полная луна сегодня вечером или
завтра)
Value2
= 0;
If
(Date < NewMoonDate) And (Date Tomorrow >= NewMoonDate)
Then Value2 = 1; {Новая луна сегодня вечером или завтра]
If
Valuel[L1] > 0 Then Buy At Market;
If
Value2[L1] > 0 Then Sell At Market;
Статья размещена в рубрике: Анализ входов и выходов в сделки на финансовых рынках
|