функция распределения вероятности
Когда мы берем первую сделку в отсортированной последовательности с
наименьшим стандартным значением, функция распределения вероятности (cumulative density function, далее — ФРВ) равна 1/N. Для каждого стандартного
значения, которое мы проходим, приближаясь к наибольшему стандартному значению,
к числителю прибавляется единица. В конце последовательности наша ФРВ будет
равна N/N, или 1. Для каждого
стандартного значения мы можем рассчитать теоретическое распределение.
Таким образом, мы можем сравнить фактическую функцию распределения
вероятности с любой теоретической функцией распределения вероятности.
Переменная D, или статистика К-С (К-С statistic), равна наибольшему расстоянию между значением нашей фактической
функции распределения вероятности и значением теоретического распределения ФРВ
при этом же стандартном значении. При сравнении фактической ФРВ для данного
стандартного значения с теоретической ФРВ для этого же стандартного значения мы
должны также сравнить теоретическую ФРВ предыдущего стандартного значения с
фактической ФРВ текущего стандартного значения.
Для того чтобы прояснить эту ситуацию, посмотрим на рисунок 4-1.
Отметьте. что в точке А фактическая кривая находится выше теоретической.
Поэтому мы сравниваем текущее значение фактической ФРВ с текущим теоретическим значением
для нахождения наибольшей разности. Однако в точке В фактическая кривая
находится ниже теоретической. Поэтому мы сравниваем предыдущее фактическое
значение с текущим теоретическим значением. Идея состоит в том, что в
результате мы выберем наибольшую разность.
Для каждого стандартного значения нам надо взять абсолютное значение
разности между текущим значением фактической ФРВ и текущим значением
теоретической ФРВ. Нам также надо взять абсолютное значение разности между
предыдущим значением фактической ФРВ и текущим значением теоретической ФРВ.
Повторив эту операцию для всех стандартных значений точек, где фактическая ФРВ
делает скачок вверх на 1/N, и взяв наибольшую разность,
мы определим переменную D.
Чем ниже значение D,
тем
больше похожи два распределения. Мы можем преобразовать значение D в уровень значимости с помощью следующей формулы:
(4.01) SIG= X (J%2) * 4-2 * ЕХР(-2 * J А 2 * (N А (1/2) * D) Л 2),
где SIG
= уровень
значимости для данного D и N;
D = статистика К-С;
N = количество сделок, по которым
определена статистика К-С;
% = оператор, означающий остаток
после деления. Здесь J%2 дает остаток после деления J на 2;
ЕХР() = экспоненциальная функция.
Нет необходимости суммировать значения J от 1 до бесконечности. Уравнение сходится (обычно очень
быстро) к определенному значению. После того как предел достигнут (согласно
допуску, установленному пользователем), нет необходимости продолжать
суммирование значений.
Рассмотрим уравнение (4.01) на примере. Допустим, у нас есть 100 сделок, а значение статистики
К-С равно 0,04:
J1
= (1 % 2) * 4 - 2 * ЕХР(-2
* 1Л2 * (100л(1/2) * 0,04) л 2) =1*4-2* ЕХР(-2
* Л 2 * (10 * 0,04)л 2) = 2 * ЕХР(-2
* * 0,л 2) = 2*ЕХР(-2*1*0,16)
= 2 * ЕХР(-0,32) = 2 * 0,726149 =
1,452298
Таким образом, нашим первым значением является 1,452298. Теперь прибавим следующее
значение:
J2 = (2 % 2) * 4 - 2 * ЕХР(-2
* 2л 2 * (100л (1/2) * 0,04)Л2) =0*4-2* ЕХР(-2
* 2л 2 * (10 * 0,04)л 2) = -2 * ЕХР(-2
* 2л 2 * 0,4л 2) = -2*ЕХР(-2*4*0,16)
= -2*ЕХР(-1,28)
= -2 * 0,2780373 = -0,5560746
Прибавив -0,5560746 к нашей текущей сумме 1,452298, мы получим новую текущую
сумму 0,8962234.
Затем
снова увеличим J на 1, теперь оно будет равно 3, и решим уравнение.
Получившееся значение прибавим к текущей сумме 0,8962234. Следует поступать таким
образом и дальше, пока текущая сумма в пределах допуска не перестанет
изменяться.
В нашем примере предельное значение будет равно 0,997. Этот ответ означает, что при 100 сделках и значении статистики
К-С 0,04 мы можем быть уверены на 99,7%, что фактическое распределение
генерировано функцией теоретического распределения. Другими словами, мы можем
быть на 99,7%
уверены,
что функция теоретического распределения представляет фактическое
распределение. В данном случае это очень хороший уровень значимости.
Статья размещена в рубрике: Математика управления капиталом
|