квартили
Третьей величиной, определяющей центральную тенденцию,
является мода
(mode) — наиболее часто повторяющееся событие (или значение
данных). Мода — это
пик кривой распределения. В некоторых распределениях нет моды, а иногда есть
более чем одна мода. Как и медиана, мода в некоторых случаях может лучше всего
описывать центральную тенденцию. Мода никак не зависит от крайних случайных
значений, и ее можно рассчитать быстрее, чем среднее арифметическое или
медиану. Мы увидели, что медиана делит распределение на две равные части.
Таким же образом распределение можно разделить тремя квартилями (quartiles), чтобы
получить четыре области равного размера или вероятности, или девятью децилями (deciles), чтобы
получить десять областей равного размера или вероятности, или 99 перцентилями (percentiles) (чтобы получить 100 областей равного размера или
вероятности), 50-й
перцентиль является медианой и вместе с 25-м и 75-м перцен-тилями дает нам квартили.
И наконец, еще один термин, с которым вы должны
познакомиться, — это
квантиль
(quantile). Квантиль — это некоторое число N-1,
которое
делит общее поле данных на N равных частей. Теперь
вернемся к среднему. Мы обсудили среднее арифметическое, которое измеряет
центральную тенденцию распределения. Есть и другие виды средних, они реже
встречаются, но в определенных случаях также могут оказаться предпочтительнее.
Одно из них —
это среднее геометрическое (geometric mean), расчет которого дан в первой
главе. Среднее геометрическое является корнем степени N из произведения значений, соответствующих точкам
распределения.
N
(3.02) С = (ПД)Л(1/К),
Область больших отклонении. — Прим. ред
где G
= среднее геометрическое;
Х = значение, соответствующее
точке i;
N = общее число точек данных
в распределении.
Среднее геометрическое не может быть рассчитано, если
хотя бы одна из переменных меньше или равна нулю.
Мы знаем, что арифметическое математическое ожидание является средним
арифметическим результатом каждой игры (на основе 1 единицы) минус размер
ставки. Таким же образом можно сказать, что геометрическое математическое
ожидание является средним геометрическим результатом каждой игры (на основе 1
единицы) минус размер ставки.
Еще одним видом среднего является среднее гармоническое (harmonic mean). Это обратное значение от
среднего обратных значений точек данных.
N
(3.03) i/h =
i/nXi/xp
i=l
где Н = среднее гармоническое;
Х = значение, соответствующее
точке i;
N = общее число точек данных
в распределении.
Последней величиной, определяющей центральную
тенденцию, является среднее квадратическое (quadratic mean), или среднеквадратический корень (root mean square).
N
(3.04) RA2= 1/NXV2,
i=l
где R = среднеквадратический
корень;
Х = значение, соответствующее
точке i;
N = общее число точек данных
в распределении.
Вы должны знать, что среднее арифметическое (А) всегда
больше или равно среднему геометрическому (G),
а среднее геометрическое всегда больше или равно среднему гармоническому (Н):
(3.05) H< = G<=A,
где Н = среднее гармоническое; G
= среднее геометрическое;
А = среднее арифметическое. Моменты распределения
Центральное значение, или расположение распределения,
— первое, что надо знать о группе данных. Следующая величина, которая
представляет интерес, — это изменчивость данных, или «ширина» относительно
центрального значения. Мы назовем значение центральной тенденции первым моментом распределения. Изменчивость
точек данных относительно центральной тенденции называется вторым моментом распределения. Следовательно,
второй момент измеряет разброс распределения относительно первого момента.
Как и в случае с центральной тенденцией, существует
много способов измерения разброса. Далее мы рассмотрим семь из них, начиная с
наименее распространенных вариантов и заканчивая самыми распространенными.
Широта (range) распределения — это просто
разность между самым высоким и самым низким значением распределения. Таким же
образом широта
перцентиля 10-90 является разностью между 90-й и 10-й точками. Эти первые две величины
измеряют разброс по крайним точкам. Остальные пять измеряют отклонение от
центральной тенденции (т.е. измеряют половину разброса).
Семи-интерквартильная широта (sem-interquartile range), или квартальное отклонение (quartile deviation), равна половине расстояния
между первым и третьим квартилями (25-й и 75-й перцентили). В отличие от широты
перцентиля 10-90, здесь широта делится на два.
Полуширина (half-width)
является
наиболее распространенным способом измерения разброса. Сначала надо найти
высоту распределения в его пике (моде), затем найти точку в середине высоты и
провести через нее горизонтальную линию перпендикулярно вертикальной линии.
Горизонтальная линия пересечет кривую распределения в одной точке слева и в
одной точке справа. Расстояние между этими двумя точками называется
полушириной.
Статья размещена в рубрике: Математика управления капиталом
|